我们都知道对大规模数据进行复杂的数据分析通常需要耗费大量的时间,这时就需要我们的数据消减技术了。 数据消减技术的主要目的就是从原有巨大数据集中获得一个精简的数据集,并使这一精简数据集保持原有数据集的完整性。这样在精简数据集上进行数据挖掘就会提高效率,并且能够保证挖掘出来的结果与使用原有数据集所获得的结果基本相同。 数据消减的主要策略有以下几种。 名称 说明 数据立方合计 这类合计操作主要用于构造数据立方(数据仓库操作)。 维数消减 主要用于检测和消除无关、弱相关,或冗余的属性或维(数据仓库中属性)。 数据压缩 利用编码技术压缩数据集的大小。 数据块消
2023-01-12 19:24:19 189KB 大数据 层次模型 数据
1
人工智能:基于Pandas的数据预处理技术_源代码 1. 本次实验以california_housing加州房价数据集为例,下载数据集 2. 查看数据集的描述、特征及目标数据名称、数据条数、特征数量 3. 将数据读入pandas的DataFrame并转存到csv文件 4. 查看数据集各个特征的类型以及是否有空值 5. 对数据集做中心化度量:计算各个特征的中位数和均值,分析中位数和均值情况 6. 对数据集做离散化度量:对第一个特征(收入中位数)画盒图(箱线图),检查孤立点(离群点)并进行分析 7. 【选做】对所有特征画盒图(箱线图),检查孤立点(离群点)并进行分析 8. 对第一个特征(收入中位数)排序后画散点图 9. 对第一个特征(收入中位数)画分位数图并分析 10. 【选做】对所有特征画分位数图并进行分析 11. 使用散点图、使用线性回归方法拟合第一个特征(收入中位数)并分析 12. 【选做】使用局部回归(Loess)曲线(用一条曲线拟合散点图)方法拟合第一个特征(收入中位数)数据 13. 对第一个特征(收入中位数)画分位数-分位数图并分析 等等
2022-12-23 16:26:46 134KB 人工智能 数据处理
1
本科生的实验报告,大神们有需要的自取。
2022-12-21 19:23:14 2.46MB 大数据
1
Python数据挖掘 数据预处理案例(以航空公司数据为例)源代码+文件 完美解决复制代码后出现的空格问题,以及程序不能执行问题。
1
文字分类系统 系统的介绍如何构建一个完整的文本分类系统,包括数据预处理,主要方法的原理介绍和实现细节,实验结果与分析,网页演示的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏: :
2022-12-12 21:42:24 6.42MB 系统开源
1
信道状态信息数据数据采集及预处理代码,可以载WIN和LINUX下对信道状态信息数据数据进行采集和处理,并绘制出原始的信道状态信息数据数据
1
GFZRNX 常用的文件编辑命令 GFZRNX 配置及格式相关功能的使用 GFZRNX 文件头信息编辑功能详解 GFZRNX_1.05_User_Guide.pdf gfzrnx_win64.exe
2022-10-28 13:31:16 3.36MB GFZRNX rinex文件处理
1
Matlab学习系列012.数据预处理1剔除异常值及平滑处理.doc
2022-10-27 23:28:16 200KB 互联网
1
基于MATLAB光谱数据预处理.rar
2022-09-23 15:41:29 11KB MATLAB
1
teqc与gfzrnx是GPS常用的数据预处理与数据分析工具,附有两工具的说明文档。
2022-09-20 14:35:12 4.7MB teqc gfzrnx 数据预处理 GPS
1