世界气候 ClimateChange.xlsx
2023-03-06 23:46:40 1.55MB 数据集
1
笔者在给同事培训“数据预处理”专题时使用的ppt,共3讲。分别是: 数据预处理1_总体介绍_标准化与正则化 数据预处理2_缺失值处理 数据预处理3_降维处理 主要内容是对数据预处理的框架式总结,来源均来自互联网(如有侵权请评论告知,谢谢)。
1
内容索引:VC/C++源码,图形处理,数字识别  VC++基于神经网络的数字图片识别技术,并可对图片进行灰度处理、二值化、递推锐化、去离噪声、字符分隔等处理功能,调试时请将在Debug目录中生成的EXE文件拷贝至Release目录里运行,因为那里有测试图片。
1
对下载的IMDB数据集中的test和train分别进行预处理从而方便后续模型训练,代码为PreProcess.py。预处理主要包括:大小写转化、特殊字符处理、stopwords过滤、分词,最后将处理后的数据存储为CSV格式,以方便后续调试。借用了nltk的 stopwords 集,用来将像 i, you, is 之类的对分类效果基本没影响但出现频率比较高的词,从训练集中清除。
2023-03-01 16:29:27 1KB pytorch RNN lstm 情感分类
1
matlab红外光谱预处理,MSC,SG平滑等多种预处理算法,matlab代码
2023-02-27 13:21:24 11.82MB 红外光谱 预处理 matlab
1
matlab心电图程序代码基于呼吸暂停-心电图的OSA检测代码 该项目包括用于呼吸暂停ECG的预处理方法和用于每段OSA检测的LSTM-RNN模型。 介绍 如果要使用此程序,应首先下载Apnea-ecg数据库。 在这里,我们提供了一个下载链接,代码为:8fuq。 用法 然后,按照以下步骤操作,您将获得OSA检测模型。 在python中使用matlab函数。 遵循官方文件。 运行preprocessOfApneaECG.mit2Segments.py 。 此python文件将Apnea-ECG数据库转换为每分钟的ECG段,包括训练集(a01-a20,b01-b05,c01-c10)和测试集(x01-x35)。 不要忘记在mit2Segments.py中设置路径信息。 运行preprocessOfApneaECG.preProcessing.py 。 该python文件处理每分钟的ECG片段,包括ECG去噪,从ECG提取RRI,RAMP和EDR信号,在RRI和RAMP上进行平滑和样条插值以及对EDR信号进行下采样。 此外,我们根据RRI将这些细分分为两种:噪声和清晰。 运行produceD
2023-02-25 22:07:26 363.93MB 系统开源
1
认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。
1
功能磁共振成像 fMRIflows是完全自主的单变量和多变量fMRI处理管道的集合。 这包括解剖和功能上的预处理,信号混杂的估计以及在受试者和小组水平上的单变量和多变量分析。 显而易见, fMRIflows受到和其他开源项目的极大启发,并从它们的思想和解决方案中大力借鉴。 但是尽管可以被描述为“玻璃”盒子软件,但fMRIflows更像是鞋盒。 易于打开,易于理解,内部简单易用,可轻松更换和更改内部组件。 这完全是由于fMRIflows所有源代码都存储在笔记本中。 如果您正在出版物中使用fMRIflows ,请与作者 fMRIflows联系,以获取有关如何引用此工具箱的更多信息,因为该出版物目前正在准备提交。 安装及使用 使用容器 使用fMRIflows的最佳方法是直接在相应的容器( 或 )中运行它。 可以使用docker pull miykael/fmriflows命令从Docker
2023-02-20 05:20:22 18.71MB python neuroimaging fmri bids
1
该课题要求爬取目标网站:https://www.51job.com中,输入关键字后工作岗位的基本信息如岗位名字、岗位薪资、base地、福利、岗位要求、岗位需求公司、发布日期、公司所属行业、公司性质、招聘岗位简介、公司简介等,爬取过程中需要注意网页反爬机制。 (1)编写代码,模仿浏览器人为操作,通过关键字爬取人才网的职位信息; (2)将爬取到的网页信息进行信息预处理、清洗等。 (3)将处理完的数据存储在Mysql数据库中,数据库名为job,或者数据存储在名为job的Excel表格或名为job的记事本文件中。 (4)用数据可视化处理数据,生成岗位在地图上面的热力图、热门地区岗位薪资待遇柱状图、热门地区岗位招聘个数折线图以及以招聘地区出现次数的云图,从而反馈出岗位的热门地区以及薪资待遇。 (5)设计对抓取数据的备份还原机制,确保数据安全。
2023-02-02 16:45:36 3.63MB python 爬虫
1
我们都知道对大规模数据进行复杂的数据分析通常需要耗费大量的时间,这时就需要我们的数据消减技术了。 数据消减技术的主要目的就是从原有巨大数据集中获得一个精简的数据集,并使这一精简数据集保持原有数据集的完整性。这样在精简数据集上进行数据挖掘就会提高效率,并且能够保证挖掘出来的结果与使用原有数据集所获得的结果基本相同。 数据消减的主要策略有以下几种。 名称 说明 数据立方合计 这类合计操作主要用于构造数据立方(数据仓库操作)。 维数消减 主要用于检测和消除无关、弱相关,或冗余的属性或维(数据仓库中属性)。 数据压缩 利用编码技术压缩数据集的大小。 数据块消
2023-01-12 19:24:19 189KB 大数据 层次模型 数据
1