基于CNN的中文文本分类算法(可应用于垃圾邮件过滤、情感分析等场景)
2024-04-14 09:54:07 13.33MB
1
中文文本分类语料库
2023-03-04 20:51:30 113.53MB 中文文本分类
1
适用于中文中长文本分类 原始数据集和已经划分的数据集已给出 划分的数据集经过数据预处理,删除了其中的重复文本,以及文本长度小于50的句子,最终构造的平衡语料 训练集 5800 测试集 1000条 验证集1000 (正负评论各站一半)
1
复旦大学中文文本分类训练集和测试集 文件太大压缩为了zip格式。 all文件夹为复旦大学中文文本分类语料集, test_corpus为该语料集中挑选部分划分出来的, train_corpus为该语料集中挑选test_corpus后剩余部分划分出来的。 下载以后可以按照自己的要求指定比例划分训练集和测试集,也可以按照本文档的划分方法。
1
NLP实战之中文文本分类
2022-08-08 09:06:40 8.75MB NLP
1
中文文本分类语料-测试集下载 是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。
2022-07-21 10:16:29 52.72MB 大数据 文本分析 文本训练 机器学习
1
Bert-Chinese-Text-Classification-Pytorch LICENSE 中文文本分类,Bert,ERNIE,基于pytorch,开箱即用。 介绍 模型介绍、数据流动过程:还没写完,写好之后再贴博客地址。 工作忙,懒得写了,类似文章有很多。 机器:一块2080Ti , 训练时间:30分钟。 环境 python 3.7 pytorch 1.1 tqdm sklearn tensorboardX pytorch_pretrained_bert(预训练代码也上传了, 不需要这个库了)
2022-07-09 11:07:18 6.11MB 深度学习 Bert Ernie 中文文本分类
用朴素贝叶斯分类算法做中文文本分类-附件资源
2022-06-10 09:03:29 23B
1
人工智能-项目实践-文本分类-CNN-RNN中文文本分类,基于TensorFlow 使用卷积神经网络以及循环神经网络进行中文文本分类 CNN做句子分类的论文可以参看: Convolutional Neural Networks for Sentence Classification 以及字符级CNN的论文:Character-level Convolutional Networks for Text Classification 本文是基于TensorFlow在中文数据集上的简化实现,使用了字符级CNN和RNN对中文文本进行分类,达到了较好的效果。 文中所使用的Conv1D与论文中有些不同,详细参考官方文档:tf.nn.conv1d
2022-05-13 09:08:46 410KB 文档资料 cnn rnn tensorflow