中文停用词 停用词表 停用词 中文信息处理
1
依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。该文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统。该系统针对中文依存关系树,采用有效的剪枝算法和特征,使用最大熵分类器进行语义角色的识别和分类。系统使用了两种不同的语料,一种是由标准短语结构句法分析(CTB5.0)转换而来,另一种是CoNLL2009公布的中文语料。系统分别在两种语料的标准谓词和自动谓词的基础上进行实验,在标准谓词上取得的F1值分别为84.30%和81.68%,在自动谓词上的F1值为81.02%和81.33%。
1
实现了中文信息处理的分词过程 点击exe文件直接运行
2022-03-23 22:05:16 459KB 分词 中文信息处理
1
1. 使用任意方法实现任一类中文名实体识别; 2. 给定足够规模的测试文本,在其上标注至少100个实体识别结果(以附件形式提供); 3. 计算出实体识别的准确率和召回率,并给出计算依据; 4. 针对识别结果中存在的问题给出具体分析;
2022-03-10 10:53:36 343KB 实体名识别 哈工大 中文信息处理
1
大詹卫东老师的“中文信息处理基础”的课件及相关代码
2021-12-12 15:15:46 20.22MB 正向最长匹配
1
中文分词的整套资源,中文信息处理基础、字符串分析、字频分析、最大匹配法、正逆向、等等,最全最齐的资源,还带有课件
2021-10-17 19:03:06 20.21MB 中文分词 C++ 自然语言
1
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
1
宋代官方字典的数码版本,用注音和与今天的音对照表。
2021-09-03 21:49:11 21.38MB 中文信息处理
1
运用正向最大匹配算法进行分析,同时也实现了逆向最大匹配,内有分词词典。
1
基于依存句法分析的中文文本相似度计算研究,赵白玉,彭黎,中文文本相似度的计算在中文信息处理中起着极为重要的作用,在很多领域都有着广泛的应用前景。本文在改进了基于语义依存的汉语句
2021-05-03 20:22:04 213KB 中文信息处理
1