中文分词: 自然语言理解和处理,是人工智能的重要的研究领域之一,是语言学、逻辑学、生理学、心理学、计算机科学和数学等相关学科发展和结合而形成的一门交叉学科。 分词作为搜索引擎的一项核心功能,和存储和查询有重大关系。但是不同的研究角度,不同的研究方向,带来研究重点和研究结果都是不一样的。 语言学方向研究的分词算法,看重分词的准确性,不看重运算速度;而搜索引擎的分次算法,特别看重分词速度,分词准确性中等。 (五)全文检索系统和搜索引擎关系: 1、搜索引擎技术来源于全文检索系统,搜索引擎是全文检索技术最重要的一个运用. 2、搜索引擎在数据总量,最大并发处理能力,单次查询速度方面,都远远强大于全文检索系统. 3、搜索引擎为了最求最高的查询速度,在搜索结果准确性及搜索结果重现方面,都弱于全文检索系统.
2022-12-02 19:52:14 1.26MB 中文分词 Cache Server 爬虫
1
中文分词
2022-11-29 22:30:35 6.87MB 中文分词
1
中文分词词典。按照长度分成2/3/4/5四个文件,剔除稀有冷门的词,适合常规的项目开发使用。本人项目中就在使用。好用不贵!
2022-11-29 11:42:33 1.97MB 词典 字典
1
最新中文分词工具jar包,使用方便,分词准确,中文分析的一个不错的包
2022-11-26 17:57:58 21.35MB 中文分词
1
猎兔Lucene.NET中文分词源码seg_src.rar,权威代码,绝对优秀
2022-11-16 10:26:42 2.62MB lucene .net 中文分词 源码
1
1.注释非常详尽,几乎每个函数都有注释,在CUDA11与VS2019下实现,并行加速效果十分显著! 2.同时实现了CPU多线程并行计算和CUDA并行计算两个版本,可以通过宏来选择
2022-11-15 17:27:07 1.42MB 中文分词 C++ cuda 多线程
1
西电 Python大作业 中文分词 生成词云
2022-11-09 15:21:06 2.06MB 西电 python 中文分词 词云
1
对输入的汉字进行拆分,可实现类似百度分词搜索
2022-11-03 17:38:28 1013KB 中文分词 ChineseTokenizer.dll C# Winform
1
IKAnalyzer 分词器支持中文分词多元分词
2022-10-03 21:39:08 5.7MB IKAnalyzer
1
人民日报统计出来的用于自然语言处理的中文词典
2022-10-02 19:02:52 626KB 自然语言处理 词性标注 中文分词
1