中文分词词库,中文词库20万(19万6千),自己整理的,用于做中文分词,根据一段话,或者一篇文章进行拆词都可以使用的上。
2023-05-11 22:56:04 2.22MB 中文词库 中文分词 分词词库
1
零售商品分词或数据分析的语料库,如商品品牌
2023-02-16 15:05:29 37KB 语料 分词 商品分词库
1
中文分词 综合词库 更新至2014-03-11
2022-07-17 23:31:57 3.58MB 中文分词 词库
1
这是最新的google分词词库,你可以用来写自己的程序
2022-06-13 09:25:32 1.64MB Google 分词 词库
1
中文医学分词词典,结合了网上的资源以及清华的医学分词词库,然后进行去重之后得到的42万个词语组成的医学分词词库,虽然其中含有人名公司名等,但是并不影响具体的使用,本人已经用于具体的业务,确定是没有什么大问题的,中文医学领域的分词效果还不错的。
1
ik中文分词词库35万中文分词词库(含电商)
1
THUOCL:清华大学开放中文词库 IT 16000条 2016-12-24 download 财经 3830条 2016-12-24 download 成语 8519条 2016-12-24 download 地名 44805条 2017-06-01 download 历史名人 13658条 2016-12-24 download 诗词 13703条 2017-01-20 download 医学 18749条 2017-01-20 download 饮食 8974条 2017-04-20 download 法律 9896条 2017-04-28 download 汽车 1752条 2017-05-15 download 动物 17287条 2017-06-01 download 完整
2022-03-18 16:20:55 1.13MB 分词词库 清华大学分词 THUOCL
1
多个词库的去重整理,28万超全词库,excel表整理完毕,留有词性分辨栏,可自行处理。 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT
2021-12-30 10:42:03 3.62MB 分词 词库
1
coreseek/sphinx分词词库txt版本(中日韩)
1
文件内包含 jieba 百度60万+分词词库(带词性权重和不带词性权重的文件各一份),附带停用词词库,词性和权重由机器学习等技术手段生成,持续优化中,欢迎私信提供宝贵意见。
2021-12-27 16:04:54 5.78MB python nlp jieba 分词