1、 修改字典格式,提高字典加载速度 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来 3、 增加词频判断功能,在无法取舍时根据词频取舍 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst 5、 增加中文人名前后缀统计和根据该统计定位人名的功能 6、 增加中文人名和未登录词出现频率统计功能 7、 增加自动更新字典功能,对超过阈值的人名和未登录词自动插入字典 需打开 AutoInsertUnknownWords 开关 并设置 UnknownWordsThreshold,(不推荐自动插入,推荐手工插入) 8、 增加定期保存字典和统计结果功能 需设置 AutoSaveInterval 9、 增加KTDictSeg.xml配置文件来配置分词参数 10、增加对Lucene.net 的支持,提供 KTDictSegAnalyzer 分析器给Lucene.net 11、增加字典管理功能,可以添加删除修改字典 12、字典管理中提供从未登录词中批量插入字典功能,可帮助使用者手工选择合适的未登录词插入字典(推荐) 13、提供一个新闻搜索的简单例子,采用Lucene.net+KTDictSegAnalyzer+KTDictSeg,项目名为Demo.KTDictSegAnalyzer 14、将所有ArrayList 改为List<> 其中 src_V1.3.01是源码 rel_V1.3.01 包含所有的可执行文件,配置文件;Data目录下是词库,停用词表,以及我目前统计的人名前后缀词表;News 目录下是Lucene.net为 新闻搜索的例子建的索引。 News.zip 是上图中批量插入时要输入的XML文件,它包含3万条从新浪和中华网抓下来的过时的新闻,大约2000万字左右,可供各位朋友学习使用。 注意:如果要导入news.xml,这个文件必须要和Demo.KTDictSegAnalyzer.exe放在同一个目录下!
2023-09-11 06:09:00 3.04MB C# 盘古分词 KTDictSeg 张勇涛
1
猎兔Lucene.NET中文分词源码seg_src.rar,权威代码,绝对优秀
2022-11-16 10:26:42 2.62MB lucene .net 中文分词 源码
1
做全文搜索引擎lucene.net包的完整dll,包括:App_Licenses.dll、DictSeg.dll、FredCK.FCKeditorV2.dll、FreeTextBox.dll、FTAlgorithm.dll、FTAlgorithm.pdb、Highlighter.Net.dll、Lucene.China.dll、Lucene.Net.Analysis.Cn.dll、Lucene.Net.dll。已经通过调试和开发。
2022-06-12 15:16:51 373KB Lucene.net包 Lucene.Net DictSeg
1
PanGu_SourceCode_V2.3.1.0 盘古分词源码下载
2022-03-31 11:44:34 3.92MB PanGu 盘古分词
1
这是Pangu分词,可以很清楚的看到分词效果,协助创建索引中文分词效果,还可以进行字典管理,打开release里面的demo.exe直接可以用,字典都在里面
2022-03-31 11:26:36 1.25MB Lucene.net 盘古分词 字典管理
1
盘古分词是个不错的中文分词c#库 这个例子演示多线程的使用方式
2022-03-31 08:44:10 955KB c# 分词
1
最新逆向最大匹配分词算法 盘古分词 分词算法 中文分词 源码
2022-03-23 22:21:30 1.15MB 最大匹配 分词算法 盘古分词 分词算法
1
智周个人知识库--全文检索及标注系统 这是一个利用 lucene.net 技术开发的程序。用于查询个人计算机中的文件信息,包含了全文检索及标注系统。 随着计算机中文件的累积,常会有查找不易的问题。 解决方法1:”全文搜索”。快速定位。 解决方法2:”插入标注”。在文章的内部,插入标记,后续即可专门搜寻标记中信息,精准定位。 实现将计算机,打造为你的个人知识库。
2022-03-03 20:58:06 56.66MB 全文检索 lucene.net 个人知识库
1
这是用Lucene.NET结合Sql建立全文检索Demo的源码,适合初学者学习Lucene,其中包含所需的DLL文件。
2022-01-24 15:45:52 3.08MB Lucene .NET Sql 全文检索
1
对初学使用dotlucent作站内检索的比较有帮助。 利用dotlucene为网站做的索引文件的应用程序。 数据库源是SQL Server,项目是用VS.NET2008开发的。 应用程序界面可以配置数据库链接,生成报告,定时执行增量索引,对单条索引进行更新操作。
2022-01-24 15:18:56 650KB Lucene.net dotlucent 索引
1