搜索【nlpcc-2016】的结果

NLPCC-WordSeg-Weibo:NLPCC 2016 微博分词评测项目

NLPCC2016-WordSeg-微博 NLPCC 2016微博分词评估项目 ##任务说明单词是自然语言理解的基本单元。但是，中文句子由连续的汉字组成，没有自然的分隔符。因此，中文分词已成为中文自然语言处理的首要任务，它可以识别句子中单词的顺序并标记单词之间的边界。与流行的二手新闻数据集不同，我们使用了来自新浪微博的更多非正式文章。培训和测试数据包含来自各个主题的微博，例如金融，体育，娱乐等。每个参与者都可以提交三个运行：封闭式运行，半开放式运行和开放式运行。在封闭的轨道上，参与者只能使用在提供的培训数据中找到的信息。排除了诸如从外部获得的字数，部分语音信息或姓名列表之类的信息。在半公开赛道中，除了提供的训练数据之外，参与者还可以使用从提供的背景数据中提取的信息。排除了诸如从外部获得的字数，部分语音信息或姓名列表之类的信息。在公开赛道上，参与者可以使用应该

2023-05-19 16:45:49 18.77MB natural-language-processing chinese-word-segmentation nlpcc-2016 Python

个人信息

热门下载

最新下载

其他资源