展会信息港展会大全

一种中文分词方法及系统
来源:互联网   发布日期:2011-08-18 14:47:30   浏览:12605次  

导读:一种中文分词系统,包括输入输出单元、原子切分单元、词典词切分单元和特定词识别单元,其特征在于,所述...

本发明涉及中文信息处理领域,提供了一种中文分词方法及系统。所述方法包括以下步骤:A.对输入的中文文本进行原子切分,并根据所得的原子序列建立初始的切分词图;B.基于原子序列分别进行词典词切分和特定词识别,并将各自的独立分词结果添加到所述切分词图中;C.根据所述切分词图中的各独立分词结果生成一条最优分词路径,并按照所述最优分词路径输出综合分词结果。本发明基于中文文本的原子序列分别进行词典词切分和特定词识别,根据各自的独立分词结果生成一条最优分词路径,最终按照该最优分词路径输出综合分词结果,从而提高了中文分词的准确性。另外,在特定词识别中,根据具体情况有选择地启动对各类特定词的识别,提高了中文分词的效率。

赞助本站

相关热词: 一种 中文分 方法 系统

相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港