导读:3种中文分词算法优劣对比分析2011年03月30日21:21来源:互联网编辑:Nero 到目前为止,中文分词包括三种方法:1)基于字符串匹配的分词;2)基于理解的分词;3)...
3种中文分词算法优劣对比分析
2011年03月30日21:21来源:互联网编辑:Nero
到目前为止,中文分词包括三种方法:1)基于字符串匹配的分词;2)基于理解的分词;3)基于统计的分词。到目前为止,还无法证明哪一种方法更准确,每种方法都有自己的利弊,有强项也有致命弱点,简单的对比见下表所示:
(1)歧义识别
歧义识别