导读:发布了纯C for *Unix* 的中文分词模块Libscws - C/C++ - ChinaUnix.netC/C++ Libscws 实现的功能是将没有明显分界的中文字符串或文本进行词语识别。在 *unix* 环...
QUOTE:
原帖由 ailantian 于 2007-6-9 19:03 发表
Libscws 实现的功能是将没有明显分界的中文字符串或文本进行词语识别。
他说的是有没有分隔才会识别为单词
不知道楼主这个主要是用来做什么 呢?
ps楼主的帖子精华率太高了啊:)
分词用途很广啊,现在信息越来越多,不管是分类或者是有效关键词的提取都需要用到分词.
更主要的是搜索必须用,才能提高效率和准确率.有兴趣可以GOOGLE 一下,什么是中文分词,为什么要中文分词.
回楼上的楼上,因为内置了一套自动识别人名地区的小规则,所以"田雨"就被识别人为名了