展会信息港展会大全

发布了纯C for *Unix* 的中文分词模块Libscws
来源:互联网   发布日期:2011-09-07 14:01:36   浏览:16942次  

导读:发布了纯C for *Unix* 的中文分词模块Libscws - C/C++ - ChinaUnix.netC/C++ Libscws 实现的功能是将没有明显分界的中文字符串或文本进行词语识别。在 *unix* 环...



QUOTE:

原帖由 ailantian 于 2007-6-9 19:03 发表

Libscws 实现的功能是将没有明显分界的中文字符串或文本进行词语识别。
他说的是有没有分隔才会识别为单词

不知道楼主这个主要是用来做什么 呢?

ps楼主的帖子精华率太高了啊:)




分词用途很广啊,现在信息越来越多,不管是分类或者是有效关键词的提取都需要用到分词.

更主要的是搜索必须用,才能提高效率和准确率.有兴趣可以GOOGLE 一下,什么是中文分词,为什么要中文分词.

回楼上的楼上,因为内置了一套自动识别人名地区的小规则,所以"田雨"就被识别人为名了

赞助本站

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港