为lucene加入简单中文分词城市胡同-自然语言处理-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

为lucene加入简单中文分词城市胡同

来源：互联网发布日期：2011-09-16 09:36:01 浏览：15986次

导读： 看到很多人做lucene的应用时候都要面临中文分词怎么加的问题，下面介绍一个简单的中文词库，这个词库附带相应的算法，数据结构学过的人看懂没什么问题，只要简单的构造一个对象，就可以分词了，对于不是太大的应用来说，还是相当可行的，点击下载该分词库使...

看到很多人做lucene的应用时候都要面临中文分词怎么加的问题，下面介绍一个简单的中文词库，这个词库附带相应的算法，数据结构学过的人看懂没什么问题，只要简单的构造一个对象，就可以分词了，对于不是太大的应用来说，还是相当可行的，点击下载

      该分词库使用很简单，先初试化该类
      ChineseSegmenter seg = ChineseSegmenter.getGBSegmenter();
     然后调用seg.segmentLine("要分词的中文段", " ")//第二个参数为分词之间以什么间隔
      譬如

    输出为儿童节日儿童节

     下面简要说以下如何加到搜索代码里，
      lucene 建立索引的代码引入的analysis分词法为 WhitespaceAnalyzer
      import org.apache.lucene.analysis.WhitespaceAnalyzer;

        上面建立索引时候为把文章的标题和内容进行断词然后存入了索引, 搜索的时候同样用WhitespaceAnalyzer,
然后把结果hit中的结果合并就可以了.

相关热词： lucene 加入简单中文分城市胡同

为lucene加入简单中文分词城市胡同
来源：互联网发布日期：2011-09-16 09:36:01 浏览：15986次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

为lucene加入简单中文分词 城市胡同 来源：互联网 发布日期：2011-09-16 09:36:01 浏览：15986次