导读:中文分词技术具体说明和应用 ,超级站长论坛...
搜索引擎查询处理方法
1、如果关键词不超过三个中文的话就直接到数据库索引词汇里面查找,超过了三个中文汉字的话就用空格,逗号等分割开来。将用户提交的关键词串分割成若干个词来查询。
2、另外再查看这个词有没有重复的词汇,有的话会省略掉。
3、分词技术发展到目前已经很成熟的了,google是购买第三方公司的分词技术,百度是自己开发的分词技术,在中文分词这块百度要稍稍领先于google。英文的词