作者: CNET科技资讯网
CNETNews.com.cn
2007-09-25 23:51:21
关键词: 海量
CNET科技资讯网9月25日报道 海量将面向世界范围内的中文信息处理研究机构,推出中文分词基础件研究版,供用户无限期免费下载。消息传出后,引起了相关专业人士热切关注。专家认为,海量此举,解决了国内外诸多研究机构最头疼的难题,必将推动中文信息处理技术的提高及应用。
据了解,分词技术是中文自然语言理解最基本的前提,也是中文信息从“数据时代”向“情报时代”发展进程中必“跳”之“龙门”。由于技术难度大、开发周期长,长期以来,分词技术一直是中文搜索引擎、知识管理、内容数据挖掘等技术研究的门槛和瓶颈。而海量公司在中文自然语言理解领域一直处于国际领先地位,其分词基础件技术领先、产品成熟,是目前唯一被广泛应用的分词产品。
由于语言文化的差异,中文信息化处理一直远远落后于英文以及其他语种。而中文分词技术是中文信息自动化处理技术发展的瓶颈。国际著名自然语言理解技术专家周富秋说:“英文清晰的单词