我们这里倒是有一套软件(主要是对商品上的),比如:娃哈哈牌苹果味全脂奶粉(500克),
先用这个软件拆开(首先把‘()’和500克这个量词去掉) 娃哈哈+牌+苹果+味+全脂+奶粉
由于汉语的特性,最后的名词才是关键,前面的都是用来修饰这个名词的,所以最后程序识别这个商品是奶粉。但是这个程序不是在数据库的方法作的,而是一个C++的程序,因为我们发现这样更快,如果用数据库的方法,反倒没有这个迅速。
过于模糊查询,前两天刚写了一点东西给别的组,大致的想法是通过模版,一次次来模,也是在商品的自动化分类上的应用,比如像上面的例子我先做一个商品的类别表作为模版,来第一次模,这样模后会有一些商品重复分类 比如上面 的例子那个奶粉同时被分在苹果和奶粉两种商品中,所以要对这种重复分类的商品继续取模,于是又作了一个模版,这个模版中判断
苹果和奶粉的优先级,奶粉的优先级〉苹果,这样第二次又分离出去一部分数据,然后第三次模,一般的我们经过测试三次基本上就没有什么数据不能分开了。剩下的少部分用肉眼就可以区分。不过用这个数据库的方法如果和上面第一种方法结合速度和质量上就会更上一层楼。
注:有些问题还是比较奇特的比如 ***牌西服套装,如果用最上面的方法,往往是把这个商品分成为套装,而实际上这个是没有意义的。
怎样实现中文分词查询?
来源:互联网 发布日期:2011-09-16 16:05:19 浏览:18781次
导读:怎样实现中文分词查询?,分词,中文,查询 ,IXPUB技术社区...
上一篇:没有了...
下一篇:浅谈JPEG图像压缩算法
相关内容
- 为什么DeepSeek会诞生在杭州?
- 脑机接口临床案例获“出乎意料”成果:瘫痪患者训练2个月,不需脑机接口也可拿起木球
- 高德红外:多项脑机接口技术已超马斯克 Neuralink 公司
- 2025十大AI技术趋势:具身智能、世界模型都有望迎来ChatGPT时刻|钛媒体AGI
- 联想意外曝光英伟达N1芯片!AI PC要迎来“质变”时刻了?
- DeepSeek立功,华为算力芯片供不应求,英伟达算力霸权坍塌背后
- 英伟达业绩、指引均超市场预期 黄仁勋称Blackwell芯片需求惊人
- 韩国研究团队开发出类脑芯片,能够自主学习并纠正错误
- ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法
- 拜登卸任前最后一搏:拟进一步收紧AI芯片对华出口!
AiLab云推荐

最新资讯
本月热点
热门排行
-
为了获诺奖,AI不仅要懂物理学,还要懂哲学?
阅读量:3843
-
我国研究人员设计出高效神经调控芯片,推动脑机接口研发进程
阅读量:3677
-
为何诺贝尔化学奖又颁给AI?万字详解:AI重塑结构生物学
阅读量:3604
-
芯片大厂恩智浦边缘业务提速融合人工智能
阅读量:3505
-
华为脑机接口芯片新专利曝光,是其第二项脑机接口专利
阅读量:3436
-
小米 Vela 系统代码即将开源,开启先锋体验计划
阅读量:3158
推荐内容
- 2025年第33届中国华东进出口商品交易会(上海华交会)
- 2025第十五届中国(郑州)塑料产业博览会(AllinPlas)
- 2025第二十届中国(临沂)小商品博览会
- 2025年加拿大多伦多矿业展PDAC
- 2025北方国际电机技术与节能科技展览会
- 2025第三十届届华南国际口腔展览会
- 2025CME第10届上海国际机床展(华机展)
- 2025第14届国际生物发酵展(济南展)(BIO)
- 2025中国(山东)国际工业节能技术与装备博览会
- 2025北方国际膜工业大会暨膜工业技术产品展览会
- 2025第十五届杭州网红直播电商及私域团购选品博览会
- 2025第十五届杭州全球新电商博览会
- 2025济南药交会
- 2025广州国际护肤用品展览会(迎河个护展 PCE)
- 2025第三十一届中国国际包装工业展览会(中国国际包装工业展 Sino-Pack 2025)
- 2025第三十一届华南国际印刷工业展览会(printing south china)
- 第九届广州国际氢科技产业博览会
- 2025第三十二届上海国际广告技术设备展览会(上海国际广印展 APPP EXPO)
- 2025 年日本国际照明LED 展览会