这套分词系统不错。推荐一下 http://www.ftphp.com/scws/ 动态 * 2008-12-21 SCWS 划入 FTPHP 项目,作为子项目重建本网站。 * 2006 - 2007 陆续开发纯 PHP 实现的 PSCWS 第二版与第三版,2007-06-09 发布 scws-0.0.1 pre 版,功能基本完整,2008-03-08 发布 scws-1.0.0 正式版。简介 - SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统。 这是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开,所以如何准确而又快速的分词一直是中文分词的攻关难点。 SCWS 在概念上并无创新成分,采用的是自行采集的词频词典,并辅以一定程度上的专有名称、人名、地名、数字年代等规则集,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些中小型搜索引擎、关键字提取等场合运用。 SCWS 采用纯 C 代码开发,以 Unix-Like OS 为主要平台环境,提供共享函数库,方便植入各种现有软件系统。此外它支持 GBK,UTF-8,BIG5 等汉字编码,切词效率高。 [推荐]首个搭载 SCWS 分词系统的中小型站内全文检索解决方案 - FTPHP!版本列表版本 类型 平台 性能 其它SCWS-1.0.x C 代码 *Unix*/*PHP* 准确: 95%, 召回: 91%, 速度: 1.2MB/secPHP扩展分词速度: 250KB/sec [下载] [文档] [安装说明]php_scws.dll(1) PHP扩展库 Windows/PHP 4.4.x 准确: 95%, 召回: 91%, 速度: 40KB/sec [下载] [文档] [安装说明]php_scws.dll(2) PHP扩展库 Windows/PHP 5.2.x 准确: 95%, 召回: 91%, 速度: 40KB/sec [下载] [文档] [安装说明]PSCWS23 PHP源代码 不限 (不支持UTF-8) 准确: 93%, 召回: 89%, 速度: 960KB/min [下载] [文档]PSCWS4 PHP源代码 不限 准确: 95%, 召回: 91%, 速度: 160KB/min [下载] [文档]
我的开源PHP中文分词扩展:PHPCWS 1.0.0[原创]
来源:互联网 发布日期:2011-08-28 21:47:57 浏览:16881次
相关内容
- 混乱、分裂、吞并:2024年AI的信仰之战
- 阿尔特曼:通用人工智能将由 OpenAI 率先实现
- 人工智能革命推动电力需求激增,美国兴起天然气发电厂建设热潮
- 培育新质生产力,这些人工智能实践令人振奋
- OpenAI o3 碾压式 AI 数学成绩遭质疑:既当选手又是裁判
- 三问“AI 2025”,五款大模型这样说
- 中国人工智能产业规模5年后或超万亿,这两个行业渗透力居首|言叶知新
- AI风险治理亟需产业实践方案
- AI大模型的能力比拼或许不再拘泥于“算力”
- 刚刚,特朗普联手奥特曼,狂砸5000亿美元启动AI「星际之门」
- 2025大模型的新惊喜:昆仑万维全面上线天工大模型4.0
- DeepSeek开源推理大模型R1:纯强化学习实现接近OpenAI o1水平,成本降至1/30
- 为超越 OpenAI GPT-4,Meta 不惜使用争议数据训练 Llama 3
- 视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮
- 微软开源140亿参数小语言AI模型Phi-4,性能比肩 GPT-4o Mini
- OpenAI:芯片、数据、人才,美国不仅要赢,也必须要赢
- 微软 AI 战略面临重大挑战:大量旧电脑难以升级至 Win11
- 大力发展人工智能,科创AI,未来已来
- OpenAI 被曝本月将发“博士级”超级 AI 智能体
- 马修·杰克逊:面对AI,没有什么工作是永远安全的
AiLab云推荐
最新资讯
- 刚刚,特朗普联手奥特曼,狂砸5000亿美元启动AI「星际之门」
- 5000亿美元砸向AI!特朗普官宣“星际之门”计划,撤销拜登签署的AI行政令
- AI大模型的能力比拼或许不再拘泥于“算力”
- 微软 AI 战略面临重大挑战:大量旧电脑难以升级至 Win11
- DeepSeek开源推理大模型R1:纯强化学习实现接近OpenAI o1水平,成本降至1/30
- OpenAI 被曝本月将发“博士级”超级 AI 智能体
- OpenAI o3 碾压式 AI 数学成绩遭质疑:既当选手又是裁判
- 阿尔特曼:通用人工智能将由 OpenAI 率先实现
- 微软科学家自述确诊“AI疲劳症”!如何在快速发展的AI浪潮中保持清醒
- 2025, AI进入“飞天”时刻
本月热点
热门排行
-
机构看衰、专家批评项目艰难,大语言模型会不会成为即将破碎的AI泡沫?
阅读量:7005
-
大模型落地路线图研究报告:大模型推动“人工智能+”高质量发展
阅读量:6367
-
人工智能对材料科学研究有哪些深远影响?谢建新院士分享
阅读量:6301
-
这个会议一天提及AI 500次,最后的结论是什么?
阅读量:6175
-
OpenAI 罕见开源!低调发布的新研究,一出来就被碰瓷
阅读量:5857
-
机构看衰、专家批评项目艰难,大语言模型会不会成为即将破碎的AI泡沫?
阅读量:5142