展会信息港展会大全

采用领先文本分类算法的文本自动分类系统
来源:互联网   发布日期:2011-10-01 16:15:18   浏览:19143次  

导读:EST自动分类是基于知识分类、语义分类、规则分类并采用优秀的中文文本分类算法的文本自动分类系统,广泛应用于文档管理、档案分类、文章分类、文档搜索、分类搜...

文本自动分类概要:EST自动分类是基于知识分类、语义分类、规则分类并采用优秀的中文文本分类算法的文本自动分类系统,广泛应用于文档管理、档案分类、文章分类、文档搜索、分类搜索、知识分类、网页分类、文档分类实现高效地实现电子文档分类、企业文档分类同时支持中文,英文两种语言来进行文档分类,可以采用SVM,KNN两种分类方法,基于概率估值算法,特征加权算法,可选择多个特征评估函数,特征选择方式可以采用全局选取和按类别单独选取,提供参数调节分类准确性和速度。无内存泄漏问题,可长期不间断运行,提供分类结果评测,让你随时了解分类的准确性....

背景介绍:

       自上个世纪80年代以来,信息化的浪潮席卷全球,信息技术迅速地渗透到社会经济的各个领域。信息的来源是多方面的,比如报纸、电视、广播等等。近几年来,随着互联网的普及和网络技术的不断完善,互联网已经成为了全球最庞大最丰富的信息资源库。由于互联网的开放性,各类信息都能在第一时间发布在互联网上。然而,互联网的这种开放性也导致了互联网上信息的杂乱性和冗余性。因此,自动分类技术随着时代的需求而蓬勃发展了起来。作为一种有效的信息处理方法,自动分类技术将各类信息按照一定的分类体系进行分类整理,从而大大提高了用户搜集情报的效率。

        自动分类技术是在手工分类技术的基础上发展起来的。传统的信息手工分类技术已经相当成熟,但却不适于对互联网上时刻更新的信息进行处理。因为它不具有实时性,另外查全率和分类的一致性也受到一定的制约。世界著名搜索引擎Yahoo长期以来集中了大量人力进行手工分类,并且曾经因此获得了巨大的成功,但这种成功的背后已潜伏着落后的危机。

产品功能:

 
1) 可以用中文,英文两种语言来进行文档分类。
2) 可以采用SVM,KNN两种分类方法。
3) 采用概率估值算法,特征加权算法。可选择多个特征评估函数,特征选择方式可以采用全局选取和按类别单独选取。
4) 提供参数调节分类准确性和速度。
5) 100%采用c++实现的分类组件,无内存泄漏问题。可长期不间断运行。
6)提供分类结果评测,让你随时了解分类的准确性。
7)采用多个大规模语料库训练训练模型。
8) 针对多线程使用优化,占用内存少。

赞助本站

相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港