展会信息港展会大全

神经网络中文文本文本分类
来源:互联网   发布日期:2011-09-16 11:21:03   浏览:23907次  

导读: 摘要:随着国际互联网的迅猛发展,网上文本信息资源以指数级的速度增长如何快速有效地将文本按其内容进行分门别类的整理,以便于利用这些海量文本,变得越来越重要和困难因此,研究文本自动分类技术具有很重要的现实意义 本文分析考察了文本分类过程中的主要...

摘要:随着国际互联网的迅猛发展,网上文本信息资源以指数级的速度增长如何快速有效地将文本按其内容进行分门别类的整理,以便于利用这些海量文本,变得越来越重要和困难因此,研究文本自动分类技术具有很重要的现实意义 本文分析考察了文本分类过程中的主要技术中文分词、特征选择、粗糙集和分类器构造,并在广泛研究现有文本自动分类方法的基础上,利用人工神经网络具有的自学习性、自组织性、联想记忆功能和推理意识等在文本自动分类上的独特优势,构建了神经网络分类器由于BPBackProPagation,反向传播神经网络广泛应用于文本自动分类领域,因此本文对BP网络文本分类过程分阶段进行了改进,并证明了本文方法的优越性 本文改进了BP神经网络分类方法,主要设计思路如下首先从已有文本中随机选择部分文本,并建立训练语料库接着对训练文本进行分词,去掉停用词和标点符号,然后词频统计,并生成各文本类的特征向量接着分别使用改进互信息、X2统计方法和本文提出的联合特征选择法,对特征空间做降维处理然后使用粗糙集理论进行属性约简最后建立BP神经网络文本分类器并初始化网络,用训练语料库训练BP文本分类器,直至网络的训练满足一定的收敛条件至此,基于BP神经网络的文本分类器构造完成标题:神经网络中文文本文本分类专业:计算机软件与理论学位:硕士单位:南京邮电大学@关键词:神经网络 中文文本 文本分类 论文时间:2008分类:TP391.1 TP183 导师:陈慧南 张卫丰 语种:中文文摘URL:

赞助本站

相关热词: 网络 中文文 本文本

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港