摘要:随着国际互联网的迅猛发展,网上文本信息资源以指数级的速度增长如何快速有效地将文本按其内容进行分门别类的整理,以便于利用这些海量文本,变得越来越重要和困难因此,研究文本自动分类技术具有很重要的现实意义 本文分析考察了文本分类过程中的主要技术中文分词、特征选择、粗糙集和分类器构造,并在广泛研究现有文本自动分类方法的基础上,利用人工神经网络具有的自学习性、自组织性、联想记忆功能和推理意识等在文本自动分类上的独特优势,构建了神经网络分类器由于BPBackProPagation,反向传播神经网络广泛应用于文本自动分类领域,因此本文对BP网络文本分类过程分阶段进行了改进,并证明了本文方法的优越性 本文改进了BP神经网络分类方法,主要设计思路如下首先从已有文本中随机选择部分文本,并建立训练语料库接着对训练文本进行分词,去掉停用词和标点符号,然后词频统计,并生成各文本类的特征向量接着分别使用改进互信息、X2统计方法和本文提出的联合特征选择法,对特征空间做降维处理然后使用粗糙集理论进行属性约简最后建立BP神经网络文本分类器并初始化网络,用训练语料库训练BP文本分类器,直至网络的训练满足一定的收敛条件至此,基于BP神经网络的文本分类器构造完成标题:神经网络中文文本文本分类专业:计算机软件与理论学位:硕士单位:南京邮电大学@关键词:神经网络 中文文本 文本分类 论文时间:2008分类:TP391.1 TP183 导师:陈慧南 张卫丰 语种:中文文摘URL:
神经网络中文文本文本分类
来源:互联网 发布日期:2011-09-16 11:21:03 浏览:23907次
相关内容
AiLab云推荐

最新资讯
本月热点
热门排行
-
借势智元机器人,富临精工跨界入局人形机器人,准备好了吗?
阅读量:44288
-
实探全球首个核电灯塔工厂,这里有各式各样的机器人 | 碳访
阅读量:42100
-
李飞飞「数字表兄弟」破解机器人训练难题 零样本sim2real成功率达90%
阅读量:4328
-
自己制造自己!全球首家人形机器人超级工厂投产,年产1万台
阅读量:4295
-
美国工厂里的机器人开始“丢饭碗”了
阅读量:4218
-
人形机器人产业发展方兴未艾,留意硬件降本逻辑下零部件国产化机会
阅读量:4030
推荐内容
- 2025年加拿大多伦多矿业展PDAC
- 2025第十五届杭州网红直播电商及私域团购选品博览会
- 2025北方国际膜工业大会暨膜工业技术产品展览会
- 2025中国(山东)国际工业节能技术与装备博览会
- 2025第14届国际生物发酵展(济南展)(BIO)
- 2025北方国际电机技术与节能科技展览会
- 2025CME第10届上海国际机床展(华机展)
- 2025第三十届届华南国际口腔展览会
- 2025第十五届杭州全球新电商博览会
- 2025第三十一届华南国际印刷工业展览会(printing south china)
- 2025 年日本国际照明LED 展览会
- 2025第三十二届上海国际广告技术设备展览会(上海国际广印展 APPP EXPO)
- 第九届广州国际氢科技产业博览会
- 2025第三十一届中国国际包装工业展览会(中国国际包装工业展 Sino-Pack 2025)
- 2025广州国际护肤用品展览会(迎河个护展 PCE)
- 2025济南药交会
- 2025第九届广东国际水处理技术与设备展览会(广东水展 WATERTECH CHINA)
- 2025中国(上海)国际健身、康体休闲展览会(IWF)暨2025中国(上海)国际泳池设施,泳池装备及温泉SPA展览会(CSE)
- 2025第九届广东国际泵管阀展览会(广东泵阀展)
- 2025苏州国际机械通用零部件产业博览会暨苏州国际紧固件及加工设备展览会
- 2025日本大阪国际医疗博览会
- 亚洲(泰国)酒店用品及设施展
- 2025镇杰第26届河北医疗器械博览会
- 2025第九届广州国际氢科技术产业博览会(HST)