导读: 【作者】; 【导师】; 【作者基本信息】北京林业大学,计算机应用技术,2010,硕士 【摘要】 随着互联网的不断延伸,信息量随着不断增加,如何从浩瀚的信息海洋中得到用户感兴趣的信息就显得尤为重要。尽管门户网站试图让目录更加合理化,提供的服务也更加多样...
【作者】 ;
【导师】 ;
【作者基本信息】 北京林业大学, 计算机应用技术, 2010, 硕士
【摘要】 随着互联网的不断延伸,信息量随着不断增加,如何从浩瀚的信息海洋中得到用户感兴趣的信息就显得尤为重要。尽管门户网站试图让目录更加合理化,提供的服务也更加多样化,但在数以亿计的信息面前,则显得杯水车薪。为了适应时代的发展,搜索引擎便孕育而生了本文首先介绍了搜索引擎的发展状况,国内外的研究现状,以及传统的全文检索式的搜索引擎的基本原理及存在的问题。接着详细介绍了基于文本聚类搜索引擎的概念及其相关的聚类算法。之后,阐述了各种聚类算法之间的不同以及聚类算法原理,通过实验,