展会信息港展会大全

机器学习和我关注的技术
来源:互联网   发布日期:2011-09-22 13:25:59   浏览:23065次  

导读: 基于关键词的复制网页算法 想前面的提到的算法都是基于这个文档的,对于大型的搜索引擎来说,在性能上有些差距,所以有些优化,针对是网页的关键词,或者网页的meta描述部分。所以,必须有以下的技术做支撑: 1、网页中出现的关键词(中文分词技术)以及每个...

基于关键词的复制网页算法 想前面的提到的算法都是基于这个文档的,对于大型的搜索引擎来说,在性能上有些差距,所以有些优化,针对是网页的关键词,或者网页的meta描述部分。所以,必须有以下的技术做支撑: 1、网页中出现的关键词(中文分词技术)以及每个关键词的权重(关键词密度); 2、提取meta descrīption或者每个网页的若干(比如:512)个字节的有效文字。 在以下算法描述中,我们约定几个信息指纹变量: Pi表示第i个网页; 该网页权重最高的N个关键词构成集合Ti={t...

赞助本站

相关热词: 器学 我关 技术

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港