[jobo-src.zip] - 真正的网络爬虫的源代码啊,希望大家好好阅读,写出心得体会啊
[hb0605.rar] - 汇编计数器实例,提供了具体的分析,代码等等,汇编爱好者必备!!(推荐)
[客房管理.rar] - 欢迎使用我的原代码 谢谢合作
[arale.zip] - 用java写的网络爬虫,开源代码,可以用来分析。
[word_split.rar] - 这个一个基于逆向最大匹配的分词程序,语料规模比较小。
[CMM_wordSeg.rar] - 逆向最大匹配切词,很简单,仅供学习...
包含常用的9万的词库。
[usdsi.rar] - 本程序是用python编写,无需安装。运行Crawler.exe就可以看到效果。
如果不修改配置是抓取新浪科技的内容,修改配置可以抓取指定的网站。
配置文件采用ini的格式.
spider_config.ini蜘蛛的配置
1. maxThreads 爬虫的线程数
2. startURL 爬
[WordSeg.zip] - 利用最大匹配法进行汉语句子的分词 最大匹配算法是最常用的分词算法,简单实用正确率可达到80%以上
[Foundations_of_Statistical_NLP.zip] - 自然语言处理的基础入门书,书中详细介绍了各个发展发展的关键技术与现状
(MM) 切分之正向最大匹配算法 用于自然语言处理中的切词 Windows
来源:互联网 发布日期:2011-09-27 11:45:47 浏览:20504次
导读: [jobo-src.zip] - 真正的网络爬虫的源代码啊,希望大家好好阅读,写出心得体会啊 [hb0605.rar] - 汇编计数器实例,提供了具体的分析,代码等等,汇编爱好者必备!!(推荐) [客房管理.rar] - 欢迎使用我的原代码 谢谢合作 [arale.zip] - 用java写的网络爬虫,...
相关内容
AiLab云推荐
最新资讯
本月热点
热门排行
-
最坏时期已过,美国5G市场即将迎来回暖?
阅读量:48581
-
华为5G-A实现规模组网,下载速度超过4Gbps,比5G快10倍
阅读量:48395
-
回望2023年5G发展:释放和提升价值成最大课题
阅读量:12819
-
全球吹响5G-A商用号角
阅读量:11198
-
5.5G在欧洲突破,DNA首次将5.5G技术引入现网
阅读量:10492
-
首发新款麒麟5G芯片!曝华为nova 12系列12月26日登场
阅读量:10358