在学校的时候和同学写的c语言网络爬虫,利用Libevent+nanomsg实现网页爬取和模块通信,利用DFA提取网页中的url,通过布隆过滤器对爬取的网页做url去重,过滤无效url,对url做绝对路径化处理 包含实验报告,有具体的模块设计,以及运行环境介绍 欢迎下载参考
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~