基于python的网络爬虫设计

所需积分/C币:45 2014-11-05 15:48:47 727KB DOC
9
收藏 收藏
举报

以世纪佳缘网为例,思考自己所需要的数据资源,并以此为基础设计自己的爬虫程序。应用python伪装成浏览器自动登陆世纪佳缘网,加入变量打开多个网页。通过python的urllib2函数进行世纪佳缘网源代码的获取。用正则表达式分析源代码,找到所需信息导入excel。连接数据库,将爬下的数据存储在数据库中。

...展开详情
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
zyx2345 刚好用得上,谢谢。
2015-12-17
回复
isinfonia 不错,有很大帮助。要是有再根据特点选就更好了
2015-04-16
回复
上传资源赚积分or赚钱
    最新推荐