没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
编号:
时间:2021 年 x 月 x 日
书山有路勤为径,学海无涯苦作舟
页码:第 1 页 共 61 页
第 1 页 共 61 页
微信热门文章采集方法以及详细步骤
本文将以搜狗微信文章为例,介绍使用八爪鱼采集网页文章正文的方法。文章正
文里一般包括文本和图片两种。本文将采集文章正文中的文本+图片 URL。
将采集以下字段:文章标题、时间、来源和正文(正文中的所有文本,将合并到
一个 excel 单元格中,将使用到“自定义数据合并方式”功能,请大家注意)。
同时,采集文章正文中的文本+图片 URL,将用到“判断条件”,“判断条件”的
使用,有很多需要注意的地方。以下两个教程,大家可先熟悉一下。
“自定义数据合并方式”详解教程:
http://www.bazhuayu.com/tutorialdetail-1/zdyhb_7.html
“判断条件”详解教程:
http://www.bazhuayu.com/tutorialdetail-1/judge.html
采集网站:http://weixin.sogou.com/
使用功能点:
分页列表信息采集
http://www.bazhuayu.com/tutorial/fylb-70.aspx?t=1
Xpath
http://www.bazhuayu.com/search?query=XPath
AJAX 点击和翻页
http://www.bazhuayu.com/tutorial/ajaxdjfy_7.aspx?t=1
编号:
时间:2021 年 x 月 x 日
书山有路勤为径,学海无涯苦作舟
页码:第 3 页 共 61 页
第 3 页 共 61 页
微信热门文章采集方法步骤 2
步骤 2:创建翻页循环
1)在页面右上角,打开“流程”,以展现出“流程设计器”和“定制当前操作”
两个板块。网页打开后,默认显示“热门”文章。下拉页面,找到并点击“加载
更多内容”按钮,在操作提示框中,选择“更多操作”
编号:
时间:2021 年 x 月 x 日
书山有路勤为径,学海无涯苦作舟
页码:第 4 页 共 61 页
第 4 页 共 61 页
微信热门文章采集方法步骤 3
2)选择“循环点击单个元素”,以创建一个翻页循环
编号:
时间:2021 年 x 月 x 日
书山有路勤为径,学海无涯苦作舟
页码:第 5 页 共 61 页
第 5 页 共 61 页
微信热门文章采集方法步骤 4
由于此网页涉及 Ajax 技术,我们需要进行一些高级选项的设置。选中“点击元
素”步骤,打开“高级选项”,勾选“Ajax 加载数据”,设置时间为“2 秒”
剩余60页未读,继续阅读
资源评论
猫一样的女子245
- 粉丝: 230
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功