浅谈网络爬虫中深度优先算法和简单代码实现。今天小编给大家分享网
络爬虫中广度优先算法的介绍及其代码实现过程。
广度优先算法和深度优先算法恰好相反,这里继续以上图的二叉树为例。
广度优先算法的主要思想是首先从顶级域名 A 开始,之后从中提取出两个链
接 B 和 C,待链接 B 抓取完成之后,下一个要抓取的链接则是链接 B 的同级
兄弟链接 C,而不是说抓取完成链接 B 之后,立马往下去抓取子链接 C 或 D。
待 C 抓取完成之后,再返回去继续抓取兄弟链接 B 下的子链接 D 或者 E,尔
后再返回去抓取 C 链接下的兄弟链接 F、G、H,以此类推。
评论0
最新资源