AcmenXiaoKe#notes#node-爬虫1

javascript

爬虫

需积分: 0 0 下载量 18 浏览量 2022-07-25 14:25:17 上传评论收藏 3KB MD 举报

温馨提示

试读

什么是爬虫可以把互联网做成一张”大网“，爬虫就是在这大网上不断爬取信息的程序所以一句话总结：爬虫就是请求网站并提取数据的自动化程序爬虫的基本工作流程向指定的 U

资源推荐

资源详情

资源评论

# node.js爬虫 ## 什么是爬虫 > 可以把互联网做成一张”大网“，爬虫就是在这大网上不断爬取信息的程序 > > 所以一句话总结：爬虫就是请求网站并提取数据的自动化程序 ## 爬虫的基本工作流程 1. 向指定的 URL 发送 http 请求 2. 获取响应数据 ( HTML XML JSOP 二进制等数据 ) 3. 处理数据（解析 DOM 解析 JSOP 等） 4. 将处理好的数据进行存储 ![image-20210103201504374](C:\Users\xiaoke\AppData\Roaming\Typora\typora-user-images\image-20210103201504374.png) ## 发送http请求 ```javascript // 引入http模块如果是 https 就引入 https 模块 const http = require('http') // 创建一个请求 ( 未发送 ) let req = http.request('http://www.itheima.com/teacher.html', (res) => { // 异步响应 // 创建初始数组 let

点击阅读更多

评论收藏

内容反馈

资源评论