# node.js爬虫
## 什么是爬虫
> 可以把互联网做成一张”大网“,爬虫就是在这大网上不断爬取信息的程序
>
> 所以一句话总结:爬虫就是请求网站并提取数据的自动化程序
## 爬虫的基本工作流程
1. 向指定的 URL 发送 http 请求
2. 获取响应数据 ( HTML XML JSOP 二进制等数据 )
3. 处理数据 (解析 DOM 解析 JSOP 等)
4. 将处理好的数据进行存储
![image-20210103201504374](C:\Users\xiaoke\AppData\Roaming\Typora\typora-user-images\image-20210103201504374.png)
## 发送http请求
```javascript
// 引入http模块 如果是 https 就引入 https 模块
const http = require('http')
// 创建一个请求 ( 未发送 )
let req = http.request('http://www.itheima.com/teacher.html', (res) => {
// 异步响应
// 创建初始数组
let