1. 环境配置
在开始之前,你需要安装 Python 和一些必要的库。确保你的系统上已经安装了
Python(推荐 Python 3.x 版本)。
安装 Requests 库
Requests 库是一个简单易用的 HTTP 库,可以用来发送 HTTP 请求。你可以通过
以下命令安装它:
sh
复制代码
pip install requests
安装 BeautifulSoup 库
BeautifulSoup 库用于解析 HTML 和 XML 文档。你可以通过以下命令安装它:
sh
复制代码
pip install beautifulsoup4
2. 发送 HTTP 请求
首先,我们需要使用 Requests 库发送一个 HTTP 请求,获取网页的内容。以下是
一个示例代码:
python
复制代码
import requests
url = 'http://example.com'
response = requests.get(url)
# 检查请求是否成功 if response.status_code == 200:
print("请求成功!")
html_content = response.textelse:
print("请求失败!")
3. 解析 HTML 内容
获取到网页内容后,我们需要解析 HTML,以提取我们感兴趣的数据。这里,我
们使用 BeautifulSoup 库。