import requests
from bs4 import BeautifulSoup
def get_data():
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36',
'cookie': '',
}
url = 'http://www.news.cn/tech/index.html'
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'lxml') # 用beatifulSoup解析网页
soup_item = soup.select('.item.item-style1')
for si in soup_item:
data = {}
data['标题'] = si.select('.tit')[0].text
data['日期'] = si.select('.time')[0].text
data['详情链接'] = si.select('a')[0]['href']
print(data)
get_data()
Python咕噜
- 粉丝: 69
- 资源: 1
最新资源
- 基于 OpenCV打包以并行读取多个 rtsp 相机
- 基于springboot之篮球论坛系统.zip
- tvm4j-core-0.0.1-SNAPSHOT.jar
- 基于springboot之篮球竞赛预约平台.zip
- Python命令行参数处理及argparse应用实例(包含详细的完整的程序和数据)
- Python面向对象与模块化:构建宠物管理系统的实战案例(包含详细的完整的程序和数据)
- 计算机视觉中人脸检测技术的Python实现及其应用(包含详细的完整的程序和数据)
- TestSonya,Qt判断文本编码格式(支持UTF-8、UTF-16LE/BE、GBK等格式)
- LabVIEW编程入门与进阶技术详解
- 基于链表的联系人管理系统的设计与实现(包含详细的完整的程序和数据)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈