目录
第一章 前言 ............................................................................................................................................- 1 -
1.1 课题背景 ....................................................................................................................................- 1 -
1.2 设计目的 ....................................................................................................................................- 2 -
1.3 设计方案 ....................................................................................................................................- 2 -
第二章 Python 及其环境搭建 .............................................................................................................- 3 -
2.1 Python 简介 .............................................................................................................................- 3 -
2.2 Windows 系统下安装 Python 3.8......................................................................................- 4 -
2.3 PyCharm 集成开发环境.........................................................................................................- 5 -
2.4 MongoDB 数据库介绍 .............................................................................................................- 5 -
2.5 本章小结 ...................................................................................................................................- 5 -
第三章 淘宝产品数据爬虫 ...................................................................................................................- 6 -
3.1 爬取网站介绍..........................................................................................................................- 6 -
3.2 各模块设计...............................................................................................................................- 6 -
3.2.1 信息模块 .....................................................................................................................- 6 -
3.2.2 解析模块 ....................................................................................................................- 10 -
3.2.3 存储模块...................................................................................................................- 12 -
3.3 本章小结.................................................................................................................................- 14 -
第四章 数据处理...................................................................................................................................- 15 -
4.1 数据拆分.................................................................................................................................- 15 -
4.2 数据清洗.................................................................................................................................- 16 -
4.2.1 分词 ............................................................................................................................- 16 -
评论0