没有合适的资源?快使用搜索试试~ 我知道了~
python scrapy下的租房信息爬取与数据展示工具的设计与实现.论文.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 29 浏览量
2023-08-11
07:59:23
上传
评论
收藏 4.16MB DOCX 举报
温馨提示
试读
69页
python scrapy下的租房信息爬取与数据展示工具的设计与实现.论文.docx
资源推荐
资源详情
资源评论
I
scrapy 下的租房信息爬取与数据展示
工具的设计与实现
摘 要
时代在发展,技术在进步,互联网改变了全世界,各行各业都在这个互联网
时代寻求自身的增长点,人们的日常生活也越来越离不开互联网。以租房为例,
线下租房行业持续遭到冲击,越来越多的年轻人选择在互联网上挑选房源。然而
网上信息混杂,数据来源众多,如何提升租房用户体验就成了一个值得探讨的问
题。本文以此为研究方向,设计并实现了一个基于 python 开源爬虫框架 scrapy
的租房信息爬取系统,爬取互联网上多个含有此数据的网站。以城市为区分,将
多个站点的数据存入非结构化数据库,再以数据库为连接,开发出一个以 python
开源 web 框架 Django 的基础的租房数据展示系统。与此同时,对爬取到的租房
数据进行可视化处理。
关键词:scrapy;Django;非结构化数据库;数据可视化
II
Design of information acquisition and data display tool
for renting houses based on scrapy
ABSTRACT
The era is developing, technology is progressing, the Internet has changed the
whole world. All walks of life are seeking their own growth points in this Internet
age, and people's daily life is becoming more and more inseparable from the
Internet.Taking renting as an example, the rental industry has been under constant
impact, and more and more young people have chosen to choose housing on the
Internet. However, online information is mixed and data sources are numerous. How
to improve the user experience of renting has become a problem worth discussing. As
a research direction, this paper designs and implements a renting information crawling
system based on Python open source crawler framework scrapy, and crawls several
web sites on the Internet. With the city as the distinction, the data of multiple sites are
stored in the unstructured database, and then the database is used as the connection to
develop a renting data display system based on the python open source web
framework Django. At the same time, we can visualize the data of rental housing.
Keywords: scrapy;Django;NoSQL DB;Data visualization
目 录
摘 要...............................................................I
ABSTRACT...........................................................II
1 绪论..............................................................1
1.1 研究背景及需求分析 ..........................................1
1.2 国内外研究现状 ..............................................2
1.2.1 爬虫技术概述...........................................2
1.2.2 爬虫设计者面临的问题与反爬虫技术现状...................4
1.3 研究目标及研究内容 ..........................................6
1.4 论文的整体结构 ..............................................7
1.5 本章小结 ....................................................7
2 相关理论及技术....................................................8
2.1 robot 协议对本设计的影响.....................................8
2.2 爬虫 ........................................................8
2.2.1 工作原理...............................................8
2.2.2 工作流程...............................................8
2.2.3 抓取策略...............................................9
2.3 python 发展现状..............................................9
2.5 scrapy 架构.................................................10
2.5.1 scrapy:开源爬虫架构..................................10
2.6 MongoDB 数据库..............................................13
2.6.1 NoSQL 数据库介绍 ......................................13
2.6.2 MongoDB 数据库介绍 ....................................13
2.7 python web 框架 Django ......................................14
2.7.1 Django 框架介绍 .......................................14
2.7.2 MTV 模式 ..............................................14
2.7.3 ORM 模式 ..............................................14
2.7.4 template 模板语言 .....................................14
2.7.5 Django 工作机制 .......................................15
2.8 semantic UI 开发框架........................................15
2.8.1 semantic 介绍 .........................................15
2.8.2 semantic 开发 .........................................16
2.9 高德地图 API................................................16
2.10 本章小结 ..................................................16
3 系统分析与设计...................................................17
3.1 系统分析 ...................................................17
3.1.1 系统功能..............................................17
3.1.2 爬取对象分析..........................................17
3.1.3 模块设计..............................................18
3.2 数据流 .....................................................19
3.3 系统总体逻辑层次 ...........................................20
3.4 本章小结 ...................................................21
4 爬虫与数据存储、展示的具体实现...................................22
4.1 爬虫模块 ...................................................22
4.1.1 环境搭建与前期分析....................................22
4.1.2 爬虫规则预处理模块....................................23
4.1.3 数据抓取模块..........................................24
4.1.4 数据存储模块..........................................29
4.1.5 反反爬虫模块..........................................30
4.2 数据库设计 .................................................34
4.2.1 数据库环境搭建........................................34
4.2.2 数据库表设计..........................................35
4.3 数据展示模块 ...............................................35
4.3.1 django 环境搭建 .......................................35
4.3.2 前端 UI 模块...........................................37
4.3.3 网页架构搭建模块......................................39
4.3.4 前端与数据库连接模块..................................41
4.3.5 地图展示模块..........................................42
4.4 开启 Django 服务器 ..........................................43
4.5 成果展示 ...................................................43
4.6 本章小结 ...................................................45
5 系统测试.........................................................46
5.1 测试环境及工具 .............................................46
5.2 系统功能性测试 .............................................46
5.2.1 数据爬取功能测试......................................46
5.2.2 数据展示测试..........................................49
5.3 系统非功能性测试 ...........................................49
5.4 本章小结 ...................................................49
6 总结与展望.......................................................50
参考文献...........................................................51
致谢...............................................................52
附录一 外文文献(原文)...........................................53
附录二 外文文献(译文)...........................................59
剩余68页未读,继续阅读
资源评论
豆包程序员
- 粉丝: 3077
- 资源: 3504
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 部署yolov8的tensorrt模型支持检测分割姿态估计的C++源码+部署步骤.zip
- 以简单、易用、高性能为目标、开源的时序数据库,支持Linux及Windows, Time Series Database.zip
- python-leetcode面试题解之第198题打家劫舍-题解.zip
- python-leetcode面试题解之第191题位1的个数-题解.zip
- python-leetcode面试题解之第186题反转字符串中的单词II-题解.zip
- 一个基于python的web后端高性能开发框架,下载可用
- python-leetcode面试题解之第179题最大数-题解.zip
- python-leetcode面试题解之第170题两数之和III数据结构设计-题解.zip
- python-leetcode面试题解之第168题Excel表列名称-题解.zip
- python-leetcode面试题解之第167题两数之和II输入有序数组-题解.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功