没有合适的资源?快使用搜索试试~ 我知道了~
猴王大圣(毕业设计)-热搜指数平台的设计与实现.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 42 浏览量
2022-10-21
03:19:39
上传
评论
收藏 576KB DOCX 举报
温馨提示
试读
26页
猴王大圣(毕业设计)_热搜指数平台的设计与实现.docx猴王大圣(毕业设计)_热搜指数平台的设计与实现.docx
资源推荐
资源详情
资源评论
[在此处键入]
引 言
热搜指数就是一个基于搜索引擎的大数据统计并处理后展示数据的平台,他能帮助
用户做一些决策,能反映一定程度的社会趋势和发展方向,既能回顾历史也能展现未来,
探索数据的价值。在高速发展的社会,知识技术更新替代也进行了加速,“落后就会挨
打”。所以要想跟进社会的步伐,无论是个人兴趣还是企业发展或者个人规划,通过浏
览热搜指数平台就能查看社会最新发展趋势获取最新的知识技术进展,为人们提供最准
确的建议。在网络信息化的社会网民迅速增加‘大数据’也孕育而生,人们在网络上使
用的流量数据,每天呈现指数式的增长,面对庞大的数据只通过人为的分析并不是很理
智的选择,而且工作量是相当的大,要想轻松方便的探索数据的价值,开发一个热搜指
数平台是很好的方法。
华东交通大学理工学院毕业设计
1 绪论
1.1 背景分析
现在的各种平台都会具有检索功能,每个词条本身就具有一定的属性,但是他在不
同的环境能产线不同的新属性,在搜索的时候会结合地区,时区,用户等环境产生新的
属性,而这些属性并不是没有价值,只是不能轻易的被人们发现而已,热搜指数平台就
是旨在展示一些不能被人们轻易发现的数据价值。
1.2 研究现状
国内研究现状:
在国内市场中主要有百度指数 头条指数 微指数 阿里指数等。相比于国外市场呈
现出多而杂的场面,目前做的相对较好的指数系统就算是百度指数了,支持基于单个词
的搜索趋势、需求图谱、行情管理、人群分布;基于行业的整体发展趋势、地域数据分布、
用户属性、检索时间特征。其缺点是各家的指数数据来源都是自家单一的数据源,并不
能将所有网络数据源整合在一起,所以这些指数图谱的可靠性有待提升。比如百度的大
部分数据都是来自百度搜索,微指数的数据来源于微博,阿里指数数据源于淘宝。
国内发展趋势:
纵观国内发展状况,百度指数只是单一的百科搜索的数据,微博则是娱乐数据,微
信和头条是文章的数据,阿里也只是展示自己的淘宝数据,所以各大网络平台的通病就
是数据的单一性和不可靠性。互联网本来就是开放的世界,如果各家为了利益而争的头
1
刘威:热搜指数平台
破血流就毫无意义了,如果各家只使用自家数据这必然导致指数的可靠性大大减少,未
来各大互联网平台如果开放数据,整合全网平台的数据将会大大提升数据的可靠性和精
准性,这也必将是国内的发展趋势。
1.3 研究意义和内容
通过搜索引擎市场分析,早在 2010 年底,国内搜索引擎市场渡过调整期开始步入
成熟期。搜索引擎商业价值获得广泛认可,整个市场内的发展会呈现出“数量”的积累
到“质量”的大幅提升。商业模式逐渐完善,市场保持发展,APRU 值也会显著提升;,
2012 年左右,中国搜索引擎市场将出现高质量的发展。
调查结果显示,2015 年底,中国搜索引擎市场发展成熟,市场格局趋稳,2015 年
各搜索引擎企业在创新领域开始加大搜索引擎的应用,社会各相关领域已经开始和搜索
引擎相结合,搜索引擎市场的发展必然会积累大量的用户数据,而这些数据记录并非无
用的,或许一两个的数据并不能说明什么,一旦几万甚至几亿人产生的数据那就变得有
很重要的参考价值了。
2015 年 8 月 31 日,国务院发布“促进大数据发展行动纲要”说道大数据是以容量
大、类型多种、存取速度快和低价值密度为主要特征的数据集合,它正在迅速发展,以
大量分散的来源和不同的格式收集,存储和关联数据。从中发现新知识、创造新价值、
提升新能力的新一代信息技术和服务业态。在互联网飞速发展的社会,每天的数据流呈
现指数式的增长。2017 年中国网民就已经超过 7 亿了,比 2008 年网民数量的两倍还多,
网络用户产生的数据更是超过万亿 TB。随着 5G 技术的开始使用,预计到 2025 年,国
内网民用户产生的数据总量将是 2017 年的 20 倍,达到 200ZB。伴随数据量的高速膨胀,
对于大数据的存储和大数据的开发需求必然快速增加。
随着信息技术的高速发展,网民的数量也急剧增加,互联网信息高速传播,这个时
代产生的数据也呈现出爆发式增长,这不仅是市场机遇,更是社会的进步。大数据时代
在互联网的背景之下孕育而生。任何一个科学都离不开数据,数据可以引导正确的科学
发现,数据可以验证实验结论,数据可以让我们做出正确的决策,那么在这个大数据时
代我们应该怎样来分析并提取这些数据呢?从海量的大数据中分析并提取一些对社会
2
华东交通大学理工学院毕业设计
对用户有价值的信息已经是一个让人值得深思的研究方向了。数据可视化是目前比较好
的解决方式,数据可视化即把数据转换成可以用眼睛直接观察的形式,如动图和图表或
地图,从而让大家从简洁明了的图画中轻松的获取数据的价值。如果只是以单纯的文本
数据形式的展示数据就显得繁多杂乱,而且采用这种方法来观察数据得到数据的内在价
值更是不轻松,而可视化的数据可以帮助人们快速、轻松地提取数据中的含义,更轻松
的发掘数据的其他属性,如发展趋势,相关性。
数据可视化分为静态和动态。长久以来人类为了方便获取数据信息,大家都只是单
一的使用静态数据展示,如图地图和数据表格。而动态交互式的数据可视化,明显更加
生动形象,通俗易懂,要优于静态的数据展示。进入 21 世纪后,电脑和移动设备的大
量普及,借助于电脑和移动设备大家就可以获取更加详细和优美的图形和表格了,然后
用交互的方式使人们看到的数据及数据的处理方式。
有了搜索引擎行业产生的大数据,再将之可视化放大数据的价值,或许我们每个人
都可以当上科学家。在这个大数据时代下,我们坚持不懈的探索数据的价值是社会文明
进步的必然之路。所以开发一个数据可视化的热搜指数系统让大家更轻松的获取数据的
价值是社会发展的需求。
1.4 本章小结:
本章主要概括了热搜指数平台开发的时代和环境背景,国内外研究现状及发展趋
势,研究意义和内容。
3
刘威:热搜指数平台
2 系统运用的技术
本章介绍了热搜指数系统设计中使用到的技术。主要是用 web 网页实现,后端使用
Python 计算机程序设计语言实现,包括 Django 框架,以及爬虫技术。数据库使用 MySQL
数据库。前端使用了 bootstrap 和 echarts 框架。运用这些技术,前后端相结合开发出热
搜指数平台。
2.1 Python 语言
Python 中文名即‘蟒蛇’,它是一种动态的面向对象的解释型语言。它也经常被用
于 web 开发,Apache 通过 mod_wsgi 模块就可以运行 python 的 web 程序,使用 Gunicorn
作为 WEB 服务器也能运行 Python 语言编写的 web 程序。如Django,Flask,Tornado 等
都可以使用 WSGI 服务器。
2.2 HTML 语言
超文本标记语言 HTML 是 web 网页制作的必用的编程语言,它是一种规范,更是
一种标准。通过在文本文件中设置标签来告诉浏览器如何显示相应的内容,浏览器按顺
序读取网页文件,然后根据标记来展示内容。结合CSS 和 JavaScript 能渲染出更美观的
网页。基本上所有浏览器都是支持 HTML 的,良好通用性使得它成为编程人员构建网
页的基础。
2.3 JavaScript语言
JavaScript 简称 JS,是一种解释执行的动态的弱类型高级语言。现今的浏览器都有
JS 解释器,所以它广泛用于客户端的脚本语言,一直被用在 HTML 网页上,给网页增
4
剩余25页未读,继续阅读
资源评论
春哥111
- 粉丝: 1w+
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功