没有合适的资源?快使用搜索试试~ 我知道了~
(完整word版)旅游大数据平台方案.doc
0 下载量 187 浏览量
2022-11-13
09:12:03
上传
评论
收藏 151KB DOC 举报
温馨提示
试读
17页
(完整word版)旅游大数据平台方案.doc
资源推荐
资源详情
资源评论
旅游研究院大数据挖掘与分析
科研平台建设方案
一. 背景
1.1 数据挖掘和大数据分析行业背景和发展趋势
移动互联网、电子商务以及社交媒体的快速发展使得企业需要面临的数据量
成指数增长。根据 IDC 《数字宇宙》(Digital Universe)研究报告显示,2020 年
全球新建和复制的信息量已经超过 40ZB,是 2015 年的 12 倍;而中国的数据量则
会在 2020 年超过 8ZB,比 2015 年增长 22 倍。数据量的飞速增长带来了大数据
技术和服务市场的繁荣发展。IDC 亚太区(不含日本)最新关于大数据和分析(BDA)
领域的市场研究表明,大数据技术和服务市场规模将会从 2012 年的 5.48 亿美元
增加到 2017 年的 23.8 亿美元,未来 5 年的复合增长率达到 34.1%。该市场涵盖
了存储、服务器、网络、软件以及服务市场。数据量的增长是一种非线性的增长
速度。
据 IDC 分析报道,最近一年来,亚太区出现了越来越广泛的大数据和分析领
域的应用案例。在中国,从互联网企业,到电信、金融、政府这样的传统行业,
都开始采用各种大数据和分析技术,开始了自己的大数据实践之旅;应用场景也
在逐渐拓展,从结构化数据的分析,发展到半结构化、非结构化数据的分析,尤
其是社交媒体信息分析受到用户的更多关注。用户们开始评估以 Hadoop、数据
库一体机以及内存计算技术为代表的大数据相关新型技术。
最新调研结果显示,提高竞争优势,降低成本以及吸引新的客户是中国用户
对大数据项目最期望的三大回报。目前现有的大数据项目主要集中在业务流程优
化以及提高客户满意度方面的应用。IDC 发现很多用户希望大数据能够为企业带
来业务创新,并且开始使用高级分析的解决方案以管理复杂的数据环境。过去一
年中用户对社交数据的收集和分析应用的关注度增加明显。未来,地理位置信息
分析将会增长迅速,这也会推动用户对大数据安全和隐私管理的关注。在亚太区,
澳大利亚和新加坡的用户对大数据的相关投资主要在咨询服务方面,更关注如何
根据新的最佳实践需求设计和实施方案。中国和印度在大数据领域的硬件投资则
非常明显,更倾向于数据中心相关的基础架构的投资。
在传统的数据分析与商业数据挖掘中,人们通常遵循二八原则。也就是任务
20%的用户提供了 80%的价值,因此利用优势资源用户对于少数用户的服务。随
着互联网的发展,越来越多的低价值用户进入到商业体系中,这部分用户成为商
业企业竞争的目标。比如电商行业,大量顾客都是传统意义上的低价值客户,数
据表明对于这部分用户价值的挖掘可以改变二八原则,甚至可达到价值的几乎均
匀分布。并且由于计算技术的发展,对于大数据的分析也成为了可能。
1.2 旅游行业开展大数据分析及应用的意义
旅游行业有行业广、规模大、移动性强的特点,因此更加依赖大数据。当前,
旅游业也在“新常态”下迎来了升级的挑战和变革的机遇,新常态对于一般的经
济部门是经济速度放慢、人均 GDP 增速减小,很多传统行业在调整结构,但新
常态对旅游行业却是速度加快的。旅游大数据的解决之道,在于整合国内多途径
的大数据源,形成旅游大数据生态,为国内旅游业提供大数据解决方案,促进旅
游业的转型升级。
1.3 数据挖掘与大数据分析科研平台建设的必要性
数据挖掘与大数据分析是以计算机基础为基础,以挖掘算法为核心,紧密面
向行业应用的一门综合性学科。其主要技术涉及概率论与数理统计、数据挖掘、
算法与数据结构、计算机网络、并行计算等多个专业方向,因此该学科对于科研
平台具有较高的专业要求。科研平台不仅要提供基础的编程环境,还要提供大数
据的运算环境以及用于科学研究的实战大数据案例。这些素材的准备均需完整的
科研平台作为支撑。
目前,在我国高校的专业设置上与数据挖掘与大数据分析相关的学科专业包
括:计算机科学与技术、信息管理与信息系统、统计学、经济、金融、贸易、生
物信息、旅游以及公共卫生等。这些专业的在使用科研平台时的侧重点各不相同,
使用人员层次水平也不相同,对算法的使用也不相同,因此,需要建设一个便利、
操作简易、算法全面、可视化的大数据科研平台是非常有必要的。
二. 数据挖掘与大数据分析科研平台总体规划
2.1 科研平台规划
科研平台建设的基本原则是科研为主,同时为教学实验提供部分计算资源及
安全资源,系统在授权范围内共享科研系统的计算资源,提高教学实验的真实性。
项目的总体架构如图 1 所示。
图 1.总体架构图
系统整体由千兆核心交换机作为核心节点,并以两个千兆接入交换机作为科
研与实验环境的交换节点。科研环境由我司开发的商业 Hadoop 集群为基础,上
层集成便于操作的大数据科研应用系统,集成 10TB 大数据案例集及可拖拽的数
据算法和可视化算法。
2.2 科研平台功能规划
本科研平台针对数据挖掘有大数据分析研究内容,兼顾科研与教学的需求,
既能满足科研工作中对大数据分析高性能平台要求也具有教学实验平台简单易
用的特点。
1) 大数据资源规划
内置商业级数据资源,按常见科研分类规划数据资源,可以直接用于科学研
究,具有数据资源授权管控功能。
2) 大数据分析功能规划
建设以商业版 Hadoop 为核心的大数据分析平台,系统提供 MapReduce 以及
Spark 等大数据挖掘功能。系统具有完整的管理调度功能。
3) 硬件资源功能规划
系统具有 24 个 Intel Xeon E5 CPU 计算能力,提供超过 40TB 的存储能力以及
1T 以上的内存,可满足 1000 任务共时计算内能,方便扩充。
剩余16页未读,继续阅读
资源评论
Mmnnnbb123
- 粉丝: 709
- 资源: 8万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功