(可包括如下容,也可自行添加其他容)
1.概念、理论意义、实际意义
2.国外相关研究综述
3.本报告主要研究容与研究目标
4.创新点和不足之处
(一)大数据的概念
麦肯锡对大数据概念的解释是:大数据是指大小超过传统数据库软件工具抓取、
存储、管理和分析能力的数据群。
维基百科的表述是:大数据是难以用现有数据库管理工具处理的兼具海量和复
杂性特征的数据集成。
国专家涂子沛将大数据定义为那些大小已经超出传统意义上的尺度,一般的软
件工具难以捕捉、存储、管理和分析的数据。
对于“大数据”(Big data)研究机构 Gartner 给出了这样的定义:“大数据”是需要
新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高
增长率和多样化的信息资产
(二)理论意义
管理统计学课程是近年来经济管理类专业新开的专业基础课程,目的是培养经
管类学生能够把统计学知识运用到经济管理中来解决实际问题。随着社会的发展,
企业对经济管理类学生的数据处理能力有更高的需求,因此管理统计学的开设满
足经管类学生与企业的需求。随着云时代的到来和互联网技术的发展,大数据即
大数据技术出现了。
1.数据收集方式和容变化
以往的数据收集方法主要有统计调查和试验方法。根据实际研究需要,收集
社会经济现象的统计数据和自然科学领域的数据。这些数据是数字、文字等结构
化的数据。大数据时代,统计数据的产生方式呈现多样化,如有浏览痕迹、监控
视频、GPS 系统等产生方式,产生的数据多为非结构化数据很难用二维表格表示,
如所有格式的办公文档、文本、图片、HTML、各类图像和音频、视频信息等。结
构化数据出现,统计数据的收集方式和容将会改变。
2.数据处理的对象和方法放发生变化
管理统计学中推断统计学的参数估计方法和假设检验方法,主要采用抽样调
查法,利用样本数据的信息来估计或者计算总体参数情况。大数据不用随机分析
法(抽样调查)这样的捷径,而采用所有数据的方法。在大数据下,样本集总体,
处理数据不再仅仅依赖样本进行数据的推断统计。另外依靠小概率事件不可能发
生的参数估计和假设检验方法就失去了处理大数据的意义。但一些传统的数据分
析方法,如聚类分析、相关分析、回归分析等方法,仍然是可以使用的。虽然这
些传统的分析方法已经被应用于大数据领域,但是他们在处理规模较大的数据集
合时,效率无法达到用户预期,且难以处理复杂的数据。
3.大数据时代下传统统计学的变革
大数据时代的到来,给统计学的发展带来了前所未有的机遇,但同时,也对统计
学提出了更多的挑战。在此,本文将从以下 7 个方面阐述大数据时代下传统统计
学的变革。
(1) 样本概念的深化
除普查以外,传统统计学离不开样本,样本是研究中实际观测或调查的一部分个
体,一个可用的样本必须能够正确地反映总体情况。大数据时代,样本的概念不
再这么简单,由于此时数据大部分为网络数据,因此可以将其分为两种类型:
评论0