没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
1. 【简答题】数据仓库的特性包括?
面向主题的;集成的;相对稳定的;反映历史变化的
2. 【简答题】HDFS 要实现哪些设计目标?其局限性有哪些?
设计目标:复杂的文件模型;兼容廉价的硬件设备;流数据读写;强大的跨平台兼容性
局限性:不适合低延迟数据访问;无法用于大规模数据存储;无法高效存储大量小文件;不支持多用户写入及任
意修改文件
3. 【简答题】推荐方法包括哪些?
1,专家推荐;2.基于统计的推荐;3.基于内容的推荐;4.协同过滤推荐;5.混合推荐
4. 【简答题】什么是长尾理论?
电子商务网站销售的商品种类繁多,虽然绝大多数商品不热门,但是这些不热门的商品数量极其庞大,所累积
的总销售额非常可观,可能会超过热门商品的销售额。这部分商品就是长尾商品,推荐系统通过发掘用户的行
为记录,找到用户的个性化需求,发现用户潜在的消费倾向,从而将长尾商品准确地推荐给需要它的用户,进而
提升销量,实现用户与商家的双赢。这就是长尾理论。
5. 【简答题】传统数据采集和大数据采集的区别
1.数据源不同:传统数据采集来源单一,数据量相对较少,大数据采集来源广泛,数据量巨大;2.数据类型不同:传
统数据采集的数据结构单一,大数据采集数据类型丰富,包括结构化、半结构化和非结构化;3.数据存储不同:
传统数据采集来的数据存储在关系数据库和并行数据仓库中,大数据采集存贮在分布式数据库或分布式文件
系统。
6. 【简答题】典型的机器学习算法包括哪些?
1.分类;2.聚类;3.回归分析;4.关联规则分析;5.协同过滤
7. 【简答题】大数据在餐饮行业的应用主要包括
1.大数据驱动的团购模式;2.利用大数据为用户推荐消费内容;3.利用大数据调整线下门店布局;4.利用大数据
控制店内人流量
8. 【论述题】狭义的数据分析和数据挖掘的区别
1.在定义层面。数据挖掘是指从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且
有价值的信息和知识的过程。 2.在作用层面。数据分析主要实现:现状分析、原因分析、预测分析(定量)。
数据分析先做假设,然后通过数据分析来验证假设是否正确,从而得到相应的结论。数据挖掘主要侧重解决四
类问题:分类、聚类、关联和预测(定量、定性),数据挖掘的重点在寻找未知的模式与规律;如著名的数据挖掘
案例——啤酒与尿布,就是事先未知的,但又是非常有价值的信息。 3.在方法层面。数据分析主要采用对比
分析、分组分析、交叉分析、回归分析等常用分析方法;数据挖掘主要采用决策树、神经网络、关联规则、
聚类分析等统计学、人工智能、机器学习等方法进行挖掘; 4.在结果层面。数据分析一般都是得到一个指标
统计量结果,如总和、平均值等,这些指标数据都需要与业务结合进行解读,才能发挥出数据的价值与作用。
数据挖掘则是输出模型或规则,并且可相应得到模型得分或标签,模型得分如流失概率值、总和得分、相似
度、预测值等,标签如高中低价值用户、流失与非流失、信用优良中差等。
9. 【论述题】机器学习的概念及其与数据挖掘的关系
1.机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专
门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改
善自身的性能,它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 2.
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘可以视为机器学习与数据库
的交叉,它主要利用机器学习界提供的算法来分析海量数据,利用数据库提供的存储技术来管理海量数据。
3.从知识的来源角度而言,数据挖掘领域的很多知识也“间接”来自于统计学界,之所以说“间接”,是因为统计学
界一般偏重于理论研究而不注重实用性,统计学界中的很多技术需要在机器学习界进行验证和实践并变成有
效的机器学习算法以后,才可能进入数据挖掘领域,对数据挖掘产生影响。
10. 【论述题】请论述区块链和大数据的关系
资源评论
大数据小牛马
- 粉丝: 305
- 资源: 6
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功