如何面试3.docx_大数据面试准备哪些资源-CSDN文库

版权申诉

144 浏览量 2023-08-08 15:07:44 上传评论收藏 214KB DOCX 举报

资源推荐

资源详情

资源评论

项目介绍

一、自我介绍

大家好，面试官好！

我叫 xxx 毕业于 xxxx，就读专业也是计算机系的，自学过 java，但为什么

会想往大数据开发方向发展呢？因为自己有网购的习惯，以及近年内抖音的火爆，

就像知道这里面是如何根据用户的行为给用户推荐相关的商品，通过一些资料的

了解，知道了大数据这个概念，就越发引起我的好奇心，觉得大数据非常有发展

潜力，因此确定要进入发展。

于是，我找来了大数据开发相关的资料，通过半年多的时间，有针对性地对

大数据生态体系中各种常用的框架进行学习：像数据传输层使用的 flume、kafka，

数据存储层的 hdfs、hbase，资源管理层的 Yarn，数据计算层的 Hive 数据查询、

MapReduce 离线计算、Spark streaming 实时计算，使用 Azkaban 可以进行任务

调度。在一次偶然的机会，我的表哥所在的公司开始重视大数据这块，于是，在

他的带领下进到了公司进行实习操作。

之前的 1 年多时间，一直在公司从事大数据开发，包括数据平台的搭建和维

持运行，以及项目里的离线计算、实时分析。因为刚起步，数据平台的搭建都是

从 0 到 1，包括服务器的选型、框架版本选型；后来到数仓项目的创建，包括建

模、指标分析、数据质量监控等等。

二、从服务器购买开始规划大数据

1 确定集群规模

1.1 服务器的选择

12 台物理机：128G，8T 机械硬盘，2T 的固态硬盘，20 核 40 线程的 CPU，

戴尔 4 万左右一台

云服务器：相同的配置，在阿里云 5w/年。

对比：云服务器的运维由阿里云完成，物理机需要托管服务器，需要专门的

运维人员以及电力成本，总和对比下，物理机的费用跟云服务器的成本差不多。

所以选择云服务更加的方便。

剩余24页未读，继续阅读

内容反馈

版权申诉

AI_Maynor

粉丝: 7w+
资源: 153

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip