项目介绍10.docx资源-CSDN文库

版权申诉

49 浏览量 2023-08-08 15:07:47 上传评论收藏 610KB DOCX 举报

资源推荐

资源详情

资源评论

1. 自我介绍

2. 从服务器购买开始规划大数据

3. 数据平台搭建及遇到问题解决方案

4. 数据仓库搭建及遇到的问题解决方案

5. 实时项目搭建及遇到的数据倾斜解决方案

1.自我介绍

各位面试官好，我叫 XXXX，2019 年毕业于 XXXX 学院物联网工程。上一份工作是

大数据发工程师。由于专业的关系，在大学就学习了计算机类的相关专业知识，物联

网本身就是在 5G 时代下追求物物相连、智能化的时代，从中产生的大量数据要如何处

理，由此让我对大数据处理这一方面有了兴趣，真正接触大数据是我们大三有一门课

程叫云计算，主要是介绍 hadoop 生态以及现阶段大数据各类处理的技术和常用手

段。所以课下时间，有对这一方面有一些了解和学习，专业关系，让我觉得大数据在

现阶段社会的发展具有很大的前景，因此想好在大数据这一行业中学习和发展。

基于这个想法，大四期间乃至上一份工作中，我开始在博客和一些网站上找更确

切的大数据领域开发的相关资料，以及在 apache 上下载一些稳定常用的框架，进行针

对性的学习。比如数据传输层一般使用的 flume、kafka，或者数据存储层中的 hdfs、

hbase，还是资源管理层 Yarn、数据计算层的 Hive 数据查询、MapReduce 离线计算、

Sparkstreaming 实时计算，并且可以使用 Azkaban 进行任务调度。

毕业之后，入职上一家公司，公司大数据部门处于起步阶段，部门中氛围比较

好，在去年一年中，从中学习到很多，工作中我主要做的是电商项目，由于起步阶

段，我有幸可以参与到项目其中，包括数据平台的搭建、数仓项目里的离线计算系统

和实时分析系统，都有参与到工作并且负责到其中某些功能、指标。数据平台的搭建

算得上是从无到有，包括服务器的选型、项目的架构、框架和半身选型；数仓的建

模、指标分析、数据质量监控等等。

2.从服务器购买开始规划大数据

2.1 确定集群规模

2.1.1 物理机 & 云主机

选物理机

剩余42页未读，继续阅读

内容反馈

版权申诉

AI+Maynor

粉丝: 7w+
资源: 167

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip