• 小文件存储SeaweedFS技术指南

    该文档包含以下内容: 1. SeaweedFS的架构和组件说明 2. SeaweedFS Master API 3. SeaweedFS Volume API 4. SeaweedFS Filer API 5. SeaweedFS的配置 6. SeaweedFS S3 API 7. SeaweedFS 与大数据Hadoop,Spark,Hbase,Presto的集成 8. SeaweedFS的复制和备份 9. 安全 10. 高级使用 11. 维护 该文档为英文版, 如需中文版的笔记欢迎与博主联系。

    0
    594
    2.55MB
    2023-05-06
    0
  • 大数据Spark面试题汇总

    大数据Spark面试题汇总,共有79道面试题以及题目的解答 部分题目如下: 1. spark 的有几种部署模式,每种模式特点? 2. Spark 为什么比 mapreduce 快? 3. 简单说一下 hadoop 和 spark 的 shuffle 相同和差异? 5. spark 的优化怎么做? 6. 数据本地性是在哪个环节确定的? 7. RDD 的弹性表现在哪几点? 8. RDD 有哪些缺陷? 9. Spark 的 shuffle 过程? 10. Spark 的数据本地性有哪几种? 11. Spark 为什么要持久化,一般什么场景下要进行 persist 操作? 12. 介绍一下 join 操作优化经验? 13. 描述 Yarn 执行一个任务的过程? 14. Spark on Yarn 模式有哪些优点? 15. 谈谈你对 container 的理解? 16. Spark 使用 parquet 文件存储格式能带来哪些好处? 17. 介绍 parition 和 block 有什么关联关系? 18. Spark 应用程序的执行过程是什么?

    0
    737
    307KB
    2023-04-12
    0
  • SeaweedFS 架构说明文档 英文版

    文档对SeaweedFS的架构进行了介绍,包括: Blob Storage File Storage Remote Storage Cache FUSE Mount Object Storage Hadoop Compatable File System APIs Replication and Backup Administration Security

    0
    46
    320KB
    2023-04-08
    0
  • draw.io画图工具 diagrams

    支持UML、流程图、ER图等 windows版本,免安装 visio竞品

    0
    283
    77.59MB
    2022-01-21
    0
  • 六一勋章

    第一年参加六一活动可得
  • 持之以恒

    授予累计1月发布8篇原创IT博文的用户
  • 勤写标兵

    授予累计1周发布3篇原创IT博文的用户
  • 笔耕不辍

    累计2年每年原创文章数量>=20篇
  • 知无不言

    回答1个问题,每日最多计数5次
  • 持续创作

    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 创作能手

    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户
  • 分享学徒

    成功上传1个资源即可获取
  • 新秀勋章

    用户首次发布原创文章,审核通过后即可获得
关注 私信
上传资源赚积分or赚钱