没有合适的资源?快使用搜索试试~ 我知道了~
hadoop性能测试报告
资源推荐
资源详情
资源评论
Hadoop 調査報告書
エヌ・ティ・ティ レゾナント株式会社
株式会社 Preferred Infrastructure
平成 20 年 8 月 25 日
• 免責条項
本報告書はエヌ・ティ・ティ レゾナント株式会社 (以下「NTT レゾナント」)と株式会社 Preferred Infras-
tructure(以下「Preferred Infrastructure」) が作成したものですが、報告書の内容及び情報の正確性、完全性、
有用性について、NTT レゾナント及び Preferred Infrastructure は保証を行なっておらず、また、いかなる責
任を持つものでもありません。
本報告書の著作権は NTT レゾナントに帰属します。
本報告書の「プリントアウト」「コピー」「無料配布」は可能ですが、変更、改変、加工、切除、部分利用、要
約、翻訳、変形、脚色、翻案などは禁止します。
以上の点をご了承の上、ご利用ください。
• 執筆者
Preferred Infrastructure 太田一樹
NTT レゾナント 金田有二
• 本報告書に関する問い合わせ先
Preferred Infrastructure: E-mail: info@preferred.jp
NTT レゾナント 技術マーケティング部 E-mail: pr@nttr.co.jp
Copyright
c
° NTT Resonant Inc. 2008
i
更新履歴
日付 修正箇所 内容
2008 年 8 月 25 日 調査報告書公開
ii
1
目次
第 1 章 はじめに 8
1.1 目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
第 2 章 Hadoop の概要 9
第 3 章 GFS と HDFS の機能比較 10
3.1 GFS の概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.1.1 特徴 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.1.2 アーキテクチャ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.1.3 HDFS との関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2 機能一覧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.3 基本機能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.3.1 ディレクトリの作成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.3.2 ディレクトリの消去 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3.3 ファイルの作成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3.4 ファイルの削除 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3.5 削除ファイルのバックアップ・メタデータの自動削除 . . . . . . . . . . . . . . . . . . . . . . 14
3.3.6 ファイルの読み込み . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3.7 ファイルの書き込み . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3.8 ファイルのランダム読み込み . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3.9 ファイルのランダム書き込み . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3.10 ファイル・ディレクトリのリネーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3.11 ファイルリストの取得 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.3.12 ファイル属性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.3.13 ディレクトリ属性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3.14 ファイルのアトミックな追記 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3.15 スナップショット . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3.16 マスターによるチャンク・サーバの監視 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.4 管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.4.1 チャンク・サーバの動的な追加 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
目次
3.4.2 チャンクのリバランシング . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4.3 アクセスコントロール . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4.4 ロギング . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5 性能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5.1 最寄サーバーからの読み込み . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.6 耐障害性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.6.1 チャンクのバージョン管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.6.2 チャンクのチェックサム機能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.6.3 バックグラウンドでの自動チェックサム検査 . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.6.4 チャンク・サーバ障害時のチャンク自動レプリケーション . . . . . . . . . . . . . . . . . . . . 22
3.6.5 レプリケーション時の複数サーバーへの書き込み . . . . . . . . . . . . . . . . . . . . . . . . 22
3.6.6 接続・読み・書きエラー時のリトライ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.6.7 マスターによるオペレーションログの保持 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.6.8 オペレーションログのスレーブへの保持 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.6.9 オペレーションログからのマスターの復旧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.6.10 シャドウマスター (Read-Only なマスター) . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.7 考察 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
第 4 章 Google MapReduce と Hadoop MapReduce の比較 26
4.1 Google MapReduce の概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.1.1 特徴 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.1.2 アーキテクチャ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.1.3 Hadoop MapReduce との関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 機能一覧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3 基本機能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3.1 MapReduce プログラムの実行 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3.2 マスターによるワーカーの監視 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3.3 Shuffle 関数の指定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3.4 Map 処理・Reduce 処理でのタスク数の指定 . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.3.5 Map タスクの自動分割 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3.6 ワーカー台数の指定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3.7 入力・出力フォーマットの指定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3.8 自動カウンタ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3.9 ユーザ定義カウンタ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.4 管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.4.1 進捗状況のモニタリング . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.4.2 デバッグ目的でのローカルでの逐次実行 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2
剩余62页未读,继续阅读
资源评论
bluegreen315
- 粉丝: 13
- 资源: 19
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功