このページは巨大な分散コンピューティングモデルに関するMapReduce、Hadoop、EMRの違いに関して説明します。
比較は以下の表の通りとなります。
比較表 | MapReduce | Hadoop | EMR(Amazon Elastic MapReduce) |
概要 | 分散コンピューティングのモデル。巨大データを処理。 | 大規模データの処理ソフトウェアフレームワーク。オープンソース。 | AWS のHadoop などのサービス。 |
特徴 | Google が検索エンジンで利用している巨大データ処理方法を論文で発表。このモデル名が「MapReduce」。 | 「MapReduce」を元に独自の機能を加えつつソフトウェア化したもの。 | Hadoop フレームワークを提供。その他Apache Spark など。Hadoop環境の構築は一般的に難しく時間がかかるが、このサービスにより構築コスト、期間を大幅減可能。 |