Apache EMRは、Apache HadoopやApache Sparkなどのフレームワークと、Apache HiveやApache Pigといった関連するオープンソースプロジェクトの利用によって、データ分析やビジネスインテリジェンス処理ができる。また、近年のアップデートでは、サーバ/クライアントでのS3暗号化のサポート、Hive/DynamoDBコネクタによるデータのインポート/エクスポート/クエリ、CloudWatchメトリクスの改善などが行われている。
「Amazon EMR 4.0.0」には、パフォーマンスや使い勝手の改善、バグ修正などを含むアプリケーションの最新版「Hadoop 2.6.0」「Hive 1.0」「Pig 0.14」「Spark 1.4.1」が含まれる。また、コンソールからクラスタ設定を使用して、EMRクラスタを迅速に作成可能で、クラスタ作成時にデフォルト設定を編集できるようにした。
このほか、Apache Bigtopベースのパッケージングシステムの採用、多くのポートやパスのオープンソース標準への変更、クラスタ作成時のSpark on YARNのための設定オプションの追加などの変更が行われている。
【関連リンク】
・Amazon Web Services
・「Apache EMR」