米Amazon Web Services(AWS)は、Apache HadoopやApache Sparkといったビッグデータフレームワークの実行を容易にし、AWS上における大量のデータ分析を可能にするマネージドなクラスタプラットフォーム「Amazon EMR(Elastic MapReduce) 4.0.0」を、7月24日(現地時間)にリリースした。
Apache EMRは、Apache HadoopやApache Sparkなどのフレームワークと、Apache HiveやApache Pigといった関連するオープンソースプロジェクトの利用によって、データ分析やビジネスインテリジェンス処理ができる。また、近年のアップデートでは、サーバ/クライアントでのS3暗号化のサポート、Hive/DynamoDBコネクタによるデータのインポート/エクスポート/クエリ、CloudWatchメトリクスの改善などが行われている。
「Amazon EMR 4.0.0」には、パフォーマンスや使い勝手の改善、バグ修正などを含むアプリケーションの最新版「Hadoop 2.6.0」「Hive 1.0」「Pig 0.14」「Spark 1.4.1」が含まれる。また、コンソールからクラスタ設定を使用して、EMRクラスタを迅速に作成可能で、クラスタ作成時にデフォルト設定を編集できるようにした。
このほか、Apache Bigtopベースのパッケージングシステムの採用、多くのポートやパスのオープンソース標準への変更、クラスタ作成時のSpark on YARNのための設定オプションの追加などの変更が行われている。
【関連リンク】
・Amazon Web Services
・「Apache EMR」
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です