米Googleは、ビッグデータ分析基盤「Cloud Dataflow」と、その他の言語の実行環境を簡単に統合できる開発環境「Cloud Dataflow SDK for Java」を、12月18日(現地時間)にオープンソースで公開した。
Googleは、オープンソース化の理由として、ストリームとバッチを統合した処理モデルの提供、Dataflowプログラミングモデルの他の言語への適合、Dataflowの他のプラットフォームや処理系での実行の3点を挙げている。
ストリームとバッチを統合した処理モデルの提供については、テンポラリベースのアグリゲーションによって、バッチやストリームベースのデータソースで用いられるリッチなウィンドウプリミティブのセットを用意する。
Dataflowプログラミングモデルの他の言語への適合については、開発者に対してより多くの選択肢を与えるとともに、より多くのアプリケーションによる「Cloud Dataflow」へのアクセスを可能にすることを目的としており、現在Googleでは、今回提供を開始したJava版に加えて、Python 3版を開発中である。
Dataflowの他のプラットフォームや処理系での実行については、クラウド開発においてはスケーラビリティや高可用性などと同じくらい、ポータビリティが重要である、という同社の考え方に基づいている。
【関連リンク】
・Google
・「Cloud Dataflow SDK for Java」(GitHub、英語)
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です