Apacheプロジェクトが開発する分散コンピューティング・フレームワーク「Hadoop」の利用者が集まり、「Hadoop Conference Japan 2009」が13日(金曜日)に先端技術館@TEPIA(東京都北青山)で開催された。
Apacheプロジェクトが開発する分散コンピューティング・フレームワーク「Hadoop」の利用者が集まり、「Hadoop Conference Japan 2009」が13日(金曜日)に先端技術館@TEPIA(東京都北青山)で開催された。米国でHadoopのサポートを行うCloudera社によるプレゼンテーションや、国内での利用事例など計8セッションが発表された。定員240人の会場が満席となり、クラウドコンピューティング技術の一端となる「Hadoop」への関心の高さを伺わせた。
また、同カンファレンスでは、Hadoopの国内普及を目指す「Hadoopユーザー会」の設立も宣言された。Hadoopユーザー会は、現時点では特に会則や代表なども定めず、メーリングリストでのユーザー交流や情報交換を主な活動としている。
カンファレンスのメインセッションは、米国Cloudera社のChristophe Bisciglia氏による2つの講演「Making Hadoop Easy for a Growing Community」と「Setting up your Hadoop cluster」で、Hadoopをとりまく状況を解説すると共に、同社のHadoopディストリビューション「CDH(Cloudera Distribution for Hadoop)」などが紹介された。
Hadoopはオープンソースのプロダクトで自由に入手できるが、インストールして環境を構築するのは容易ではない。また、Hadoop上のデータをSQLライクに扱う「Hive」や、ラージ・スケールのデータ解析を行う「Pig」といったサブプロジェクトがあり、Hadoopの「エコシステム」をまとめて運用する必要もある。
そこでCloudera社では、インストールと運用を容易に行うディストリビューションとして「CDH」をリリースしている。CDHは現在、安定版の「CDH1」と開発版の「CDH2」があり、CDH1はHadoop 0.18.3をベースにHive 0.2.0とPig 0.3.0が含まれている。CDH2にはHadoop 0.18.3版と0.20.1版があり、それぞれ多数のパッチが当てられている。さらにCDH2には、スケーラブルな分散データベース「HBase」と、分散アプリケーションのコーディネーションサービス「Zookeeper」も含まれる。
Bisciglia氏によると、現在ではHadoopの利用企業はウェブ事業者や開発者にとどまらず、さまざまな領域で利用されるようになっている。例えば、VISAや JPMorganのような金融サービスなどでもHadoopが活用されている。そういった新しい利用者でも事業にHadoopを導入できるよう、Cloudera社ではCDHのほかにも「Cloudera Desktop」などのツール・サービスを提供している。
このほかカンファレンスでは、楽天やはてななど国内ウェブ企業での仕様事例や、10月に米ニューヨークで開催された「Hadoop World 2009」の報告、SI事業としての展望など多彩な講演が行われた。
【関連リンク】
・Hadoop Conference Japan 2009
・Hadoopユーザー会
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です