米Apache Software Fundationは、Hadoop上で利用可能なデータウェアハウス構築環境のメジャーバージョンアップ「Apache Hive 2.0.0」を、2月16日(現地時間)に公開した。
Apache Hiveは、Hadoop上で構築され、分散ストレージ上での巨大なデータセットの問い合わせや管理に対応したデータウェアハウス構築環境。ETL(Extract/Transform/Load)ツールを備えており、さまざまなデータ形式に対応する。また、Apache HDFSやApache HBaseなどに格納されたファイルへの直接アクセスが可能で、Apache Hadoop MapReduceとApache Tezフレームワーク上のクエリを実行できる。
今回リリースされたバージョン2.0.0では、substring_index関数(指定番目の区切り文字より前の文字列を返す)、quarter関数(四半期を扱う)、aes_encryptおよびaes_decrypt関数(暗号化/復号)の追加や、WHEREやINの列指定で複数列や式を指定可能になったほか、非常に多岐にわたる新機能の実装や機能改善、および不具合の修正が行われている。詳しくは、Apache Hive 2.0.0のリリースノート(英語)を参照のこと。
【関連リンク】
・「Apache Hive」(英語)
・Apache Software Fundation(英語)
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です