Apache Hiveは、Hadoop上で構築され、分散ストレージ上での巨大なデータセットの問い合わせや管理に対応したデータウェアハウス構築環境。ETL(Extract/Transform/Load)ツールを備えており、さまざまなデータ形式に対応する。また、Apache HDFSやApache HBaseなどに格納されたファイルへの直接アクセスが可能で、Apache Hadoop MapReduceとApache Tezフレームワーク上のクエリを実行できる。
今回リリースされたバージョン2.0.0では、substring_index関数(指定番目の区切り文字より前の文字列を返す)、quarter関数(四半期を扱う)、aes_encryptおよびaes_decrypt関数(暗号化/復号)の追加や、WHEREやINの列指定で複数列や式を指定可能になったほか、非常に多岐にわたる新機能の実装や機能改善、および不具合の修正が行われている。詳しくは、Apache Hive 2.0.0のリリースノート(英語)を参照のこと。
【関連リンク】
・「Apache Hive」(英語)
・Apache Software Fundation(英語)