Pentaho(ペンタホ) ― BIツール
企業活動を続けていくと、さまざまなデータが蓄積されていきます。このデータを正しく分析することにより、今まで直感的に理解していた製品の売れ行きの傾向をきちんと裏付けることができたり、今まで気がつかなかった傾向を見つけだしたりできるようになります。このように蓄積されたデータを集計、分析するアプリケーションが、BI(Business Inteligence)ツールです。ここでは、オープンソースのBIツールとして、Pentahoを取り上げて説明します。
Pentahoとは、米国Pentaho社が中心となって開発を進めているBIツールで、その中の基本的な機能は、オープンソースソフトウェアとして公開されています。
オープンソース版のPentahoは、Pentaho BI Community Editionと呼ばれ、日本語化されたものは、Pentaho 日本語サイトから入手することができます。
Pentahoの機能を大きく分けると、以下のような6つに分類することができます。
- Pentaho BIプラットフォーム:
- Pentahoデータ統合:
- Pentahoレポーティング:
- Pentaho分析 (OLAP):
- Pentahoダッシュボード:
- Pentahoデータマイニング:
BIツールの基盤となるプラットフォームを提供します。たとえば、スケジューリングやアラート、他のツールへの統合インターフェースなどの機能をフレームワークとして提供します。
さまざまなデータソースからデータを取得し、統合・加工することにより他の機能で利用できるデータに整形します。このようなツールはETL(Extract/Transform/Load)ツールと呼ばれます。グラフィカルなインターフェースを持ち、ドラッグアンドドロップでデータの流れを定義できます。
データソースより取得したデータをもとに、レポートを生成します。各種のRDBやXMLなど様々な形式のデータを読み込み、PDF、Excel、HTMLなどの形式で出力することができます。また、Eclipseベースのデザインツールを利用し、自由にレポートを生成することができます。
ROLAPをベースとした多次元データキューブを生成します。集計されたデータを地域や期間などの切り口で深く切り込んで分析していくことができます。
生成されたレポートやチャートなどを、画面上に一覧することにより、直感的にデータの傾向を把握できるビューを提供します。
データマイニングとは、大量のデータの中に埋もれている相関関係などの法則性を発見する技法です。GUIツールを用いて、データマイニングを行うことができます。
Pentahoは、いくつかのBIに関連するプロジェクトが集まって構成されています。たとえば、データ統合に関してはKettle、データ分析に関してはModrian、データマイニングに関してはWekaなど、それぞれの機能に対してプロジェクトがあり、それを統合して一つのBIスイート製品を構成しています。
それぞれの機能は、独立したアプリケーションとして動作しますが、ETLツールを用いてデータを整形し、それをOLAPを使って分析したり、レポートとして生成したりなど、組み合わせることにより、より高度にデータを扱うことができます。
PentahoはJavaで記述されていますので、Java 5がインストールされている必要があります。また、さまざまなデータベースをデータソースとして扱うことが可能で、たとえばMySQL、PostgreSQL、Oracleなどからデータを取得・格納することができます。
Pentahoのコミュニティ
Pentahoでは、オープンソースコミュニティ向けのサイトを提供しています。このサイトでは、オープンソース版のダウンロードサイトへのリンクや各プロジェクトのドキュメントWikiなどの情報を提供しています。また、フォーラムも提供されていますので、ここを利用して製品に関する議論に加わることもできます。
Pentahoに関する日本語の情報は、Pentaho 日本語サイトにまとめられています。
オープンソースに対する不安とサポート
オープンソースアプリケーションの利用において、問題が発生したらどう対応すればいいのかというのが、エンドユーザが最も気にする問題だと思います。多くのオープンソースプロジェクトでは、フォーラムなどがあり、そこで質問をすることや過去のやり取りをみることにより、ある程度の問題解決は可能ですが、やはりそれだけでは不安です。
多くのオープンソースアプリケーションでは、サポートや追加機能を含んだ有償の製品を提供しています。今回紹介した3つのプロダクトでも、それぞれ有償の製品を持っています。
SugarCRMでは、レポート機能やより細かな権限管理などSugar Community Editionより多くの機能を持ったSugar ProfessionalとSugar Enterpriseを、サポート込みで提供しています。Sugar Community EditionのライセンスはGPLですが、これらの2つのエディションは、独自の商用ライセンスで提供されています。
Compiereでは、Compiere Community EditionにPDFでレポートを出力する機能を追加したCompiere Standard Editionと、それに加えWebインターフェースを持つCompiere Professional Editionをどちらもサポート込みで提供しています。Compiere Standard EditionのライセンスはGPLですが、Compiere Professional Editionは独自の商用ライセンスで提供されています。
Pentahoでは、システム監視やシングルサインオンのサポートなどCommunity Editionに追加機能を付与したEnterprise Editionをサポート込みで提供しています。Pentahoのライセンスに関しては、サブプロジェクトごとに異なりますので、それぞれのサブプロジェクトの製品の利用に際して確認が必要です。
このように、今回紹介したアプリケーションもそれぞれサポート付きの有償の製品を提供していますので、ご利用の際には検討してみてはいかがでしょうか。
まとめ
オープンソースソフトウェアは、OS、データベース、ミドルウェアなどさまざまなレイヤに浸透し、業務アプリケーションのレイヤにも登場しています。本稿では、オープンソースの業務アプリケーションとして、SugarCRM、Compiere、Pentahoを取り上げました。これらのアプリケーションは、十分に使用に耐えるものだと思います。また、オープンソースソフトウェアの特徴であるソースコードが提供されている点を活かして、商用アプリケーションではできないような深いレベルのカスタマイズを入れ、より現場にフィットするアプリケーションを構築していくことも可能です。サポートなどに不安がある場合は、それぞれのアプリケーションが提供している商用のライセンスを検討してみてもよいでしょう。
ここで紹介したアプリケーション以外にも、CMSやSNSなど様々な分野のアプリケーションもオープンソースソフトウェアとして提供されています。今後、この分野のオープンソースアプリケーションは注目です。