なぜコグニティブなシステムが必要となるのか。簡単なオペレーションは、やがて機械に置き換えられ、人はよりクリエイティブな仕事に従事し、データをもとに人が認知・判断する支援を行うソリューション、つまりコグニティブなシステムが重視されるようになると考えられる。
IBMアナリティクス事業部長の三浦美穂氏は、より価値のある洞察をデータから引き出すには、構造化データの見える化などによる「現状把握」から、センサーからの非構造化データを交えた将来の「予測」、さらには音声や画像、自然言語処理インターフェースを組み合わせ、次に取るべきアクションを教示する「最適化学習」と、分析対象の幅を広げていくことが必要だという。いずれの段階でもデータを整備し使いやすい状態にする必要があり、それらを支えているのがアナリティクス事業だ。
そして、データ活用を促進するための戦略として「Open for Data」を発表した。
ここでの「Open」は2つの意味があり、一つはデータ活用環境がオープンであること。オープンソースソフトウェアを活用し、外部のデータソースと接続することもでき、技術的に開かれている。
もう一つは、データそのものがオープンなことだ。データを提供する器だけでなく、活用するデータ自体の資産価値を重視し、データを流通させるための仕組みとしてデータマーケットプレイス「Analytics Exchange」を現在ベータ版として公開している。TwitterやFacebookとの提携や、昨年に気象関連情報サービスのウェザーカンパニーの買収なども行った。
IBMでは、Open for Dataの戦略を支える製品群を、DB2、PureData System、Cloudantをはじめ、すでに多数擁しており、最近ではトランザクション型に拡張されたDBaaS「dashDB Transactional」や、オープンソースのNoSQL関連サービスをSoftLayerやAWS上のDBaaSとして提供する「Compose Enterprise」をリリースしている。クラウド型のデータ分析環境サービス「IBM Cloud Data Services」に含まれている。
また、リレーショナルデータベースの新版「DB2 11.1」が6月15日に、日本では金融系を中心に導入実績があるETLツールのクラウド版「DataStage on Cloud」が6月10日にリリースされる予定だ。
事例としては、富士重工業での運転支援システムの実験映像データ解析、レイ・フロンティアの行動ログ分析基盤、ランニングアプリ「RunKeeper」の大量データ収集が紹介された。
データ活用人材の育成支援も重視し、従来オンライン型で提供していた講座「Big Data University」を、今年からクラス形式のハンズオンやレクチャーとして国内外の講師を招き、毎月50~100人の規模で実施する。また、IBM以外のスペシャリストも多数招へいするデータサイエンティスト・データエンジニア向けのイベント「IBM Datapalooza(データパルーザ)」のワールドツアーも実施し、日本では6月15日・16日に開催される。また、データ分析コンテスト「SPSS Datathon 2016」の開催も予定している。
アナリティクス事業本部の田中裕一氏が、技術的な観点から補足し、データの活用環境において現在、「データ分析基盤の構築コスト」「運用人材の確保」「データサイエンティストの不足」の3つのハードルがあるとし、オンプレミス環境に加え、オンデマンドで使えるマネージドなデータ分析のクラウドサービスや、Watson Analyticsといった分析サービスで、IBMは問題解決を支援していくとした。
また、技術的にはHadoopやSparkによる分析基盤構築が一般化してきているが、それだけでは完結せず、データの収集、加工、分析、レポート、アプリとの連携など、その上にさまざまなデータ活用ツールが必要になってくる。IBMでも、そのような周辺技術を拡充してきており、その枠組みの中で新しいコンポーネントとして紹介されたのが、QuarksとComposeだ。
Quarksは、IBMが提案しApache Incubatorとなっているオープンソースのプロジェクトで、IoTのエッジデバイス側で動作するランタイム。通常、通信状態や同期処理、通信量などを考慮する必要があるIoTデバイスからのデータ収集をより簡単に実現できるソリューションとなっている。
Composeは、昨年IBMが買収した技術をベースにしたもので、MongoDB、Redis、Elasticsearch、PostgreSQL、RabbitMQ、RethinkDB、etcdといったオープンソースのNoSQL技術をマネージドなクラウドサービスDBaaSとして提供するもの。分析したデータとアプリとの連携の効率化が見込まれる。
【関連リンク】
・IBM Cloud Data Services
・Analytics Exchange
・Big Data University
・Datapalooza Tokyo