DataRobotなら誰もがデータサイエンティストのノウハウが使える
「だが今はDataRobotがある。これを活用すれば簡単にモデルが作成できる」とシバタ氏は力強く語る。それを実証するためデモを実施した。デモの内容は「3か月以内に携帯電話を解約する人を予測する」というもの。まずは予測モデルを作成するため、過去のデータを用意し、ドラッグアンドドロップでDataRobotに読み込ませる。次に予測したいターゲットを指定し、「開始ボタン」を押すだけで予測モデルが自動生成されるのだ。
「DataRobotには1000~2000ぐらいの機械学習アルゴリズムが用意されている。さらに複数のアルゴリズムを組み合わせたアンサンブルモデルも作ることができる」とシバタ氏は説明を続ける。「人間のサイエンティストであれば、一つのプロジェクトで予測モデルは1個か2個しか作ることができないが、DataRobotであればいくつでもつくることができる」(シバタ氏)。もちろん、複数のモデルをつくるのは時間がかるが、DataRobotであれば心配ない。サーバを動的に増やすことができるからだ。そのほかにもDataRobotにはモデルを解釈するツールやモデルを深掘りするためのツールも用意されており、「モデルを理解して説明することも容易になる」とシバタ氏は語る。
あとは最も精度が高いとされたモデルを適用してデータ分析を行うだけである。デモでは10件のデータを分析し、「3か月以内に解約する確率」を表示した。そこで示されている数字の根拠を説明できるよう、「リーズンコード」という機能も実装している。「DataRobotではブラックボックス化は禁止にしている。だから機械学習がなにをしているか理解できるような機能を提供している」とシバタ氏は力を込める。
これからは「ドメイン知識」「サイエンス力」「AIエンジニアリング力」が必要
DataRobotなどのツールが登場したことで、これからは誰もが簡単に機械学習技術を扱えるようになっていく。つまりドメイン知識(その業界、業務に就いているからこそ知っている知識)のある人が、そこでの課題を解決するために機械学習を利用できるようになるということだ。すでに「今までにあり得なかった価値の高い応用事例が生まれてきている」とシバタ氏は次のような具体例を挙げた。例えばある製造業では不良品の原因をDataRobotで特定し、検品を一部の高リスクの製品に限定することで、作業の負荷軽減を実現したという。そのために製造工程やQAテスト結果、製造ラインIoTデータを統合したり、不良確率に閾値を設けてアラートを出す仕組みなどを構築。そのほかにも冗長化したり、監視の仕組みを作ったりしている。このように、モデルを実世界に応用するためにシステムを構築し、各プロセスの自動化、定常化、ロバスト化を行い、システムを運用していくことがAIエンジニアリングである。
機械学習の導入はこれからどんどん進んでいく。「ドメイン知識、サイエンス力、AIエンジニアリング力。この3つの知識を身につけていくことが必要になる」とシバタ氏は語り、セッションを締めた。