DataRobot社の紹介と"深層学習"熱の高まり
シバタ氏が現在在籍しているDataRobot社は、本社をボストンに構え、汎用機械学習プラットフォームを提供しています。トップ"kaggler"(世界で30万人以上が登録する、データサイエンティストのコンペプラットフォームの挑戦者)が多数在籍しているのも特徴で、データサイエンティストが中心となっている組織です。
シバタ氏が携わっているコミュニティ「PyData」では開始当初から深層学習をウォッチして来ており、今回のセッションでトピックとして取り上げている「TensorFlow」が出てきた時にも、リリース後即関連勉強会を催しています。「昨年1年の動きを見るだけでもすごく盛り上がっていた。ディープラーニングが大きく動いた年でもあります」とシバタ氏はこここまでの深層学習まわりの動向を振り返りました。
機械学習と深層学習
シバタ氏が本日伝えたいこととして掲げたメッセージは「あなたも人工知能が使えます。使ってください。」というシンプルなものでした。機械学習・深層学習との位置付けで言うと、「人工知能」を構成する要素の中に「機械学習」があり、更にその機械学習という大きな括りの中に「深層学習」がある、という形となります。
深層学習は、まず始めに深層学習アルゴリズムの画像処理における性能が凄いらしい、もしかしたらこれは人間を超えてしまう、置き換えてしまうのではないか? と言うところから注目され始めました。メディアでも取り上げられることが多くなり、関連するスタートアップ企業もとりあえずその波に乗っかり、またそういった流れを特に止めるものも無かったために現在の状況に至っている部分がある、とシバタ氏はコメントしました。
「機械学習」とは、コンピューターアルゴリズムにデータを分析させ、パターンを学習させることで予測や識別等の問題を解かせることを指します。「教師あり学習/教師なし学習」と言った学習パターンの種類や、「回帰分析」「クラスタリング」等といった手法についても機械学習に興味をお持ちの方であれば耳にしたことがある方も多いことでしょう。「深層学習」はこの"手法"のうちの一つとなります。どういうデータをアルゴリズムに入力させて、どう解かせるかは入力データの内容や手法によって様々な選択肢があります。機械学習の歴史はかなり長く熟成されてきており、現在ではビジネスの分野でも広く応用されています。
シバタ氏は、機械学習の現在の位置付けを「料理の仕方」について例え、深層学習前の機械学習技術については「ボタンを"ポチッとな"するだけで欲しいデータを得るところまで来ており、これができるサービスがDataRobotです」とコメントしました。当日セッションではDataRobotの実演デモを見ることができましたが、ファイルのドラッグアンドドロップや簡単なUI操作であっという間に分析結果が得られるのには半ば拍子抜けしてしまいました。人手で何時間・何日も掛かるような作業を非常に短い時間で行ってくれて、REST APIもシンプルな操作で生成できることをデモで確認することができました。
「深層学習」とは、"神経回路"にインスパイアされたニューラルネットワーク(神経回路網:脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデル)型アルゴリズムの「隠れ層」と呼ばれるものを多段にする(=層が深くなる)ことで、学習能力を高めたものとなります。層を増やすとその分決定させるためのパラメータも増やさなければならず、大変な部分でした。深層学習では画像や音声等も入力データとしてダイレクトに扱えるようになり、問題を解決するための判別に用いる質の高い「特徴量」をデータから作れるようになりました。