ディープラーニングがシステム開発の現場に起こす「相転移」
社内制度によってソニーに勤務しながらUCバークレーに研究留学し、オープンソースのディープラーニングフレームワーク「Caffe」の開発にも関わったという成平氏。本セッションでは、ディープラーニングの登場により、世のシステム開発者に求められるスキルも、企業が確保すべきノウハウも大きく変えるほどのパラダイムシフトが起こるという近未来予測が語られた。
画像認識を例にとった説明によると、まず従来型の機械学習による開発が中心であった時代は、何年ものあいだ進歩が乏しい状況であったという。しかし、ディープラーニングの登場によりその精度は急激な向上を見せ、2015年には人の認識性を超える数値をたたき出したそうだ。さらに、その精度向上は現在も停滞することなく、年率50%に迫る誤差の改善を継続していると語られた。
そのようにディープラーニングによる認識性能が人を超えると、世の中に何が起こるか。性能が低かった時代は、精度よりも効率を重視するような限定的なシーンでのみAIを活用していたが、人力より高品質で速く、かつ安いという状況になったことで、あらゆる場面で人間よりもAIを活用すべきケースが急増した。つまり、機械が人を超えたことにより、ディープラーニングの世界に「相転移(=水が熱で水蒸気になるように、環境によって物の様態が変わる現象)」が起き、一気に実用化が進んできたのが現在であるという。
企業が持つ「ノウハウ」という資産価値の急落
「相転移」により、ディープラーニングがどのようにパラダイムシフトを起こすのか。それを知るために、ディープラーニングの開発の流れを確認した上で、従来型のシステム開発手順と比較して見ていきたい。
ディープラーニングの開発は、まず(1)データセット(「入力」と「期待する出力」の多数のペア)の用意をし、次に(2)その入力と期待する出力の紐づけを行うニューラルネットワークの構造設計を行い、その上で(3)用意したデータセットで設計したニューラルネットワークを学習する、という3ステップとなる。
(1)のデータセットとは、数字画像の認識であれば、手書きの数字画像群が「入力」であり、「期待する出力」が0~9という実際の数字になる。それらは単に用意するデータであり、開発者が設計するのは(2)のニューラルネットワークの部分。この設計を担当するにはある程度のノウハウは必要であるものの、後述するソニー開発のGUIツールなどを活用することによりビジネス部門の社員も扱えるようになりつつある領域であるという。
上記のようなディープラーニングの開発における特徴として何より強調されたのは、その開発ノウハウは汎用的なものであって、一度学んだノウハウをもとに入力と期待する出力さえ変えればさまざまなソリューションに応用できるということだ。
例えば、インプットを音声にしてアウトプットを文字列とすれば音声認識技術としても活用できる。さらにその音声や文字列に英語や日本語などの言語的側面を加えれば、翻訳ソフトにも使える。他にもチャットボットや画像の自動加工など、その応用範囲はINとOUTの発想次第でどんどん広がっている。このように、データさえ変えれば同一技術でさまざまなことを実現できるという汎用性の高さ。これこそ、ディープラーニングが今後の開発プロセスを新たなものとし、パラダイムシフトを起こすというポイントである。
上記の流れを従来型のシステム開発と比較してみよう。先の数字画像認識の例でいえば、従来ならまず手書き文字の画像勾配を計算して、そこから統計情報をとり、旧来の機械学習を適用して判別分析し……という手順を踏んでいた。このような開発を行う担当者は、ドメインの知識も必要とされ、各モジュールに対するきめ細やかな実装も求められる(これは「実現できる機能の複雑さ」が「プログラム量」に比例していた、と表現された)。その上、この開発はあくまでこの画像認識固有の技術的開発であり、そのまま音声認識や翻訳などに応用できるものではない。つまり、企業が持つべきなのは、さまざまな機能を開発するために必要な設計・開発の「ノウハウ」であったと言える。
ディープラーニング以後の世界では、我々はデータセットを用意し、分析はディープラーニングに任せるという開発手法に移行する。その際に必要なのはノウハウではなく、精度を向上させるための種々さまざまな「データ」である。つまり、これからの「実現できる機能の複雑さ」とは従来の「プログラム量」ではなく「データ量」に比例することとなる。それは、これまで資産とされていた企業の「ノウハウ」を無用なものにする可能性を秘めている。
ディープラーニングという「破壊的テクノロジー」の時代に向けて、今すべきこと
成平氏は、これまでに世の中を大きく変えた技術を「破壊的テクノロジー」と表現し、コンピュータ、インターネット、クラウドをその例に出した。そして、それらの系譜で次に来るものがAI(ディープラーニング)であるとしている。
ディープラーニングが人間の精度を超えることで起こる「相転移」により、あらゆる開発でディープラーニングが活用されることとなる。近年あらゆる企業が当たり前にクラウドを活用しているように、ディープラーニングが業種を超えて普及する時代。そんな時代に向け、企業は今何をして備えるべきか。
それは、とにかく早期にディープラーニング技術に取り組み、実践していくことだと成平氏は語る。自社の業務においてどの分野には活用しやすいのか、また難しいのかを学び、どのようなデータを集めておくべきかを実践から理解することが重要であるという。