人工知能の技術全体を見渡せる本がなかった
――『あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識』は、倫理や社会などの文脈で語られがちな人工知能を、エンジニアが必要とする技術の面から解説しています。
執筆はバイオインフォマティクス技術者の多田智史さん、監修は東京農工大学特任教授の石井一夫さんということで、たまたま生物畑のお二人がタッグを組んだ形です。ぜひ最初に、経歴を教えていただけますか?
多田:私は元々プログラミングは趣味でやっていて、脳がどのように情報処理を行っているかにも興味を持っていたのですが、大学ではそれとは異なった実験動物を扱う生物工学を研究していました。就職する際、どちらの知識も活かせるところに進みたいと思い、バイオインフォマティクス(生命情報科学)をやっている今の会社に入社することにしたんです。仕事ではデータ解析を中心に、研究者の方の実験データを管理するデータベースシステムや解析システムを作っています。
石井:私は薬学部の出身ですが、遺伝子工学を専門とする会社に勤めた縁で1990年代後半頃からヒトゲノム解析に携わりました。その後はいろいろな大学や研究所などを転々とし、2011年に東京農工大学の特任教授に就任して、主にゲノム関連のデータ分析における教育・人材育成を行っています。また、情報処理学会でビッグデータ活用実務フォーラムを立ち上げ、外部に向けた情報発信もしています。
――まさに人工知能の技術面で最先端にいらっしゃると思いますが、本書はどういう意図で書かれたのでしょうか。
多田:人工知能に関係する書籍は領域ごとに分断されていることがほとんどです。そのため、これから勉強しよう、取り組もうというとき簡単に全体を俯瞰できるものがあるといいのではと感じていました。それが章構成に現れています。線形代数、統計、フーリエ変換などの解析、機械学習と深層学習、自然言語処理など、それぞれで1冊の本が書ける内容をまとめることを目的としました。
大学でも個別に科目があり、教科書も別になっているので、これらを一つにまとめているのは本書ならではだと思います。人工知能についてこれから学びたい、どんな領域があるのか知りたいという方にとっては全体に触れられるガイドとなっています。
石井:全体を見渡せる本がなかったというのはそのとおりです。あと、比較的新しい内容を盛り込んでいるのも特徴です。今、人工知能にしても機械学習にしても進歩がとても早く、登場したばかりの理論や技術が1年も経たないうちにデファクトになるのが当たり前です。
ところが、新しいキーワードが次から次に出てくるにもかかわらずきちんと定義されないままどんどん先に進んでいます。そこをきちんと取り上げて説明しているのがいいところですね。
これから人工知能を取り入れたいエンジニアのための教科書
――本書はどういう読者を想定されていますか?
多田:エンジニアで、これから機械学習や深層学習など人工知能を取り入れたサービスやプロダクトを開発しようと考えている方です。
15年以上前は専門的な技術を学んだ人がプログラミングやコンピュータエンジニアリングの道に進んでいたと思いますが、15年ほど前からは専門性、大学の学科を問わずシステムエンジニアになる人が増えてきました。
そういう人は数式に触れてこなかったかもしれませんが、やはり人工知能を扱うのであれば数式、数学の知識は不可欠です。本書では大学などで学ばなかったことを学べるようにしたかったという思いがあります。
内容は理数系の知識がないとかなり高度に感じるかもしれませんし、細かいところもできるだけ抑えていますので、数式などを十分に理解するには専門書の手助けが必要になります。ただ、本書を出発点に、数式にあまり馴染みがなかった方でも、人工知能を利用するプロダクト・サービスの開発に関心を持ってもらえればと思います。
石井:今までインフラ1本でやってきたエンジニアが、データ分析ブームのために上から「分析もやってくれ」と言われたとき、何からやればいいのかわからず途方に暮れがちです。そういう方にとって、本書はデータ分析の方法論を見渡せるので役に立つと思います。
この分野はにわかに新しいキーワードが出てきますから、エンジニアが顧客に説明しなければならないケースも多々あるでしょう。そんなとき、最低限の知識を持っておけば何かと便利です。本書が「俯瞰できること」に価値を置いているのはそういう意味もあります。
多田:本書は扱っている範囲が広いので、知りたかったこと以外の発見や気づきもあるのではないでしょうか。現時点においては、本書で紹介する分析方法を知っておかないと損をするかもしれませんので、ぜひ押さえておいていただければと思います。
3回目の人工知能ブームは「定着」する
――これまでにもあった人工知能ブーム、今回はどういうところが違うのでしょうか。
石井:今回は3回目で、深層学習(ディープラーニング)の登場が大きなトピックです。マシンリソースが最も重大な課題だったんですが、それが何千台ものコンピュータが連動するクラウドで解決されつつありますからね。
今までのブームは盛り上がってすぐ忘れ去られていったんですが、どうやら定着していきそうな気配があります。サービスやプロダクトとして世の中で実際に使われ始めましたから、このまま消えていくことはないでしょう。
多田:クラウドを利用すれば物理的なリソースが必要ないのでコストが下がりますし、誰でもとは言いませんが、1回目、2回目のブームの頃よりははるかに敷居が低くなっています。
――本書で紹介されている技術でいうと、具体的にはどういったサービスへの応用が考えられますか?
多田:主だったところでは、自動車産業や医療への応用です。自動車産業では画像認識の精度が向上し、自動運転技術も大幅に向上しています。国内メーカーも力を入れていて、国の後押しも期待できる分野ですね。医療では特に論文を大量にインプットすることで患者の症状から疾患に関する情報と治療方法などの提案を行う支援システムとして期待されています。
あとはチャットAIもそうです。これまではAIの反応を見て楽しむくらいしかできず、実用性はありませんでした。しかし、自然言語処理能力の向上によって問い合わせ対応ができるようになるなど、様々な商業的利用の実用性が増してきています。
自動車の自動運転に通じるところもありますが、農業への応用も期待されます。高齢者が多いので、コンバインの自動運転、生産管理といったところで重要な役割を担いそうです。
深層学習を扱うのはまだ難しいため、既存の機械学習の理解が重要
――では、本書の流れについて教えていただけますか?
多田:まずは人工知能の歴史に触れています。そのあと、歴史に沿って人工知能に関する技術を紹介していきます。最初に押さえたいのは機械が物事の判断をするルールベースの技術ですね。昔ながらのライフゲーム、人工生命についても紹介し、特に重要な線形問題を取り扱っています。
そしてAlphaGoでも使われているグラフ探索の話をしてから機械学習を取り上げます。そこでは統計的機械学習を扱うため、様々な統計モデルを紹介しています。人工知能の技術を学ぶうえで大事なところですね。
続けて、今後非常に重要な領域となると思われる強化学習について紹介しています。そうして深層学習を説明したあと、パターン認識と自然言語処理を解説しました。最後に分散コンピューティングなどを解説し、大規模データやIoTについて触れています。
この中では、自然言語処理は個人的にも面白いと思いながら書きました。今まで古典的な機械学習の自然言語処理がほとんどを占めていたところに深層学習をどう取り入れるか、研究者たちが試行錯誤してきたのかが見えてくるんです。ですから、ここはそれまでの章で紹介した技術の集大成のような形になっています。ばらばらに展開されてきた技術が統合されていくと、人工知能はより発展し、我々の生活も便利になっていくのではないでしょうか。
また、先ほど石井さんにお話しいただいたように、昨今のブームにおいて深層学習は外せない項目です。しかし、実際に取り組むとなるとまだまだ手軽ではない領域です。ちょっと手を入れようにも、どうしたらいいのか難しい。ネットワークができたとしても、偶然できたものというのが意外と多いんです。強化学習も含め、これらを自在に扱うにはもっと研究が進まないと厳しそうですね。ですから、研究開発をしていない企業はしばらく様子見をしつつ、機械学習に力を入れるといいかもしれません。
石井:既存の機械学習をやり尽くして、これ以上は無理だというところまでいかないと深層学習に取り組む意味がないでしょうね。ブームだからと取り組んでも効率が悪く、目の前の問題を解決するためなら他の方法のほうがいい可能性があります。
多田:機械学習でできることを深層学習でやるのは頭でっかちといいますか、小さな釘を打つのに巨大なハンマーを使う必要はありませんよね。対象とする問題に適した解法かどうかはよくよく検討していただきたいところです。
――最後に、本書に興味のある方に一言いただけますか?
多田:本書はサービスやプロダクトを開発するうえでの下地になる知識を盛り込んでいますので、アイデアを思いつくきっかけになると思いますし、すぐにではなくてもいつかいいアイデアを閃くかもしれません。読んですぐ思いつかなくても、ふとしたときに「そういえば本書にあったような」と思い出して確認していただけると嬉しいですね。
石井:人工知能の技術をいざ実装してみようというときには、PythonやRやSparkを利用すると思います。本書ではそのベースになる知識を紹介しているので、様々な場面で活用してみてください。