「Microsoft AI プラットフォーム」で何が可能になるのか
最近のビジネスは、デジタルトランスフォーメーションといった言葉に表されるとおり、モノからサービスへシフトしている。「もはやあらゆる企業はソフトウェア企業だとも言えるように、モノにソフトウェア、データやコンテンツを組み合わせて顧客中心のサービスを提供している」と佐藤氏は力強く語る。
そしてそれらのサービスを実装するためには、巨大なコンピュータ環境が必要になっている。「データ量やサイズは年々増大している。例えば2020年、自動運転車が1日に約4000GBのデータを生成・消費し、飛行機からは1日に40TBのデータが生成されるようになると言われている」。そしてこれらの大量のデータを収集・処理しているのがクラウドである。
「クラウドは心配だ」との声は相変わらずあるが、マイクロソフトが2010年より提供している「Microsoft Azure」はセキュリティ、個人情報の保護、コンプライアンス、透明性の4点で、非常に信頼性のあるエンタープライズ向けパブリッククラウドだと佐藤氏は言う。しかもAzureでは100を超えるクラウドサービスを提供。「Microsoft AI プラットフォーム」もその一つである。
今、非常に注目されているAI(人工知能)だが、その言葉が登場したのは1956年にさかのぼる。「この年に人工知能という用語が使用されるようになり、その後、何度もブームと終焉が繰り返されてきた。近年、クラウドやGPUの進化などによって、深層学習(ディープラーニング)が問題解決に活用できるレベルになったことで、非常に広がりを見せている」と佐藤氏は語る。
そのエポックメーキングが、ImageNetという画像認識の精度を競うコンペティションにおいて、「2012年に、深層学習(ディープラーニング)を活用したことで画像認識率が約10%改善した結果を出したチームがいたことだった。それから深層学習(ディープラーニング)のブームが始まった」と佐藤氏。もちろんマイクロソフトもマイクロソフトリサーチという研究機関で、機械学習や深層学習(ディープラーニング)の研究に取り組んできている。「マイクロソフトリサーチが、2015年には画像認識で人間と同等の精度を150層ものネットワークからなる深層学習(ディープラーニング)で実現。また翌年の2016年には会話の音声認識で英語の会話の音声をもとに書き起こしたところ、人間を超えた」と佐藤氏は語る。
ここで佐藤氏はAIと機械学習、深層学習(ディープラーニング)の関係についても整理した。AIという技術カテゴリーの中に機械学習があり、その機械学習の実装方法の一つであるニューラルネットワークが進化したものが、深層学習(ディープラーニング)である。
「Microsoft AI プラットフォーム」は「クラウドベースのAIをあらゆる開発者に」をコンセプトとしたAIプラットフォームである。サービス、インフラストラクチャ、ツールで構成されている。サービスでは機械学習が容易にできる「Azure Machine Learning」、画像認識などのAIサービスが簡単に使える「Microsoft Cognitive Services」、カスタマーサポートの自動化が容易に実現する会話型AIを作るための「Microsoft Bot Framework」を提供。「これはC#とNode.jsで書けるフレームワーク」だと佐藤氏は説明を続ける。
インフラストラクチャではNoSQLサービス「Azure Cosmos DB」をはじめ、SQL Serverベースの「Azure SQL Database」や「Azure SQL Data Warehouse」、HDFSサービスの「Azure Data Lake Store」のほか、Sparkサービス「Azure HDInsight」、「Azure Databricks」、データサイエンスツールがインストール済みのVMイメージ「DSVM」(Data Science VM)、AIトレーニングサービス「Azure Batch AI」などを提供。さらには、コンテナーオーケストレーターであるKubernetesサービス「Azure Container Service」(AKS)、クラウドではなくエッジでの処理をサポートする「Azure IoT Edge」、そしてCPU、GPU、FPGAなどのコンピュータパワーも提供する。ツールではコーディング/管理ツールと深層学習フレームワークの2種類を用意。前者ではVisual Studio Tools for AI、Azure Machine Learning Studio、Azure Machine Learning Workbenchなど、AI開発者やデータサイエンティストが使うツールを用意。また後者ではMicrosoft Cognitive Toolkit(CNTK)をオープンソースで提供している。
「Microsoft AI プラットフォームはいろいろなモノを提供しているが、まずはMicrosoft Cognitive Servicesにフォーカスを当てたい」と佐藤氏は宣言し、Microsoft Cognitive Servicesの紹介を始めた。
Microsoft Cognitive Servicesは上図を見ればわかるとおり、「Vision」「Language」「Speech」「Search」「Knowledge」の5つのカテゴリーに分かれ、約30個のAPIを提供している。例えばVisionでは顔認証や感情認識、Languageでは自然言語処理やテキスト翻訳、音声翻訳、Speechでは音声認識や話者分析、Searchでは画像や動画の検索、Knowledgeでは論文探索やカスタムのFAQサービスなどのAPIが提供されている。
佐藤氏によれば、「ほとんどのAPIは汎用用途のためにマイクロソフトがトレーニング済みなので、カスタマイズせずに簡単に使える。画像認識や音声認識、検索など一部のAPIにはカスタマイズ可能なものも用意している」という。
とはいえ、コンピュータがモノを認識できることにどんな価値があるのか。猫の写真を見せて「猫」だと認識できるだけだと、価値があるとは思えない。そこで佐藤氏は、レタス農家の例を挙げてAIの価値について説明した。レタス農家の悩みは雑草とレタスを一緒に収穫したくないことと、雑草をなくすために大量の農薬にお金が必要であることだ。「コンバインとAIを掛け合わせることができれば、農薬を大幅に削減し環境に優しい、オーガニックでおいしい野菜ができるかもしれない。こういった形でAIを既存の仕組みの中に統合することで、作業を効率化したり、今までなかった価値を提供したりできる」と佐藤氏は力強く語った。