CodeZine(コードジン)

特集ページ一覧

新GPUアクセラレータはディープラーニングに最適化――NVIDIA GTC Japan 2016基調講演

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2016/10/07 11:00

 エヌビディアは10月5日、東京・港区のヒルトン東京お台場にてテクノロジカンファレンス「GTC Japan 2016」を開催した。参加者は約4,000名と同イベントでは過去最大の規模となった。今年はGPUを利用したディープラーニングとその応用技術が主なテーマ。「ディープラーニングAI革命」と題されたNVIDIA CEOのジェンスン・ファン氏よる基調講演でも、ディープラーニングを実現する同社のGPU製品について言及があった。

NVIDIA 共同創設者・社長兼CEO ジェンスン・ファン氏
NVIDIA 共同創設者・社長兼CEO ジェンスン・ファン氏

 基調講演でファン氏は「AI革命の舞台が整った」と述べ、その背景として2012年に「GPUディープラーニングビッグバン[1]」が起こり、MicrosoftのDNNが2015年に画像認識の精度で人間を超え、2016年に音声認識でも一定の成果が上がったことを紹介。そうしたディープラーニングとその応用技術を支えるGPUの新製品として、9月に発表したGPUアクセラレータ「NVIDIA Tesla P4」と「同 Tesla P40」を取り上げた。

 Tesla P4と同P40には、「ディープラーニングに最適化されている」(ファン氏)というPascalアーキテクチャを採用。両製品はユーザーやデバイスからクエリに反応して、学習済みのディープ・ニューラル・ネットワークを使用して音声や画像、テキストを認識する「推論」を行う。処理は高速で、発表後1年足らずの同社GPUソリューションの4倍、CPUの45倍で反応できるとしている。

 Tesla P40は、1秒当たり47テラ・オペレーション(TOPS)の推論パフォーマンスを実現。Tesla P40アクセラレーターを8個搭載したサーバーは、140個以上のCPUを搭載したサーバーと同等になるという。

 Tesla P4は50ワットで動作するエネルギー効率の高さを特徴とする。実稼働ワークロードでの推論におけるエネルギー効率は、CPUの40倍に及ぶという。特に、大量のコンピューティングリソースを集約するデータセンターで必要な「特殊なGPU」(ファン氏)としての需要を見込んでいる。

 また、Tesla P4と同P40と併せて発表されたソフトウェアライブラリ「TensorRT」は、性能最適化推論処理エンジンとしてディープラーニングモデルを最適化し、スループットや処理効率を向上させる。基調講演の中では、TensorRTを使って最適化されたディープラーニングモデルの応用例として、ピカソのタッチを学習したディープラーニングモデルを使い、ビデオ撮影された風景動画をリアルタイムでピカソの画風に加工して表示するデモを披露した。

東京・渋谷のハチ公前交差点で撮影した動画をリアルタイムに絵画風に加工して表示
東京・渋谷のハチ公前交差点で撮影した動画をリアルタイムにピカソの画風に加工して表示

 提供時期はTesla P4が11月、同P40が10月の予定。また、9月28日(現地時間)にはNVIDIAから、Pascalアーキテクチャを採用した同社GPU向けの開発環境「CUDA 8.0」が正式リリースされた。Tesla P4/P40にも対応しており、GPUとCPUの両メモリに仮想アドレスを通してシームレスにアクセスできるなどの新機能が追加されている。

[1]: 2012年に開催された画像認識の競技会「ImageNet」でトロント大学のチームがGPU上でディープラーニングを使い、他チームを大きく引き離す認識精度を出し、機械学習のブレイクスルーにつながったことを指す。

 
【関連リンク】
NVIDIA
NVIDIA TensorRT(英語)
CUDA Toolkit(英語)

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
All contents copyright © 2005-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5