トップ棋士の李世乭(イ・セドル)九段に続き、世界最強の柯潔(カ・ケツ)九段を破った囲碁AIのアルファ碁。プロにも理解できない打ち筋を見せたアルファ碁は、一体どのようにして「次の一手」を判断しているのでしょうか。7月19日に刊行した『最強囲碁AI アルファ碁 解体新書』が三つの技術から迫ります。
『最強囲碁AI アルファ碁 解体新書』では、人類最強棋士を打ち破ったグーグル・ディープマインド社の囲碁AI「アルファ碁」を支える三つの技術、深層学習、強化学習、探索(特にモンテカルロ木探索)について解説。
アルファ碁に関する技術的な論文は本書の執筆時点で2本しかなく、1本は2016年1月に『Nature』で掲載されたグーグル・ディープマインド社によるもの、もう1本はその前身となるICLR2015の論文です。
本書ではこの2本の論文を紐解くことで、トップ棋士すら悩ますアルファ碁の謎多き「次の一手」がどのように判断されるのかを説明していきます。理工系・情報系の学生やエンジニアを対象にしてはいますが、アルファ碁の技術面を知りたい方にもおすすめの1冊です。
アルファ碁は、直感に優れたAI(深層学習)、経験に学ぶAI(強化学習)、先読みするAI(探索)の長所を組み合わせて作られています。従って、それぞれの技術を詳細に説明することが、アルファ碁の「次の一手」のメカニズムに迫ることになります。
その過程でAIに関する技術的な知見を得られることはもちろん、抑えがたい知的好奇心を満たすこともできるでしょう。アルファ碁の強さの秘密、知りたくありませんか?
また、今回は購入された方全員に特典として、本書の内容を俯瞰できる「囲碁AI・棋力の歴史&早わかり技術マップ」をプレゼントします。解説する各技術がアルファ碁全体の中でどういう位置づけになるのか、そして主要な技術の系譜とそれにともなう棋力の向上が一望できます。
特典のマップを見ながら、本書を読み進めてみてください。
目次
Chapter1 アルファ碁の登場
01 ゲームAIの歴史と進歩
02 天才デミス・ハサビスの登場
03 アルファ碁の活躍
04 囲碁AIの基礎
05 まとめ
Chapter2 ディープラーニング ~囲碁AIは瞬時にひらめく~
01 ディープラーニングとは
02 手書き数字認識の例
03 アルファ碁における畳み込みニューラルネットワーク
04 ChainerでCNNを学習させてみる
05 まとめ
Chapter3 強化学習 ~囲碁AIは経験に学ぶ~
01 強化学習とは
02 強化学習の歴史
03 多腕バンデット問題
04 迷路を解くための強化学習
05 テレビゲームの操作獲得のための強化学習
06 アルファ碁における強化学習
07 まとめと課題
Chapter4 探索 ~囲碁AIはいかにして先読みするか~
01 2人ゼロ和有限確定完全情報ゲーム
02 ゲームにおける探索
03 従来のゲーム木探索(ミニマックス木探索)
04 囲碁におけるモンテカルロ木探索
05 モンテカルロ木探索の成功要因と課題
06 まとめ
Chapter5 アルファ碁の完成
01 アルファ碁の設計図
02 非同期方策価値更新モンテカルロ木探索(APV-MCTS)
03 大量のCPU・GPUの利用
04 APV-MCTSの効果
05 アルファ碁の弱点
06 アルファ碁の先の未来
Appendix1 数式について
Appendix2 囲碁プログラム用のUIソフト「GoGui」およびGoGui用プログラム「DeltaGo」の利用方法
この記事は参考になりましたか?
- この記事の著者
-
渡部 拓也(ワタナベ タクヤ)
翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です