開発者のための情報メディア

ニュース

新規
会員登録

翔泳社新刊紹介

強化学習と深層学習を組み合わせると何ができるのか？『現場で使える！Python深層強化学習入門』発売

渡部拓也[編]

2019/08/07 07:00

ポスト

ポスト

　Alpha Go（アルファ碁）でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした『現場で使える！Python深層強化学習入門』が8月7日に発売となりました。

『現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御』は、Alpha Goにも利用されている深層強化学習を、この分野の初学者向けに解説した入門書です。

「はじめに」より

　2016年、Google DeepMindによるAlphaGoが囲碁でプロ棋士を打破したというニュースは、衝撃とともに世界中に拡がりました。その打ち手のパターン数が膨大であることから、人間には遠く及ばないだろうと考えられていた囲碁ゲームにおいても、機械学習ベースの人工知能が人間を凌駕し得ることを示した事件でした。このAlphaGoを支えている技術が、深層強化学習に他なりません。

　本書では、近年、大きな注目を集めるに至った深層強化学習のアルゴリズムを基礎から解説し、具体的な問題への適用について実装例を示しながら紹介します。

　本書は大きく分けて2部構成になっています。

　第1部では、まず、深層強化学習の概要について説明します。次いで、強化学習の基礎（Q学習、方策勾配法、Actor-Critic法）と深層学習の基礎（CNN、RNN、LSTM）を解説します。さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

　第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

　1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

　2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。

　3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。

　全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。

目次

第1部基礎編
第1章強化学習の有用性
第2章強化学習のアルゴリズム
第3章深層学習による特徴抽出
第4章深層強化学習の実装

第2部応用編
第5章連続制御問題への応用
第6章組合せ最適化への応用
第7章系列データ生成への応用

現場で使える！Python深層強化学習入門

Amazon　SEshop　その他

現場で使える！Python深層強化学習入門
強化学習と深層学習による探索と制御

著者：伊藤多一、今津義充、須藤広大、仁ノ平将人、川崎悠介、酒井裕企、魏崇哲
発売日：2019年8月7日（水）
価格：3,672円（税込）

本書について

AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

この記事は参考になりましたか？

連載通知を行うには会員登録(無料)が必要です。
既に会員の方はを行ってください。

印刷用を表示

ポスト

翔泳社新刊紹介連載記事一覧: ユーザーデータをゲーム開発や運営に活用する『ゲームを進化させるデータ分析完全ガイド』発売

知識ゼロからAzureとクラウドの基本がわかる入門書『Azure1年生クラウドのしくみ』...

元PIVOTの1人目PMがプロダクト事業で儲ける勘所を解説した『勝てるプロダクト開発の教科...

もっと読む

この記事の著者: 渡部拓也（ワタナベタクヤ）

翔泳社所属。翔泳社から刊行した本の紹介記事などを執筆しています。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

この記事は参考になりましたか？

この記事をシェア

ポスト

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料