CodeZineを運営する翔泳社より、4月17日(金)に書籍『PagerDutyによるインシデント管理実践入門』が発売となりました。
本書はシステムのインシデントを管理するプラットフォーム「PagerDuty」の使い方だけでなく、ICS(インシデントコマンドシステム)とSRE(Site Reliability Engineering)に基づいた組織としてのインシデント対応力を高める方法まで解説した書籍です。
「検知→トリアージ→動員→解決→学習」というインシデントライフサイクル全般を網羅し、Event Orchestrationによる高度なノイズ削減、Service Graphによる影響範囲の可視化、AI(PagerDuty Adevance)を活用した最新の自動化手法も丁寧に説明しています。
障害対応が終わってそのままにしないための「ポストモーテム」の考え方やJeliを活用した振り返り手法も学べるので、PagerDutyの単なる説明書ではなく、インシデント管理の教科書として読んでいただける1冊です。
目次
Chapter 1 インシデント管理の必要性とPagerDutyの役割
Chapter 2 PagerDutyの基礎
Chapter 3 検知 イベントをPagerDutyに連携する
Chapter 4 トリアージ 一次対応を自動化する
Chapter 5 動員 担当者を確実にアサインする
Chapter 6 修復 組織で連携し、原因特定と復旧を行う
Chapter 7 学習 インシデント対応から学び、改善する
Chapter 8 PagerDuty Advanceの活用
Chapter 9 運用の成熟度を上げるには
Chapter 10 サポート活用ガイド
この記事は参考になりましたか?
- 翔泳社 新刊紹介連載記事一覧
-
- 気合と根性を卒業し仕組みの障害対応へ 『PagerDutyによるインシデント管理実践入門』...
- 要件定義の機能不全、予算超過、遅延を防ぎ成功に導く原則を解説 『要件定義の極意』発売
- 『図解まるわかり AIエージェントのしくみ』発売 基礎知識から最新技術まで網羅的に解説
- この記事の著者
-
【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

