SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2023 セッションレポート(AD)

月1万件のアラートが1/10に! 元AWSエンジニアの経験から生まれた「PagerDuty」のインシデント対応とは

【9-A-5】月に1万件あったアラート数を10分の1に削減。PagerDutyで実現するインシデント管理

  • X ポスト
  • このエントリーをはてなブックマークに追加

変更の自動リストアップや対応履歴の参照機能など、迅速な問題解決を支援!

 協力/解決フェーズは、通知を受けた担当者がいかに迅速に問題を解決できるかを支援する。

 原因を特定するには、手がかりが必要だ。これは、現在インシデントが発生しているサービスで最近行われた変更を自動でリストアップするRecent Changes機能、過去のアラート情報や対応履歴を参照して現在のインシデントと関連性が高いものを自動で提示するPast Incidents機能、他サービスで発生中のインシデントで関連性の高いものを提示するRelated Incidents機能などがサポートする。インシデントにつながる変更はあったのか、過去の類似インシデントではどのような対応が行われたのか、他サービスの影響によるものかどうかなど、解決に必要な情報が自力で調査することなく提示されることで、次のアクションへスムーズにつなげることができる。

原因特定を効率化するRelated Incidents機能
原因特定を効率化するRelated Incidents機能

 特に最近のシステムは複数サービスの依存関係で成り立っており、担当チームと素早く連絡を取り合って対応に当たることができるのは重要だ。PagerDutyではこうした機能が豊富に用意されている。たとえば、他サービスの担当者に通知して協力を仰ぐAdd Responders機能、チーム外の関係者とインシデント対応状況を共有して対応作業を円滑化するStatus Update機能などが挙げられる。また、PagerDuty上で実行する一連のアクションをワークフローとして定義し、自動実行するIncident Workflow機能も有用だ。たとえば他チームへの協力依頼を出してからステークホルダーを追加、Zoom会議を設定するなど、インシデント対応の典型的な流れがあれば、それをワークフローに定義して自動実行するといった具合だ。こうした事務的な手続きから解放されることで、より業務に集中できるようになる。

 このほか、自動診断スクリプトや修復ジョブを事前に定義して自動実行することもできる。もちろん、手動で実行したり、アラートに含まれる情報を条件にイベントドリブンで診断をキックしたりすることも可能だ。たとえば、インシデント対応をする担当者に一部のシステムへのアクセス権がない場合でも、一次切り分けの診断をジョブとして用意し、誰でも実行できるようにしておけば、速やかな対応が実現する。

 「PagerDutyは、運用の負荷を下げてエンジニアが新機能の開発やサービスの安定化といった、より重要なサービスに注力できるよう支援する。講演で説明した以外にも、さまざまな便利な機能があるので、ぜひチェックしてほしい」(山田氏)

月に1万件あったアラート数を10分の1に削減。NTTドコモが実践したインシデント対応改善

 NTTドコモ様はAWS と PagerDuty を使用し、最高クラスのインシデント対応プロセスを実装することでシステムノイズとアラート疲れを大幅に軽減し、インシデント解決時間を大幅に短縮しました。

 インシデント対応を行なっている DevOps や IT 運用チーム向けのセッションとなっておりますが、アラートの精査やクリティカルなインシデント発生後の通知・連絡に課題を感じている方は、是非こちらの動画をご視聴下さい。

関連リンク

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers Summit 2023 セッションレポート連載記事一覧

もっと読む

この記事の著者

谷崎 朋子(タニザキ トモコ)

 エンタープライズIT向け雑誌の編集を経てフリーランスに。IT系ニュースサイトを中心に記事を執筆。セキュリティ、DevOpsあたりが最近は多めですが、基本は雑食。テクノロジーを楽しいエクスペリエンスに変えるような話が好きです。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:PagerDuty株式会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/17476 2023/04/04 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング