SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2026 セッションレポート(AD)

機能豊富なGrafanaの「使いこなし」の壁をAIで超える──Grafana Cloudが実現するAI時代のオブザーバビリティ

【20-D-6】AI により大きく変化するオブザーバビリティの活用方法。使いこなすための実践術

デモ:ベテランの“勘”をAIが代替──RCA workbenchで挑む障害調査の自動化

 2点目のデモは障害発生時の原因分析から対応までの迅速化だ。Grafana Cloudの独自機能となる「RCA(Root Cause Analysis:根本原因分析)workbench」を使う。

 一般的には障害が起きると、メトリクスを確認し、ログを調べ、設定変更がないかを確認するなど、複数の画面を行き来して調査する必要がある。一方、Grafanaに実装されているRCA workbenchでは、障害の原因分析プロセスを1つのタイムラインで進めることができる。

 例えばある日、運用担当者が使うSlackに「プロダクトカタログサービスにて障害が発生」と通知が届いたとする。そこで担当者がGrafanaを開くと、KubernetesのPodのクラッシュが多発していることや、エラー割合がしきい値を超えたことを確認できる。

 さらに原因特定に役立つ情報が自動的に抽出される。ここでは最近「フィーチャーフラグ」という設定が変更されたことが操作履歴などから表示されていた。アプリケーションで新しい機能をリリースするとき、何らかの設定を変更することはよくある。こうした何気ない変更がKubernetesに影響を与えていたのだ。

開始から17分半あたり「Grafana CloudのRCAワークベンチで障害原因特定」
開始から17分半あたり「Grafana CloudのRCA workbenchで障害原因特定」

 ではどうして設定変更から障害につながってしまったのか。RCA workbenchでは、障害が起きているサービスがどのようなコンポーネントから呼び出されているのか、依存関係のグラフをマップ形式で自動生成する。そうして追っていくと「PostgreSQLのクライアント接続数エラーが発生している」と原因を特定できる。

 こうした作業はベテラン運用者であればすぐできるかもしれない。しかし経験が浅い、または現場に参加して間もなく、システム構成を把握できていないと、手間取ってしまう。RCA workbench機能ではログやメトリクスを多角的に分析し、「設定変更による連鎖障害」といった形で、結論を日本語で回答してくれる。

 原因特定後には復旧支援も行う。RCA workbenchでは、時系列で重要なアラートや変更履歴を示してくれる。このデモでは、フロントエンドでクリティカルなAPIエラーがアラートとして表示されていた。ここでGrafana Assistantに「復旧策を提示してください」と入力すると、AIが復旧策を提案してくれる。デモでは設定変更による連鎖障害だったため、即時対応としてロールバックが提案された。加えて恒久的な対策として、設定の見直しや、接続数制限の調整などが提案された。

 ここまではPrometheusにあるメトリクス情報だけで分析が進められていたが、「ログも含めて影響範囲を調査して」と依頼すると、ログを横断検索して該当する時間帯にあるエラーを抽出する。これまで運用担当者が各種ログにアクセスしてgrepで抽出するといった作業をGrafana Assistantが同時並行で実施する。

 続いてレポート作成のためのInvestigation機能だ。こちらもGrafana Cloudに実装されている。今回のエラーに対して調査プロセス全体をドキュメント化するため、事後の振り返り(ポストモーテム)にそのまま使える形に集約する。

 なお「AIだからハルシネーションが起こるのでは」という懸念に対しては、AIがどのログの何行目を見て判断したのか証跡も残しているため、リスクを最小化できる。もし見当違いのログを見ていたら、再調査させることも可能だ。

 最後に角田氏は「AIはコンテキストが重要。必要なデータがなければAIも宝の持ち腐れとなる。そしてGrafanaほど豊富なデータを持つものはない。Grafanaはエンドツーエンドのオブザーバビリティプラットフォームで、圧倒的な洞察力、テレメトリデータ、そしてコンテキストを提供できる」とGrafanaおよびGrafana Cloudの強みを強調した。

Grafana Labsからのお知らせ

 本セッションでご紹介したサービスにご興味を持たれた方は、ぜひ公式サイトをご覧ください。

この記事は参考になりましたか?

Developers Summit 2026 セッションレポート連載記事一覧

もっと読む

この記事の著者

加山 恵美(カヤマ エミ)

フリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Onlineの取材・記事や、EnterpriseZine/Security Onlineキュレーターも担当しています。Webサイト:http://emiekayama.net

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

関口 達朗(セキグチ タツロウ)

フリーカメラマン 1985年生まれ。東京工芸大学卒業後、2009年に小学館スクウェア写真事業部入社。2011年に朝日新聞出版写真部入社。2014から独立し、政治家やアーティストなどのポートレート、物イメージカットなどジャンルを問わず撮影。2児の父。旧姓結束。趣味アウトドア。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:グラファナラボ日本合同会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

CodeZine(コードジン)
https://codezine.jp/article/detail/23698 2026/04/24 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング