「可視化」の先へ──進化を続ける統合オブザーバビリティ基盤「Grafanaスタック」
オブザーバビリティを構成するのは、Logs、Grafana(Visualization)、Traces、Metricsで、これらは頭文字を取って「LGTMスタック」と呼ばれている。Grafana LabsはこのLGTMスタックをもとに、データ収集から保管、分析・対応、可視化までを統合した「Grafanaスタック」を構成している。これによりGrafanaが得意とする可視化に加えて、より広範囲かつ効果的なオブザーバビリティ基盤を提供している。
分析・対応の領域にはテスト、オブザーバビリティ、インシデントレスポンス管理がある。テストでは、パフォーマンステストやSynthetic Monitoringを実行する。オブザーバビリティでは、フロントエンド、アプリケーション、インフラやクラウド(例えばデータベースやKubernetesのPodの状態など)の監視測定も行う。さらにインシデント管理のソリューションも提供している。
データの収集領域では、テレメトリデータの収集エージェントであるGrafana Alloyを中心にデータを集める。収集したデータはLoki(ログ)、Mimir(メトリクス)、Tempo(トレース)、Pyroscope(プロファイル)などに保管する。
このGrafanaスタックは、プライベートクラウドやパブリッククラウドなどの独自基盤で構築する(Grafana OSSと呼ばれる)こともできるが、機能まるごとGrafana Labsがフルマネージドで提供するのが「Grafana Cloud」だ。
あらためてGrafana Cloudの特徴や強みを見ていこう。1点目がフルスタックなオブザーバビリティ基盤。より詳細な可視化やトラブル対応の迅速化が可能となる。2点目はアプリケーションのリソースを常時収集し続けるプロファイリング機能。例えばJavaアプリケーションを稼働させているなら、どのオブジェクトがどれだけ残存しているかを継続的に監視できるため、常にリソース効率を最適化し、応答時間を改善することが可能となる。
3点目はSLO駆動のIRM。サービスレベルを定義して、SLOが下回ればインシデントとして優先順位を割り振り対応することが可能となる。4点目は性能テスト。負荷テストツール「k6」を統合しているため、テストを実施できるだけではなく、負荷をかけている最中の内部状態をGrafanaのダッシュボードでリアルタイムに観測できる。
5点目はコストの最適化。クラウドにログを保存すればするほどコストがかさむものだが、不要なデータをGrafana CloudのAIであるAdaptive Telemetryが洗い出すため、コスト最適化に役立つ。これらの特徴的な機能は、結果的に信頼性の確保、生産性の加速、効率の向上といった効果を生んでいる。

