Splunk社のプラットフォームで実現するオブザーバビリティ
「メトリクス・トレース・ログというデータを取得・活用するために、当社の提供するソリューションを有効利用していただきたい」と池山氏は提唱する。
ログ管理プラットフォームを提供するSplunk社は、2019年にクラウド監視SaaS・SignalFxの開発元であるSignalFx社およびマイクロサービスのアプリケーション監視技術を有するOmnition社を買収した。また、2020年にはSignalFxとOmnitionが統合したSignalFx μAPM 2.0をリリースした。三社の技術を組み合わせることで、オブザーバビリティにおける三本柱のデータを扱うためのソリューションを提供可能になったという。
メトリクスを担うのがSignalFxだ。ストリーミングアーキテクチャによるリアルタイムの可視化・アラートや、AI駆動のリアルタイム解析を実現する。トレースを担うのがSignalFx+Omnitionだ。サンプリング不要でトレース情報を取得でき、かつAI駆動によるトラブルシューティングを実施可能にする。ログ管理を担うのがSplunkだ。ストリーミングプロセッシングによりリアルタイムでの大量ログデータ解析が可能。かつ、機械学習や深層学習などを用いて統合プラットフォームとしての機能を実現している。
複雑化する環境のオブザーバビリティ向上にSignalFxとSplunkが最適である理由を、池山氏は以下のように述べていく。
-
ストリームアーキテクチャによるリアルタイムの可視化とアラート
→秒単位でのアラート通知やダッシュボード表示が可能に -
異常値を捉える100%のトレース
→サンプリングしないため、ごくわずかに発生しているエラーや異常を逃さない -
サービス全体から個別のトレースまで容易なドリルダウン
→マイクロサービスの全体俯瞰から問題箇所の特定までを秒〜分単位で実現 -
3rdパーティーベンダーやオープンソースのソフトウェア・クラウドサービスとの充実したエコシステム
→豊富なクラウドネイティブ製品との連携やオープンソースへの貢献 -
Built-inのダッシュボードやアラートテンプレートによるFast-Time-To-Value
→簡単な設定でデータを入れるだけで即座に利用可能 -
統計や機械学習を用いた多様で柔軟な可視化とアラート
→デフォルト設定で簡潔なアラート作成から詳細な条件指定まで可能
SignalFxとSplunkの連携方法やSignalFx μAPMによるトラブルシューティングのワークフローについて、池山氏はデモンストレーションを交えながら解説していく。直感的な操作を行えることや、問題の検出から原因特定まで極めて短時間で完結できることなどが、デモンストレーションでは示された。
SignalFxは各種オープンソースソフトウェアとの連携も容易だ。かつ、APMデータを格納するためのインスツルメンテーションの方法も、下図のように複数手段が用意されている。
「クラウドネイティブ時代の運用ではスピードが重要です。SignalFxを活用することで、リアルタイムの可視化・アラートにより秒単位での問題対応が可能になります。また、メトリクス・トレース・ログのシームレスな連携によりオブザーバビリティを実現可能です。
複雑な依存関係のあるサービスでも、全体を把握しながら詳細まで追うことができるため、トップダウンアプローチでの原因解析を行えます。また、アプリケーションからインフラまで技術スタックをまたがったトラブルシューティングを実現します。各種オープンソースソフトウェアとの連携も容易です。ぜひSignalFxを導入していただき、より良い運用体制を達成していただければ幸いです」と池山氏は述べ、講演を結んだ。