Opsgenieをチームに適用することのメリット
一般的なアラート通知のよくあるパターンとして、例えばSlackの特定チャンネルにメンションをつけて一斉通知するケースです。もちろんチームの外のステークホルダーにも何かが起きてることを知らせるために、見えるところにアラートを飛ばすことは重要です。ただし、担当でない人にとっては業務の妨げになることがあります。
そこで、インシデント対応のシフトを組んでいる現場では、シフトに合わせてOpsgenieでエスカレーションルールを定義してあげることで、主担当者が拾って対応し、他の人が他の業務に集中できる環境を作ることができます(もちろんサポート体制は相互に実施する前提ですが)。
また、担当者ごとにアラート通知を受け取りやすい方法を、担当者自身で選択することができます。
このようにOpsgenieでは、スケジューリング設定と合わせて、ビジネスタイムはSlackへの通知で認知を促し、N分以上Ackされなかったら、モバイルアプリに通知する、など柔軟な設定が可能です。
アラートを受け取るエンジニアとして、インシデント対応はストレスがかかるものなので、これらの機能を使って、うまく負荷を軽減してあげたいですね。
最後に
今回の記事では、Opsgenieの特徴と機能の紹介、セットアップ方法の勘所について紹介させていただきました。このプロダクトはまだ日本語化されたドキュメントもないので、手を出しにくいかもしれませんが、ユーザーが迷わないためのUIが洗練されているので、直感的に操作することで習得できます。またチャット・サポートの質がとても良いので、分からないことがあれば直接問い合わせして、すぐに回答を得ることができます。
Atlassianツールを利用しているユーザーが集まり、ノウハウや事例を共有する目的で、定期的にユーザーグループを開催しています。Opsgeineを紹介するセッションも予定されているので、ユーザーグループの開催をチェックいただけると嬉しいです。
また、Opsgenieは機能無制限で14日間のトライアルをすることができるので、まずは試してみてください。