インシデント対応の流れ
Waroom でのインシデント対応は以下のステップで行います。
1. インシデントを起票する
インシデント起票することが Waroom でのインシデント対応のファーストステップです。まずは Slack から コマンドを実行してインシデントを起票しましょう。
オートトリガーインテグレーションを追加すると監視ツールからのアラートやイベントをフックにインシデントを起票することもできます。
2. 対応専用チャンネルを作成する
手動でインシデントを起票した場合は自動的にチャンネルが作成されます。インテグレーションから自動起票された場合は「対応を開始する」ボタンから専用チャンネルを作成します。作成した対応専用チャンネルに関係者を集めコミュニケーションを開始しましょう。
対応専用 Slack チャンネルへの自動招待設定をする の設定をしておくことで対応チャンネル作成時にメンバーを自動で招待できます。
3. インシデントコマンダーを決める
インシデント対応の旗振りを行う人としてインシデントコマンダーを決めておくと、チームメンバーが判断に迷うことなく効率よく対応を進められます。
コマンダーのアサインは Slack のスラッシュコマンドから行えます。
4. 原因調査・復旧対応を行う
これまで通り Waroom を気にせずコミュニケーション行ってください。対応専用チャンネルでのコミュニケーションの内容は自動で Waroom 上のドキュメントにまとめられます。
インシデントステータスをこまめに コマンドから更新しておくことを推奨します。「調査中、修正中」それぞれの TTx が計測され、振り返りに役立ちます。
5. 復旧後に振り返る
復旧の確認後、まずはインシデントステータスを コマンドから「解決済(Resolved)」へ変更しましょう。復旧したことがチームへ共有され、TTRが計測されます。
次に Waroom(ブラウザ)のインシデント詳細画面に AI によって自動生成されたドキュメントの本文と原因カテゴリに誤りが無いか確認し、修正が必要であれば修正しましょう。
ポストモーテムの作成が必要であれば、インシデント詳細画面より「ポストモーテムを生成する」ボタンから下書きを自動生成できます。面倒なタイムラインなどは AI が書き起こしてくれます。
6. クロージングを行う
専用チャンネルでインシデント対応がすべて完了した旨を宣言しましょう。使い終わったチャンネルはしっかりとアーカイブをしましょう。
アーカイブしたチャンネルへはインシデント詳細画面にあるリンクよりアクセスできます。
7. 分析をする
インサイト画面から複数のインシデントにまたがり分析を行えます。サービス、重篤度、原因、期間でのフィルターや、TTx でのソートを行い、発生しているインシデントの傾向や特徴を分析しましょう。