エスカレーションプロセスとは、顧客の問題が「CSM が気づいた」状態から「責任を持つオーナーが時間制限の中で修正している」状態まで進む、文書化された経路のことです。これがないと、すべての火事はたまたま Slack チャンネルにいた人のスピードで処理され、顧客が感じる重大度はあなたの認識からずれていきます。これは how-to です。4 つの要素 — 重大度レベル、ルーティング、コミュニケーションのケイデンス、根本原因フォローアップ — をこの順序で構築してください。それぞれが前の要素に依存するからです。
前提条件
- 重大度フィールドを保持し、状態変更のタイムスタンプを記録できる ticketing または CS プラットフォーム。Zendesk、Pylon、Gainsight のいずれも使えます。tool よりフィールドの方が重要です。
- インシデントごとのチャンネルを作成できる Slack ワークスペース。
- エンジニアリングの指名された on-call ローテーション、または最低でもプロダクト領域ごとに 1 人の責任オーナー。
- Sev の割り当てが技術的影響だけでなくアカウント価値を加味できるよう、health-score またはアカウント tier のシグナル。
ステップ 1 — レスポンスと解決の SLA を伴う重大度レベルを定義する
重大度は 2 軸の判断です。ビジネスインパクト × アカウントの重み。マトリクスを一度書き出し、機械的に適用してください。そうすれば Sev の判定が金曜の午後 4 時に議論する対象にはなりません。
| Sev | トリガー | レスポンス SLA | 更新ケイデンス | 解決目標 |
|---|---|---|---|---|
| Sev 1 | 有料アカウントの本番停止、データ損失、セキュリティ露出 | 15 分 | 30 分ごと | 4 時間 |
| Sev 2 | 主要機能の停止、回避策なし、または top-tier/リスクありアカウントのあらゆる問題 | 1 時間 | 2 時間ごと | 1 営業日 |
| Sev 3 | 回避策のある機能低下 | 1 営業日 | 毎日 | 5 営業日 |
| Sev 4 | 見た目の問題、質問、または bug と誤ラベルされた feature request | 2 営業日 | 変更時 | バックログ |
アカウントの重み軸こそ、純粋なサポートの triage が見落とすものを CS が加えるポイントです。更新四半期で health 70% のアカウントの Sev 3 技術問題は、実質的に Sev 2 です。これをコード化してください — account_tier = strategic または health_score が 60 未満なら、Sev を 1 段階上げます。各 CSM に手動で上げさせないでください。ルールがやります。
ステップ 2 — キューではなく、指名されたオーナーにルーティングする
キューはエスカレーションが老朽化する場所です。ルーティングとは、インシデントが存在する前に、各 Sev に事前合意されたオーナーと事前合意されたチャンネルがあることを意味します。
- Sev の割り当て時に、
#esc-<account>-<date>という名前の専用 Slack チャンネルを自動作成します。インシデントごとのチャンネルは、共有の 1 本のホースに勝ります。履歴が検索可能なまま残り、顧客向けのサマリーが再構築ではなく 1 スクロールで済むからです。 - on-call ローテーションの責任オーナー、アカウントの CSM、そして Sev 1/2 では CS マネージャーを自動招待します。Sev 1 では @-mention ではなく page してください。メンションは通知ですが、page は義務です。
- チャンネルにリンクしたトラッキング issue を Linear(または自社のエンジニアリングトラッカー)に開き、説明に Sev、アカウント、SLA タイマーを記載します。CS 側のレコード(Gainsight または CRM 内)は同じ issue にリンクし、更新と CSM のコンテキストが一緒に移動するようにします。
- CSM は終始顧客との関係のオーナーであり、エンジニアリングのオーナーは修正のオーナーです。この 2 つの役割を明示的に分けることで、CSM がエンジニアリングを待っているために沈黙し、顧客が何も聞かされないという失敗を防ぎます。
ステップ 3 — コミュニケーションのケイデンスを回す
顧客の不安は重大度ではなく沈黙の関数です。30 分ごとに更新がある Sev 1 は対応されていると感じられ、3 日間沈黙の Sev 3 は Sev 1 のように感じられます。
- レスポンス SLA 以内に、人間味のあるメッセージで承認します。 問題をどう理解しているか、割り当てた Sev、次の更新がいつ届くか。次の更新時刻を明示することが最もレバレッジの高い動きです — 終わりのない待機を、守られた約束に変えます。
- 新しい情報がなくてもケイデンス通りに更新します。 「まだ調査中、根本原因はまだ特定できていません、次の更新は午後 3 時」は有効な更新です。何も変わっていないからとスキップするのは、最もよくある回避可能な「エスカレーションのエスカレーション」です。
- 内部と外部の言葉を分けます。 内部チャンネルは「retry の嵐がキューを叩いている」と言えますが、顧客には「原因を特定し、修正を deploy しています」と伝わります。生のエンジニアリングのやり取りを顧客に貼り付けてはいけません。
- 明示的にクローズします。 何が修正されたかを述べ、顧客が解決を確認できることを確認し、クローズとマークする前に顧客の確認を求めます。一方的なクローズは軽視と読まれ、頻繁に再オープンします。
ステップ 4 — 根本原因フォローアップ
チケットをクローズすることは loop を閉じることではありません。すべての Sev 1 と Sev 2 は、5 営業日以内に非難なしのポストインシデントレビューを受けます。
- タイムライン。 チャンネルとトラッカーのタイムスタンプから再構築します。検知、承認、緩和、解決。承認までの時間と解決までの時間を SLA と比較して測定します。
- システム的原因まで 5 回のなぜ。 人ではなく、プロセスまたはシステムのギャップで止めます。「CSM がアラートを見なかった」は根本原因ではありません。「アラートは email にルーティングされ、CSM は EU 時間中それを監視していない」が根本原因です。
- オーナーと期日を伴う是正アクション。 各アクションはミーティングのメモではなく、トラッキングされた issue です。オーナーのいないアクションは存在しません。
- ステップ 1 にフィードバックします。 同じ Sev が繰り返すなら、マトリクスかルーティングが間違っています — 次のインスタンスではなく、システムを直してください。
よくある落とし穴
- 重大度のインフレ。 すべてが Sev 1 になり、結果として何も Sev 1 ではなくなります。ガード: マトリクスが唯一の権限です。オーバーライドにはチャンネル内に CS マネージャーの名前と 1 行の理由が必要です。
- 人ではなくキューへのルーティング。 チケットは共有 inbox で老朽化します。ガード: 各 Sev は作成時に指名オーナーを自動割り当てします。レスポンス SLA を超えたオーナー不在の Sev はマネージャーに page します。
- 更新の間の沈黙。 ガード: 更新ケイデンスはオーナーの記憶ではなく、インシデントチャンネルのリマインダー bot によって強制されます。
- 根本原因なしのクローズ。 誰もシステムを直さないので、同じ障害が再発します。ガード: Sev 1/2 は、是正アクションとオーナーを伴うリンクされたポストインシデント issue が存在するまで「解決済み」とマークできません。
- アカウントの重み要素なし。 純粋に技術的な triage は、churn しかけているクジラ顧客の小さな bug を過小評価します。ガード: tier と health score による Sev 引き上げルールが自動的に実行されます。
関連
- NRR vs GRR — 繰り返すエスカレーションがリテンションで何を犠牲にするか
- Gainsight — Sev 引き上げルールのための health score とアカウントコンテキスト
- Pylon — 重大度とアカウントごとのコンテキストを保持する B2B サポート tooling
- Linear — エンジニアリング側のトラッキング issue