ENTRY TYPE · framework

Customer health score

By Marius Bughiu Last updated 2026-06-06 Customer Success

Ein Customer Health Score ist eine einzelne zusammengesetzte Zahl, üblicherweise von 0-100 oder ein Band aus Rot/Gelb/Grün, die fünf Signalfamilien — Produktnutzung, Engagement, Sentiment, Support und Ergebnisse — zu einem einzigen Indikator dafür zusammenfasst, wie wahrscheinlich es ist, dass ein Account verlängert, expandiert oder churnt. Er existiert, damit ein CSM mit 40-80 Accounts seine Aufmerksamkeit priorisieren kann, ohne jeden Account von Hand zu lesen, und damit die CS-Leitung das Net Revenue Retention mit etwas anderem als Bauchgefühl forecasten kann.

Was er nicht ist: Er ist kein Churn-Vorhersagemodell, und er ist kein NPS. Ein Churn-Modell gibt eine Wahrscheinlichkeit aus einem trainierten Klassifikator aus; ein Health Score ist ein transparentes, von Hand gewichtetes Rollup, das ein CSM einem Kunden erklären kann. NPS ist ein Sentiment-Input in den Health Score, kein Ersatz dafür. Den Score als absolute Wahrheit statt als Priorisierungshilfe zu behandeln, ist die häufigste Art, wie Teams ihn falsch verwenden.

Die fünf Signalfamilien

Nutzung — Logins, Breite der Feature-Adoption, aktivierte vs. bereitgestellte Seats, Tiefe bei den Features, die auf Ihr Wertversprechen abbilden. Das stärkste Leading-Signal für die meisten SaaS.
Engagement — QBR-Teilnahme, E-Mail-Öffnung/-Antwort, Reaktionsfähigkeit des Exec Sponsors, Teilnahme an Community oder Training.
Sentiment — NPS, CSAT, CES sowie das vom CSM erfasste qualitative Sentiment. Der weichste und am leichtesten manipulierbare Input.
Support — Ticketvolumen, Schweregrad, Lösungszeit, Eskalationen, Bug-Anzahl gegen diesen Account.
Ergebnisse — Hat der Kunde die Meilensteine des Success Plans erreicht, den ROI realisiert, für den er gekauft hat, das Time-to-Value (TTV) erreicht? Am schwersten zu instrumentieren und am stärksten prädiktiv für die Verlängerung.

Die Formel

Ein Health Score ist eine gewichtete Summe normalisierter Komponentenwerte:

Health = Σ (component_score_i × weight_i)   wobei Σ weight_i = 1.0

Jede Komponente wird zuerst auf 0-100 normalisiert (damit ein roher Login-Zähler und ein roher NPS auf derselben Skala landen) und dann gewichtet. Ein vertretbarer Start-Gewichtungssatz für ein Seat-basiertes B2B-SaaS-Produkt:

Signalfamilie	Gewicht
Nutzung	0.35
Ergebnisse	0.25
Engagement	0.15
Sentiment	0.15
Support	0.10

Bänder: 70-100 grün, 40-69 gelb, unter 40 rot. Kalibrieren Sie die Grenzwerte gegen Ihre eigenen Verlängerungsdaten — lassen Sie den Score rückwirkend über die letzten 12 Monate an Verlängerungen und Churns laufen und verschieben Sie die Grün/Gelb-Linie dorthin, wo sie Verlängerer tatsächlich von Churnern trennt.

Leading vs. Lagging

Das ist die Unterscheidung, die einen Score nützlich macht. Ein Leading-Signal bewegt sich vor dem Verlängerungsergebnis und ist beeinflussbar — sinkende wöchentlich aktive Nutzung, ein Champion, der gegangen ist, abrutschende QBR-Teilnahme. Ein Lagging-Signal bestätigt, was bereits passiert ist — ein nach einem schlechten Quartal eingereichter CSAT, eine Nicht-Verlängerungs-Mitteilung. Gewichten Sie Leading-Signale höher: Nutzung und Ergebnisfortschritt sind Leading; ein geschlossenes Support-Ticket und eine Umfrageantwort sind Lagging. Ein von Lagging-Inputs dominierter Score sagt Ihnen in der Woche, in der ein Account churnt, dass er ungesund ist — zu spät, um zu handeln.

Durchgerechnetes Beispiel

Ein Account: Nutzung normalisiert auf 80, Ergebnisse auf 50, Engagement auf 90, Sentiment auf 70, Support auf 60.

Health = 80×0.35 + 50×0.25 + 90×0.15 + 70×0.15 + 60×0.10
       = 28 + 12.5 + 13.5 + 10.5 + 6
       = 70.5  → grün (knapp)

Der Score ist grün, aber Ergebnisse bei 50 ist die tragende Schwäche — starke Produktnutzung und ein zufriedener Sponsor verdecken die Tatsache, dass der Kunde den ROI, für den er gekauft hat, nicht realisiert hat. Das ist genau der Account, den ein reiner Nutzungs-Score fälschlich als sicher kennzeichnen würde. Die CSM-Aktion ist ein Success-Plan-Reset, kein Check-in.

Häufige Fallstricke

Reine Nutzungs-Scores. Leicht zu instrumentieren, also liefern Teams sie und hören dort auf. Ein intensiver Power-User mitten im Onboarding kann hohe Nutzung zeigen, während die Verlängerung an einem fehlenden Ergebnis bereits verloren ist. Guard: Erzwingen Sie ein Ergebnis-Gewicht ungleich null, selbst wenn Sie es nur über einen Proxy abbilden können (Abschlussgrad der Success-Plan-Meilensteine).
Einmal gesetzte und vergessene Gewichte. Gewichte driften von der Realität ab, wenn sich Produkt und Segment-Mix ändern. Guard: Lassen Sie den Score quartalsweise gegen tatsächliche Verlängerungs-/Churn-Ergebnisse neu laufen und passen Sie die Gewichte neu an; wenn das grüne Band Verlängerer nicht von Churnern trennt, ist es fehlkalibriert.
Score-Wäsche. Wenn das vom CSM eingegebene Sentiment ein schwerer Input ist, blähen Reps es auf, um ihr Book grün zu halten. Guard: Begrenzen Sie subjektive Inputs auf den Bereich 0.15-0.20 und auditieren Sie das Sentiment gegen objektive Signale.
Ein Score für alle Segmente. Ein SMB-Account mit 12 Seats und ein Enterprise-Account mit 4.000 Seats teilen keine Nutzungskurve. Guard: Pflegen Sie pro Segment eigene Gewichtungssätze und Bänder, nicht eine einzige globale Formel.
Kein Action-Mapping. Ein Score, auf den niemand reagiert, ist eine Dashboard-Zierde. Guard: Jeder Bandübergang (grün→gelb, gelb→rot) löst einen benannten Play mit einem Owner aus, nicht nur einen Farbwechsel.

Verwandt

NRR vs GRR — die Retention-Metriken, die ein Health Score vorhersagen soll
Gainsight und Planhat — Plattformen mit konfigurierbaren Health-Scorecards
ChurnZero und Vitally — nutzungsgetriebener Health Score und Playbook-Automatisierung

Diese Seite auf GitHub bearbeiten