claude-skill

Validateur de progression d'étapes pour Salesforce

Difficulty

intermédiaire

Setup time

60min

For

revops

RevOps

Stack

Un Claude Skill qui audite quelles opportunités Salesforce satisfont genuinement les critères de sortie de l’étape dans laquelle elles viennent d’entrer. Pour chaque opp qui a progressé dans la semaine précédente, le Skill vérifie les règles déterministes (champs requis, activités enregistrées, rôles des parties prenantes), puis cross-référence les affirmations qualitatives du rep contre les transcripts d’appels Gong. La sortie est une queue de coaching pour la revue hebdomadaire RevOps, pas une porte d’application qui fait reculer automatiquement les deals.

Le bundle d’artefacts se trouve dans apps/web/public/artifacts/stage-progression-validator-skill/ et contient SKILL.md plus trois templates de référence : references/1-stage-criteria-template.md (le rubrique d’étapes de l’équipe), references/2-methodology-mapping-template.md (comment MEDDPICC, MEDDIC, SPICED, BANT ou un framework personnalisé se mappe sur vos champs Salesforce et vos patterns de phrases Gong), et references/3-sample-output-format.md (le Markdown exact que le Skill émet).

Quand l’utiliser

Exécutez ceci sur la cadence de votre réunion de forecast. Le pattern canonique est un batch dimanche soir indexé sur week_ending, avec le rapport tombant dans un canal Slack avant le point du lundi matin des managers. Le mode opp unique est aussi valide — un réviseur du deal-desk peut exécuter le Skill contre un Opportunity.Id avant une réunion d’approbation tarifaire, ou un manager peut l’exécuter contre un seul deal avant un 1:1 pour ancrer la conversation dans les gaps spécifiques plutôt que dans un vague sentiment de « ça semble bloqué ».

La vérification des affirmations qualitatives est la partie qui se rentabilise. Salesforce applique déjà des règles de validation de champs requis ; ce qu’il ne peut pas faire, c’est remarquer que le rep a affirmé « l’acheteur a accepté les critères de succès » et qu’aucun appel Gong des 45 derniers jours n’a réellement capturé cette conversation. Le Skill est conscient de la méthodologie dans sa recherche — pour l’acheteur économique de MEDDPICC, il cherche le nom de l’acheteur dans les douze tokens suivant un langage de décision (« approuver », « signer », « décideur budgétaire ») plutôt qu’une simple mention du nom. C’est cette distinction qui sépare un flag utile d’un faux positif que les reps apprennent à ignorer.

Quand NE PAS l’utiliser

Auto-rollback. Ne câblez pas la sortie du Skill dans une mise à jour Salesforce qui rétrograde les deals sur un verdict fail. Le verdict est un input parmi plusieurs ; le manager possède la décision de rétrogradation avec tout le contexte que le Skill ne peut pas voir (réunions hors Gong, engagements de couloir, particularités d’approvisionnement côté client).
Gestion de la performance. Un seul fail sur un seul deal est du bruit. Le signal est les patterns sur des semaines — le rep dont le taux de fail monte de 5 % à 30 % sur un trimestre tandis que ses pairs restent stables. Utiliser un verdict ponctuel dans un PIP effondre la confiance du rep et le Skill cesse de fonctionner.
Inputs de comp. L’étape pilote le forecast, pilote parfois les accélérateurs. Si la sortie du validateur alimente les calculs de comp, vous avez créé une incitation directe pour les reps à jouer les inputs — refuser l’enregistrement Gong, omettre les notes, stocker les données dans des tableurs en dehors du système. Gardez la sortie du validateur dans le canal de coaching et hors du pipeline de comp.
Étapes sans rubrique documenté. Si references/1-stage-criteria-template.md n’a pas d’entrée pour l’étape en cours de validation, le Skill émet needs_methodology plutôt que de deviner. Ne « réglez » pas le Skill pour scorer ces étapes avec une valeur par défaut — corrigez le rubrique à la place.
Équipes qui ne stockent rien de structuré. Une équipe qui exécute MEDDPICC dans des slides et non dans Salesforce échouera à chaque vérification qualitative. Exécutez le Skill en mode dry-run pendant deux semaines ; si plus de 40 % des opps atterrissent dans needs_methodology ou scorent en dessous de 0,2 sur les vérifications qualitatives de façon généralisée, le doc de mapping de méthodologie est fictif. Corrigez le doc ou instrumentez les champs manquants avant de le déployer.

Setup

Documentez les étapes. Ouvrez references/1-stage-criteria-template.md et remplacez le contenu template par le vrai rubrique de votre équipe, étape par étape. Chaque étape a trois buckets de règles : field_rules (un champ Salesforce doit avoir une valeur non-défaut), activity_rules (une activité enregistrée d’un type spécifié doit exister dans une fenêtre de récence), et stakeholder_rules (OpportunityContactRole doit inclure un contact avec un rôle correspondant à un regex). Marquez les champs comme evidence_required: gong quand vous voulez une vérification croisée avec les transcripts Gong sur l’affirmation qualitative.
Mappez la méthodologie. Éditez references/2-methodology-mapping-template.md pour correspondre au framework de votre équipe. Le fichier est livré avec des exemples travaillés pour MEDDPICC, MEDDIC et SPICED — copiez celui qui correspond, puis ajustez les noms de champs Salesforce vers les noms API réels de votre org. La colonne des patterns de phrases est ce qui dit au Skill ce qui compte comme preuve Gong ; ne laissez pas la valeur par défaut du template sauf si vos champs correspondent genuinement aux mappings d’exemple.
Installez le Skill. Déposez le bundle dans ~/.claude/skills/stage-progression-validator/. Définissez SFDC_TOKEN (lecture seule sur Opportunity, OpportunityFieldHistory, Task, Event, OpportunityContactRole) et GONG_API_KEY (avec portées calls/extensive et deals). La lecture seule est la bonne portée ; le Skill ne doit pas écrire dans Salesforce.
Planifiez le run hebdomadaire. Un cron simple convient — claude run stage-progression-validator week_ending=$(date -d 'sunday' +%F) le dimanche à 22h00. Pipez la sortie vers votre canal Slack ou un email de digest hebdomadaire.
Associez-le à un rituel de coaching. La queue de verdicts est inutile si personne ne l’ouvre. Créneau fixe de 30 minutes le lundi, le manager parcourt les lignes fail et needs_manager_review avec chaque rep. Après huit semaines, le volume dans ces buckets devrait baisser — c’est la métrique de succès.

Ce que le skill fait réellement

Pour chaque progression dans la fenêtre, le Skill calcule deux scores. Le score déterministe est la fraction des règles de méthodologie satisfaites — cinq règles, trois passent, le score est 0,6. C’est rubrique structuré plutôt que langage naturel libre-forme par conception : les critères en forme libre forcent le modèle à interpréter les cas limites de façon incohérente entre les runs et les reps ne peuvent pas prédire ce qui déclenchera un fail, ce qui tue la confiance dont l’outil dépend.

Le score qualitatif est la fraction des affirmations evidence_required: gong qui trouvent des preuves de transcript de soutien dans la fenêtre pertinente. La correspondance de phrases est consciente de la méthodologie. Pour l’acheteur économique de MEDDPICC, le Skill cherche le nom de l’acheteur dans les douze tokens suivant un langage de décision. Pour l’événement critique de SPICED, il cherche un langage d’urgence borné par une date avec des verbes de conséquence (« manquer », « glisser », « risquer ») à proximité. Une vérification naïve « toute mention du nom de l’acheteur compte » produit trop de faux-pass — le rep mentionnant l’acheteur en passant dans un appel avec une autre partie prenante n’est pas une preuve d’engagement de l’acheteur.

Les deux scores se combinent en l’un des cinq verdicts : pass (les deux à 1,0), flag (un bucket fort, l’autre faible), fail (les deux en dessous du seuil de limite, 0,6 par défaut), needs_manager_review (la bande limite entre flag et fail — ni clairement mauvais ni clairement bon), ou needs_methodology (le rubrique n’a pas d’entrée pour cette étape). Le bucket needs_manager_review existe parce que forcer chaque deal limite dans un binaire flag versus fail produit du bruit que les reps apprennent à rejeter ; les lignes limites vont dans une queue séparée que le manager résout manuellement, ce qui préserve le signal dans les autres buckets.

Coûts réels

Claude Sonnet 4 aux tarifs actuels coûte environ 15-25 centimes par opportunité validée, dominé par la lecture des transcripts Gong (une fenêtre de 30 jours typique couvre 4-8 appels par deal actif à 5-15 000 tokens chacun, plus quelques centaines de tokens de rubrique de méthodologie chargés depuis les références). Un batch hebdomadaire de 50 deals coûte environ 7-12 $ en dépense API.

Le temps économisé est l’argument en faveur du Skill. Un responsable RevOps effectuant cet audit à la main dépense 20-30 minutes par deal — tirer l’historique d’étapes, ouvrir chaque appel Gong, scanner le nom de l’acheteur et la conversation sur les critères de succès. Sur 50 deals, c’est deux jours complets d’audit à la main par semaine, ce qui est pourquoi presque aucune équipe ne le fait réellement. Le Skill réduit cela à une passe de revue de rapport de 4-6 minutes sur le digest, avec une inspection plus approfondie uniquement sur les lignes dans les buckets fail et needs_manager_review — typiquement 5-10 deals sur 50, soit 30-60 minutes de revue ciblée. Net : 12-15 heures RevOps par semaine récupérées, pour moins de 15 $ en coût API.

Métrique de succès

Suivez deux métriques sur un ramp de huit semaines. D’abord, le taux de fail — la part des progressions hebdomadaires qui atterrissent dans fail. Un ramp sain le voit baisser d’une référence (souvent 25-40 % lors du premier run) à moins de 10 % à mesure que les reps internalisent ce que le rubrique requiert avant d’avancer un deal. Si cela ne baisse pas, soit le rubrique est trop strict (les reps ne peuvent physiquement pas le satisfaire sans des conversations acheteur que le deal n’est pas prêt pour) soit la boucle de coaching ne se produit pas. Ensuite, l’ancienneté médiane de l’étape juste avant la porte la plus stricte. Si celle-ci augmente — les reps garent des deals une étape en dessous de leur réalité pour esquiver la porte — le rubrique est faux, pas les reps. Ajustez le rubrique vers le bas avant de continuer à exécuter le Skill.

Comparaison avec les alternatives

Règles de validation Salesforce — elles appliquent la présence de champ au niveau enregistrement (vous ne pouvez pas sauvegarder une opp en étape 4 sans Economic_Buyer__c rempli). Elles ne peuvent pas faire la vérification qualitative : un rep peut taper n’importe quel nom dans le champ, les règles de validation passent, le Skill détecte qu’aucun appel Gong ne soutient l’affirmation. Les règles de validation sont aussi un instrument contondant parce qu’elles rejettent la sauvegarde ; le Skill produit un verdict gradué avec lequel le manager travaille.
Clari, Gong Forecast et outils de forecasting IA similaires — ils font la validation d’étapes comme partie d’une surface produit bien plus grande (forecast, revue de deal, analytique de conversation, coaching). Comptez 50-150 $ par rep par mois contre ce Skill à environ 10-15 $ par semaine en coût API. Choisissez la plateforme si vous avez aussi besoin de ses couches de forecasting et d’analytique de conversation ; choisissez ce Skill si votre gap est spécifiquement l’audit de progression d’étapes et que vous avez déjà Salesforce et Gong.
Revues manuelles du deal-desk — un responsable RevOps humain lisant chaque progression. Le bon outil pour les équipes enterprise à ACV élevé où les deals sont peu nombreux et conséquents. Mauvais outil pour le SMB ou le mid-market à volume où le coût d’audit (12-15 heures par semaine) signifie que cela ne se produit pas du tout et que les mauvaises progressions atterrissent dans le forecast.
Ne rien faire — la référence réelle dans la plupart des équipes. La précision du forecast dans la plupart des SaaS B2B se situe quelque part entre médiocre et embarrassante précisément parce que les étapes sur lesquelles le forecast est construit ne sont pas validées. Le coût de ne rien faire se manifeste dans la réaction du DFG à un mauvais trimestre, ce qui est un pire moment pour découvrir que les données d’input n’étaient pas fiables.

Points de vigilance

Une validation trop stricte pousse les reps à jouer les étapes. Garde-fou : instrumentez l’ancienneté médiane de l’étape juste avant la porte la plus stricte. Si elle s’envole après le déploiement du Skill, le rubrique est faux ; ajustez-le vers le bas avant de continuer.
Inadéquation de méthodologie entre les slides et Salesforce. Garde-fou : dry-run pendant deux semaines. Si needs_methodology plus les scores qualitatifs bas couvrent plus de 40 % des opps, corrigez le doc de mapping de méthodologie ou l’instrumentation de champ sous-jacente avant de traiter tout verdict comme actionnable.
Dérive du validateur par rapport aux vrais critères de sortie. Les leaders commerciaux redéfinissent silencieusement les significations d’étapes dans les QBRs ; le fichier rubrique n’est pas mis à jour. Garde-fou : le rubrique porte un champ last_reviewed ; le Skill préfixe un avertissement à chaque rapport quand la date est antérieure de plus de 90 jours.
Les gaps de couverture d’enregistrement Gong ressemblent à de la malhonnêteté des reps. Garde-fou : le fichier de mapping de méthodologie déclare un recording_coverage_floor par étape. Les deals en dessous du plancher atterrissent dans needs_manager_review avec le gap de couverture exposé explicitement, pas dans fail.
Le rep conteste un verdict fail. Garde-fou : le rapport inclut les manques de règle déterministe verbatim et les patterns de phrases non correspondants. La conversation s’ancre dans le gap spécifique, que le rep peut corriger en mettant à jour le champ et en re-exécutant, ou contester avec des preuves hors-Gong que le manager accepte.

Stack

Salesforce — historique d’étapes, champs de deal, rôles de contacts, activités enregistrées
Gong — transcripts de conversations enregistrées, listes d’appels au niveau deal
Claude (Sonnet 4) — correspondance de phrases consciente de la méthodologie contre les transcripts, synthèse du verdict
Cron / planificateur de votre choix — le déclencheur hebdomadaire
Slack ou email — le canal digest où le rapport atterrit avant le point manager

Modifier cette page sur GitHub

Files in this artifact

Download all (.zip)

---
name: stage-progression-validator
description: Validate that a Salesforce opportunity genuinely meets its claimed stage's exit criteria. For each opp that progressed in a window, the skill checks deterministic field rules, cross-references rep-claimed milestones against Gong call evidence, and emits a pass/flag/fail verdict with the specific gap. Designed as a coaching trigger for RevOps weekly reviews, not as an enforcement gate.
---

# Stage progression validator

## When to invoke

Whenever you need to audit deals that progressed between Salesforce stages and want to know which progressions were buyer-driven versus rep-optimistic. Typical cadence: a weekly batch keyed to the forecast meeting (run Sunday night, review Monday morning). Also valid: a one-shot run on a single opportunity ID before a deal-desk review or before a manager 1:1.

Take an `Opportunity.Id` (single mode) or a window expressed as `week_ending=YYYY-MM-DD` (batch mode), plus a path to the methodology rubric. Produce a structured Markdown report with a row per progression and a verdict per row.

Do NOT invoke this skill for:

- **Auto-stage rollback.** The skill emits verdicts; it must not write back to Salesforce. A "fail" verdict is a coaching input, not an instruction to demote the deal — that decision is the manager's, with rep context the skill cannot see.
- **Performance management of reps.** Verdicts are noisy at the per-deal level and only meaningful as patterns over weeks. Using a single "fail" in a PIP is misuse and will collapse rep trust in the tool.
- **Comp implications.** Stage assignments drive forecast, sometimes accelerators. Routing this skill's output into comp calculations creates a direct incentive for reps to game the validator (refusing Gong recording, omitting rep notes, etc.). Keep this output separate from comp data flows.
- **Deals in stages without documented exit criteria.** Garbage in, garbage out. If the methodology doc has no rubric for the stage being validated, return `needs_methodology` rather than guessing a verdict.

## Inputs

- Required: `opp_id` OR `week_ending` — single opportunity or a Sunday-anchored ISO date for the batch window
- Required: `methodology_path` — path to the team's stage exit-criteria rubric (see `references/stage-criteria-template.md`)
- Required: `sfdc_token` — Salesforce session token with read on `Opportunity`, `OpportunityFieldHistory`, `Task`, `Event`, `OpportunityContactRole`
- Required: `gong_api_key` — Gong key with `calls/extensive` and `deals` scopes
- Optional: `methodology_mapping` — path to a methodology-mapping doc if the team uses MEDDPICC, MEDDIC, SPICED, or a custom framework (see `references/methodology-mapping-template.md`)
- Optional: `borderline_threshold` — float in `[0, 1]`, default `0.6`. Verdicts where the deterministic-criteria score falls between the threshold and `1.0 - threshold` are emitted as `needs_manager_review` rather than `flag`/`fail`.

## Reference files

Always read these from `references/` before scoring. Without them, the verdicts collapse to checking Salesforce required-field logic, which Salesforce itself already enforces.

- `references/stage-criteria-template.md` — the team's stage-by-stage exit criteria. Replace the template contents with the team's real rubric.
- `references/methodology-mapping-template.md` — maps the team's chosen sales methodology (MEDDPICC, MEDDIC, SPICED, BANT, custom) onto fields in Salesforce. The skill uses this to know which field holds the economic-buyer name, which holds the metric, etc.
- `references/sample-output-format.md` — the exact Markdown format for the report. The renderer downstream (Slack digest, email) parses this format.

## Method

Run the steps in order. Steps 3 and 4 are where the engineering choices matter; do not skip them.

### 1. Pull the candidate set

For batch mode, query `OpportunityFieldHistory` where `Field = 'StageName'` and `CreatedDate` falls inside the window. For single mode, query the same table filtered to the supplied `opp_id` and take the most recent `StageName` change. Skip progressions where the new stage has no entry in the methodology rubric — emit those as `needs_methodology`, not as `fail`.

### 2. Score deterministic criteria

For each candidate, compute a deterministic score in `[0, 1]` from the methodology rubric. Each rule in the rubric is one of three types:

- **Field rule** — a Salesforce field must hold a non-default value (e.g. `Economic_Buyer__c IS NOT NULL`).
- **Activity rule** — a logged activity of a specified type must exist in the prior 30 days (e.g. `Task.Type = 'Demo'`).
- **Stakeholder rule** — `OpportunityContactRole` must contain a contact with a role matching a regex (e.g. `Role MATCHES /^(VP|Director|C.+O)/`).

The score is the fraction of rules satisfied. This is structured-rubric, not free-form, by design: free-form natural-language criteria force the skill to interpret edge cases inconsistently across runs and produce verdicts that reps cannot predict or trust.

### 3. Cross-reference qualitative claims with Gong

The methodology mapping flags certain fields as `evidence_required: gong`. For each such field that holds a non-default value, the skill must find a Gong call within 30 days where the relevant phrase appears in the transcript.

Phrase matching is methodology-aware, not methodology-agnostic. For MEDDPICC's `Economic Buyer`, the skill searches transcripts for the buyer's name within 12 tokens of decision-language ("approve", "sign off", "budget owner", "final say"). For SPICED's `Critical Event`, it searches for date-bounded urgency language. The mapping doc names the phrase patterns per field — if the mapping says `evidence_required: gong` but provides no patterns, the skill emits `needs_methodology` rather than guessing what counts as evidence.

Why methodology-aware: a generic "look for any mention of the buyer name" check produces too many false passes (the rep mentioning the buyer in a call to a different stakeholder is not evidence of buyer commitment).

### 4. Combine scores into a verdict

Let `D` be the deterministic score from step 2 and `Q` be the fraction of qualitative claims with Gong evidence from step 3. Combine:

- `pass` — `D == 1.0` and `Q == 1.0`
- `flag` — `D >= 0.8` or `Q >= 0.8`, but not both at `1.0`
- `fail` — `D < borderline_threshold` and `Q < borderline_threshold`
- `needs_manager_review` — neither `pass`, `flag`, nor `fail`. The deal sits in the borderline band where false positives and false negatives both have non-trivial cost.

The `needs_manager_review` band exists because the alternative — forcing a binary `flag` versus `fail` on every borderline deal — produces noise that reps learn to dismiss. The borderline bucket goes to a separate queue that the manager hand-resolves, which preserves the signal in the `flag` and `fail` queues.

### 5. Emit the report

Write the report to stdout in the exact format from `references/sample-output-format.md`. Include the deterministic-rule misses verbatim (which rule failed) and the qualitative-claim misses with the field name and the phrase pattern that did not match. Do not paraphrase Salesforce field names or rep notes — the manager will compare the report against the Salesforce UI.

## Output format

```markdown
# Stage progression validation — week ending 2026-05-02

Window: 2026-04-26 → 2026-05-02
Opportunities scored: 18
- pass: 9
- flag: 4
- fail: 3
- needs_manager_review: 2
- needs_methodology: 0

## fail (3)

### Acme Corp — Stage 4 Negotiation
- Owner: jane.doe@example.com
- Progressed: 2026-04-29
- Deterministic score: 0.40 (2 of 5 rules satisfied)
- Qualitative score: 0.00 (0 of 2 claims supported)

Deterministic misses:
- `Economic_Buyer__c` is NULL
- `Decision_Criteria__c` is NULL
- `OpportunityContactRole` has no role matching `/^(VP|Director|C.+O)/`

Qualitative misses:
- `Economic_Buyer__c` claim: no Gong call in last 30 days references claimed buyer "Pat Ellis" within 12 tokens of decision-language pattern
- `Success_Criteria__c` claim: no Gong call in last 30 days contains success-criteria pattern

### {next fail row}
...

## flag (4)
...

## needs_manager_review (2)
...

## pass (9)
| Opp | Owner | New stage | Deterministic | Qualitative |
|---|---|---|---|---|
| ... | ... | ... | 1.00 | 1.00 |
```

## Watch-outs

- **Over-strict validation pushes reps to game stages.** If the rubric demands more than reps can plausibly satisfy without a buyer conversation that isn't yet warranted, reps will park deals one stage below their reality. Guard: instrument a "stage age" metric; if median stage age in the stage just before the strict gate balloons after the skill ships, the rubric is wrong, not the reps. Tune the rubric down before keeping the skill running.
- **Methodology mismatch.** A team that runs MEDDPICC in slides but stores nothing structured in Salesforce will fail every qualitative check. Guard: run the skill in `dry_run` mode for two weeks first; if more than 40% of opps emit `needs_methodology` or score `Q < 0.2` across the board, the methodology mapping doc is fictional — fix the doc or instrument the missing fields before going live.
- **Validator drift from real exit criteria.** Sales leaders quietly change what "Stage 3" means in QBRs; the rubric file does not get updated. Guard: append a `last_reviewed` field at the top of `references/stage-criteria-template.md` and have the skill emit a warning at the top of every report if `last_reviewed` is more than 90 days old. Stale rubrics produce confidently wrong verdicts, which is worse than no verdicts.
- **Gong recording-coverage gaps look like rep dishonesty.** Some calls genuinely happen off-Gong (in-person meetings, customer-side dial-in policies). Guard: the methodology mapping must include a `recording_coverage_floor` per stage; if a deal's recorded-call count is below the floor, emit `needs_manager_review` and surface the coverage gap explicitly rather than emitting `fail`.
- **Single-deal rage at a `fail` verdict.** A "fail" on a deal a rep is confident in will trigger pushback. Guard: the report must include the deterministic-rule misses and the unmatched phrase patterns verbatim. The rep can then either (a) update the field/log the activity and re-run, or (b) point to off-Gong evidence the manager accepts. Either way, the conversation is grounded in the specific gap, not in the verdict label.

# Stage exit-criteria rubric — TEMPLATE

> Replace this template's contents with the team's real stage-by-stage rubric.
> The stage-progression-validator skill reads this file on every run.
> Without your real rules, the verdicts are meaningless.

## Last reviewed

YYYY-MM-DD — bump this date every time the rubric is materially changed. The skill warns at the top of the report if this date is more than 90 days old.

## Methodology in use

One of: `MEDDPICC`, `MEDDIC`, `SPICED`, `BANT`, `custom`. Keep this string in sync with `methodology-mapping-template.md` so the skill loads the right phrase patterns.

## Stages

For each stage that the skill should validate, list rules under three buckets: `field_rules`, `activity_rules`, `stakeholder_rules`. Stages omitted from this file are emitted as `needs_methodology` rather than scored.

### Stage 2 — Discovery confirmed

field_rules:
- `Pain_Point__c IS NOT NULL`
- `Decision_Timeline__c IS NOT NULL`
- `Budget_Range__c IS NOT NULL`

activity_rules:
- `Task.Type = 'Discovery Call'` in last 30 days

stakeholder_rules:
- `OpportunityContactRole` includes a contact with role matching `/^(Manager|Director|VP)/`

evidence_required (qualitative — checked against Gong):
- `Pain_Point__c`
- `Decision_Timeline__c`

### Stage 3 — Solution validated

field_rules:
- `Success_Criteria__c IS NOT NULL`
- `Technical_Validation_Complete__c = true`
- `Decision_Criteria__c IS NOT NULL`

activity_rules:
- `Task.Type = 'Demo'` in last 45 days
- `Task.Type = 'Technical Deep Dive'` in last 30 days

stakeholder_rules:
- `OpportunityContactRole` includes a contact with role matching `/^(VP|Director)/`
- At least one contact with `Is_Technical_Buyer__c = true`

evidence_required (qualitative):
- `Success_Criteria__c`

### Stage 4 — Negotiation

field_rules:
- `Economic_Buyer__c IS NOT NULL`
- `Decision_Criteria__c IS NOT NULL`
- `Paper_Process__c IS NOT NULL`
- `Close_Plan__c IS NOT NULL`
- `Competitive_Landscape__c IS NOT NULL`

activity_rules:
- `Task.Type = 'Pricing Discussion'` in last 30 days

stakeholder_rules:
- `OpportunityContactRole` includes a contact with role matching `/^(VP|Director|C.+O)/`

evidence_required (qualitative):
- `Economic_Buyer__c`
- `Close_Plan__c`

### Stage 5 — Verbal commit

field_rules:
- `Verbal_Commit_Date__c IS NOT NULL`
- `Procurement_Engaged__c = true`
- `MSA_Status__c IN ('In review', 'Approved')`

activity_rules:
- `Task.Type = 'Procurement Call'` in last 21 days

stakeholder_rules:
- `OpportunityContactRole` includes one contact with role `Procurement`
- `OpportunityContactRole` includes one contact with role `Legal` if `MSA_Status__c = 'In review'`

evidence_required (qualitative):
- `Verbal_Commit_Date__c`

## Recording-coverage floor (per stage)

Minimum recorded calls in the prior 30 days for the deal. If the deal is below the floor, the skill emits `needs_manager_review` and surfaces the coverage gap rather than scoring qualitative checks.

| Stage | Min recorded calls in last 30 days |
|---|---|
| Stage 2 | 1 |
| Stage 3 | 2 |
| Stage 4 | 2 |
| Stage 5 | 1 |

# Methodology mapping — TEMPLATE

> Replace this template's contents with the team's real mapping. The skill uses
> this to translate methodology concepts (e.g. MEDDPICC's "Economic Buyer")
> into the Salesforce field that holds the answer and into Gong phrase patterns
> that count as supporting evidence.

## Methodology in use

`MEDDPICC` (replace if your team uses a different framework — see worked examples for MEDDIC, SPICED, and a custom framework below).

## MEDDPICC mapping (replace contents with team's real fields)

| MEDDPICC concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| Metric | `Success_Metric__c` | gong | quantitative-language pattern (numbers, units, deltas) within 20 tokens of the field value |
| Economic Buyer | `Economic_Buyer__c` | gong | the buyer's name within 12 tokens of decision-language: `approve`, `sign off`, `budget owner`, `final say`, `the call is mine` |
| Decision Criteria | `Decision_Criteria__c` | none | n/a |
| Decision Process | `Decision_Process__c` | gong | step-language pattern: ordinal markers (`first`, `then`, `after that`) with named owners |
| Paper Process | `Paper_Process__c` | gong | procurement or legal entity name within 30 tokens of `MSA`, `redline`, `security review`, `vendor onboarding` |
| Identify Pain | `Pain_Point__c` | gong | the rep-claimed pain phrase or a synonym in customer's own voice (not the rep's) |
| Champion | `Champion__c` | gong | the named contact speaking on the customer's behalf in at least one call where the rep is mostly listening |
| Competition | `Competitive_Landscape__c` | none | n/a |

## MEDDIC mapping (worked example for teams on MEDDIC, not MEDDPICC)

Replace your `methodology in use` above with `MEDDIC` and use this table instead:

| MEDDIC concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| Metrics | `Success_Metric__c` | gong | quantitative-language pattern |
| Economic Buyer | `Economic_Buyer__c` | gong | name within 12 tokens of decision-language |
| Decision Criteria | `Decision_Criteria__c` | none | n/a |
| Decision Process | `Decision_Process__c` | gong | step-language pattern |
| Identify Pain | `Pain_Point__c` | gong | pain phrase in customer's voice |
| Champion | `Champion__c` | gong | customer-led call segment |

## SPICED mapping (worked example)

| SPICED concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| Situation | `Current_State__c` | none | n/a |
| Pain | `Pain_Point__c` | gong | pain phrase in customer's voice |
| Impact | `Quantified_Impact__c` | gong | quantified-cost language: currency or time units within 20 tokens of pain |
| Critical Event | `Critical_Event__c` | gong | date-bounded urgency: a specific date or quarter within 15 tokens of consequence-language (`miss`, `slip`, `risk`) |
| Decision | `Decision_Process__c` | gong | named decision steps with owners |

## Custom framework template

If the team uses a homegrown rubric, list each concept on its own row with the same four columns. The skill treats `Salesforce field` as the ground truth for "what was claimed" and the `Phrase patterns` as the ground truth for "what counts as supporting evidence in Gong."

| Custom concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| {concept} | {field} | `gong` or `none` | {regex or natural-language phrase rule} |

## Last reviewed

YYYY-MM-DD

# Sample output format — REFERENCE

> The stage-progression-validator skill must emit the report in this exact
> format. Downstream renderers (Slack digest job, weekly email) parse this
> Markdown — keep section headings and ordering stable.

## Report header

```markdown
# Stage progression validation — week ending YYYY-MM-DD

Window: YYYY-MM-DD → YYYY-MM-DD
Methodology: MEDDPICC (rubric last reviewed YYYY-MM-DD)
Opportunities scored: N
- pass: N
- flag: N
- fail: N
- needs_manager_review: N
- needs_methodology: N
```

If the rubric `last_reviewed` is more than 90 days old, prepend a single line: `> WARNING: stage-criteria rubric last reviewed YYYY-MM-DD (over 90 days).`

## fail section

One block per failed deal. Order by deterministic-score ascending (worst first), tie-break by qualitative-score ascending.

```markdown
## fail (N)

### {Account name} — {New stage label}
- Opp ID: 006xxxxxxxxxxxxxxx
- Owner: owner@example.com
- Progressed: YYYY-MM-DD
- Deterministic score: D.DD (X of Y rules satisfied)
- Qualitative score: D.DD (X of Y claims supported)

Deterministic misses:
- `{field}` is NULL
- `OpportunityContactRole` has no role matching `/{regex}/`
- `Task.Type = '{type}'` not found in last {N} days

Qualitative misses:
- `{field}` claim: no Gong call in last 30 days matches pattern `{pattern_name}`
- `{field}` claim: no Gong call in last 30 days contains `{pattern}` near claimed value

Recording coverage: {N} recorded calls in last 30 days (floor: {M}).
```

## flag section

Same block format as `fail`. Order by combined score ascending.

## needs_manager_review section

Same block format. Add a one-line `Reason:` field naming why the deal landed in the borderline band — `low recording coverage`, `one rule short`, `mixed signal across deterministic and qualitative`, etc.

## needs_methodology section

```markdown
## needs_methodology (N)

| Opp | Owner | New stage | Reason |
|---|---|---|---|
| {Opp ID} | {owner} | {stage label} | no rubric entry for stage |
```

## pass section

Tabular, no per-deal block — passes are not interesting in the digest.

```markdown
## pass (N)

| Opp | Owner | New stage | Deterministic | Qualitative |
|---|---|---|---|---|
| {Opp ID} | {owner} | {stage label} | 1.00 | 1.00 |
```

## Footer

```markdown
---
Generated by stage-progression-validator skill at YYYY-MM-DDTHH:MM:SSZ
Inputs: methodology_path={path}, borderline_threshold={float}
```