claude-skill

Validador de progressão de stage para Salesforce

Dificuldade

intermediário

Tempo de setup

60min

Para

revops

RevOps

Stack

Um Claude Skill que audita quais oportunidades do Salesforce genuinamente atendem aos critérios de saída do stage para o qual acabaram de mover. Para cada opp que progrediu na semana anterior, o Skill verifica as regras determinísticas (campos obrigatórios, atividades registradas, papéis de stakeholder), depois cruza as alegações qualitativas do rep contra as transcrições de chamadas do Gong. O output é uma fila de coaching para a revisão semanal do RevOps, não um portão de enforçamento que reverte deals automaticamente.

O bundle de artefatos está em apps/web/public/artifacts/stage-progression-validator-skill/ e contém SKILL.md mais três templates de referência: references/1-stage-criteria-template.md (a rubrica de stage da equipe), references/2-methodology-mapping-template.md (como MEDDPICC, MEDDIC, SPICED, BANT ou um framework customizado mapeia para os campos do Salesforce e padrões de frase do Gong) e references/3-sample-output-format.md (o Markdown exato que o Skill emite).

Quando usar

Execute isso na cadência da sua reunião de forecast. O padrão canônico é um lote de domingo à noite com chave em week_ending, com o relatório chegando num canal do Slack antes do huddle de segunda de manhã com o manager. O modo de opp única também é válido — um revisor de deal-desk pode executar o Skill contra um único Opportunity.Id antes de uma reunião de aprovação de pricing, ou um manager pode executá-lo contra um único deal antes de um 1:1 para fundamentar a conversa nas lacunas específicas em vez de num vago sentimento de “parece travado”.

A verificação de alegação qualitativa é a parte que se paga por si mesma. O Salesforce já enforça regras de validação de campos obrigatórios; o que ele não consegue fazer é notar que o rep alegou “comprador concordou com os critérios de sucesso” e depois nenhuma chamada do Gong nos últimos 45 dias capturou realmente essa conversa. O Skill é ciente da metodologia em como busca — para o economic buyer do MEDDPICC, ele procura o nome do comprador dentro de doze tokens de linguagem de decisão (“approve”, “sign off”, “budget owner”) em vez de apenas qualquer menção ao nome. Essa distinção é o que separa um flag útil de um falso positivo que os reps aprendem a ignorar.

Quando NÃO usar

Auto-rollback. Não conecte o output do Skill a uma atualização do Salesforce que rebaixa deals num veredicto fail. O veredicto é um input entre vários; o manager é dono da decisão de rebaixamento com contexto completo que o Skill não consegue ver (reuniões fora do Gong, compromissos em canais paralelos, peculiaridades de procurement do lado do cliente).
Gestão de performance. Um único fail num único deal é ruído. O sinal são padrões ao longo de semanas — o rep cuja taxa de fail sobe de 5% para 30% ao longo de um trimestre enquanto os pares se mantêm estáveis. Usar um veredicto único num PIP colapsa a confiança do rep e o Skill para de funcionar.
Inputs de comp. O stage conduz o forecast, às vezes conduz aceleradores. Se o output do validador fluir para cálculos de comp, você criou um incentivo direto para os reps jogarem os inputs — recusar gravação do Gong, omitir notas, armazenar dados em planilhas na gaveta. Mantenha o output do validador no canal de coaching e fora do pipeline de comp.
Stages sem uma rubrica documentada. Se references/1-stage-criteria-template.md não tiver nenhuma entrada para o stage sendo validado, o Skill emite needs_methodology em vez de adivinhar. Não “ajuste” o Skill para pontuar esses stages com um padrão — corrija a rubrica.
Equipes que não armazenam nada estruturado. Uma equipe executando MEDDPICC em slides e não no Salesforce vai falhar em toda verificação qualitativa. Execute o Skill em modo de execução em seco por duas semanas; se mais de 40% das opps cair em needs_methodology ou pontuar abaixo de 0,2 nas verificações qualitativas de forma geral, o documento de mapeamento de metodologia é fictício. Corrija o documento ou instrumente os campos ausentes antes de ir ao vivo.

Setup

Documente os stages. Abra references/1-stage-criteria-template.md e substitua o conteúdo do template pela rubrica real da sua equipe, stage por stage. Cada stage tem três buckets de regras: field_rules (um campo do Salesforce deve conter um valor não padrão), activity_rules (uma atividade registrada de um tipo especificado deve existir dentro de uma janela de recência) e stakeholder_rules (OpportunityContactRole deve incluir um contato com um papel correspondendo a uma regex). Marque campos como evidence_required: gong quando quiser uma verificação cruzada de transcrição do Gong na alegação qualitativa.
Mapeie a metodologia. Edite references/2-methodology-mapping-template.md para corresponder ao framework da sua equipe. O arquivo inclui exemplos trabalhados para MEDDPICC, MEDDIC e SPICED — copie o que corresponder e depois ajuste os nomes de campos do Salesforce para os nomes de API reais da sua org. A coluna de padrões de frase é o que diz ao Skill o que conta como evidência do Gong; não deixe como o padrão do template a menos que seus campos correspondam genuinamente aos mapeamentos de exemplo.
Instale o Skill. Faça o drop do bundle em ~/.claude/skills/stage-progression-validator/. Configure SFDC_TOKEN (somente leitura em Opportunity, OpportunityFieldHistory, Task, Event, OpportunityContactRole) e GONG_API_KEY (com escopos calls/extensive e deals). Somente leitura é o escopo certo; o Skill não deve escrever de volta no Salesforce.
Agende a execução semanal. Um cron simples está ótimo — claude run stage-progression-validator week_ending=$(date -d 'sunday' +%F) domingo às 22:00. Direcione o output para o seu canal do Slack ou um email de digest semanal.
Pair com um ritual de coaching. A fila de veredictos é inútil se ninguém a abre. Slot fixo de 30 minutos na segunda-feira, manager percorre as linhas fail e needs_manager_review com cada rep. Após oito semanas, o volume nesses buckets deve cair — essa é a métrica de sucesso.

O que o skill realmente faz

Para cada progressão na janela, o Skill calcula dois scores. O score determinístico é a fração de regras de metodologia satisfeitas — cinco regras, três passam, o score é 0,6. Isso é rubrica estruturada em vez de linguagem natural livre por design: critérios em forma livre forçam o modelo a interpretar casos extremos inconsistentemente entre execuções e reps e não conseguem prever o que vai disparar um fail, o que mata a confiança de que a ferramenta depende.

O score qualitativo é a fração de alegações evidence_required: gong que encontram evidências de transcrição de suporte dentro da janela relevante. O matching de frase é ciente da metodologia. Para o economic buyer do MEDDPICC, o Skill procura o nome do comprador dentro de doze tokens de linguagem de decisão. Para o critical event do SPICED, procura linguagem de urgência limitada por data com verbos de consequência (“miss”, “slip”, “risk”) próximos. Uma verificação ingênua de “qualquer menção ao nome do comprador conta” produz passes falsos demais — o rep mencionando o comprador de passagem numa chamada para outro stakeholder não é evidência de comprometimento do comprador.

Os dois scores se combinam em um de cinco veredictos: pass (ambos em 1,0), flag (um bucket forte, o outro fraco), fail (ambos abaixo do limiar de borderline, padrão 0,6), needs_manager_review (a faixa de borderline entre flag e fail — nenhum score claramente ruim nem claramente bom) ou needs_methodology (a rubrica não tem entrada para este stage). O bucket needs_manager_review existe porque forçar cada deal borderline num binário flag versus fail produz ruído que os reps aprendem a descartar; as linhas de borderline vão para uma fila separada que o manager resolve manualmente, o que preserva o sinal nos outros buckets.

Realidade de custos

O Claude Sonnet 4 ao preço atual roda aproximadamente 15-25 centavos de dólar por oportunidade validada, dominado pela leitura de transcrições do Gong (janela típica de 30 dias cobre 4-8 chamadas por deal ativo a 5-15K tokens cada, mais algumas centenas de tokens de rubrica de metodologia carregada das referências). Um lote semanal de 50 deals custa por volta de 7-12 USD em gasto de API.

O tempo economizado é o caso para o Skill. Um lead de RevOps fazendo essa auditoria à mão gasta 20-30 minutos por deal — puxando o histórico do stage, abrindo cada chamada do Gong, escaneando pelo nome do comprador e a conversa de critérios de sucesso. A 50 deals isso é dois dias inteiros de auditoria manual por semana, que é por que quase nenhuma equipe realmente faz. O Skill colapsa isso para uma passagem de revisão de relatório de 4-6 minutos no digest, com inspeção mais profunda apenas nas linhas nos buckets fail e needs_manager_review — tipicamente 5-10 deals de 50, então 30-60 minutos de revisão focada. Líquido: 12-15 horas de RevOps por semana de volta, por menos de 15 USD em custo de API.

Métrica de sucesso

Rastreie duas métricas ao longo de uma rampa de oito semanas. Primeiro, a taxa de fail — a proporção de progressões semanais que caem em fail. Uma rampa saudável mostra queda de uma linha de base (frequentemente 25-40% na primeira execução) para menos de 10% à medida que os reps internalizam o que a rubrica requer antes de avançar um deal. Se não cair, ou a rubrica está muito rígida (os reps fisicamente não conseguem satisfazê-la sem conversas com o comprador para as quais o deal não está pronto) ou o loop de coaching não está acontecendo. Segundo, a idade mediana do stage no stage imediatamente antes do portão mais rígido. Se isso envelhece — significando que os reps estão estacionando deals um stage abaixo da realidade para desviar do portão — a rubrica está errada, não os reps. Ajuste a rubrica antes de continuar executando o Skill.

Versus as alternativas

Regras de validação do Salesforce — essas enforçam a presença de campo no nível do registro (você não consegue salvar uma opp no Stage 4 sem Economic_Buyer__c preenchido). Não conseguem fazer a verificação qualitativa: um rep pode digitar qualquer nome no campo, as regras de validação passam, o Skill captura que nenhuma chamada do Gong suporta a alegação. As regras de validação também são um instrumento contundente porque rejeitam o save completamente; o Skill produz um veredicto graduado com o qual o manager trabalha.
Clari, Gong Forecast e ferramentas similares de AI-forecasting — fazem validação de stage como parte de uma superfície de produto muito maior (forecast, revisão de deal, conversation analytics, coaching). Espere $50-150 USD por rep por mês versus o custo de aproximadamente $10-15 USD por semana de API deste Skill. Escolha a plataforma se você também precisa das camadas de forecasting e conversation analytics; escolha este Skill se a sua lacuna é especificamente a auditoria de progressão de stage e você já tem Salesforce e Gong.
Revisões manuais de deal-desk — um lead de RevOps humano lendo cada progressão. A ferramenta certa para equipes enterprise de alto ACV onde os deals são poucos e consequentes. Ferramenta errada para SMB ou midmarket de volume onde o custo de auditoria (12-15 horas por semana) significa que não acontece de jeito nenhum e progressões ruins chegam ao forecast.
Não fazer nada — a linha de base real na maioria das equipes. A acurácia do forecast na maioria das orgs de B2B SaaS fica em algum lugar entre medíocre e embaraçosa precisamente porque os stages nos quais o forecast é construído não são validados. O custo de não fazer nada aparece na reação do CFO a um quarter ruim, que é um momento pior para descobrir que os dados de input eram pouco confiáveis.

Pontos de atenção

Validação excessivamente rígida empurra os reps a jogar com os stages. Guarda: instrumente a idade mediana do stage imediatamente antes do portão mais rígido. Se balona depois que o Skill for publicado, a rubrica está errada; ajuste antes de continuar.
Mismatch de metodologia entre slides e Salesforce. Guarda: execute em seco por duas semanas. Se needs_methodology mais scores qualitativos baixos cobrirem mais de 40% das opps, corrija o mapeamento de metodologia ou a instrumentação de campo subjacente antes de tratar qualquer veredicto como acionável.
Drift do validador dos critérios de saída reais. Líderes de vendas redefinem silenciosamente os significados de stage nos QBRs; o arquivo de rubrica não é atualizado. Guarda: a rubrica carrega um campo last_reviewed; o Skill prefixa um aviso a todo relatório quando a data for mais antiga que 90 dias.
Lacunas de cobertura de gravação do Gong parecem desonestidade do rep. Guarda: o arquivo de mapeamento de metodologia declara um recording_coverage_floor por stage. Deals abaixo do piso ficam em needs_manager_review com a lacuna de cobertura surfaceada explicitamente, não em fail.
Pushback do rep num veredicto fail. Guarda: o relatório inclui os misses de regras determinísticas verbatim e os padrões de frase sem correspondência. A conversa fundamenta na lacuna específica, que o rep pode corrigir atualizando o campo e re-executando, ou rebater com evidências fora do Gong que o manager aceita.

Stack

Salesforce — histórico de stage, campos de deal, papéis de contato, atividades registradas
Gong — transcrições de conversas gravadas, listas de chamadas por deal
Claude (Sonnet 4) — matching de frase ciente da metodologia contra transcrições, síntese de veredicto
Cron / scheduler de escolha — o trigger semanal
Slack ou email — o canal de digest onde o relatório chega antes do huddle do manager

Editar esta página no GitHub

Arquivos deste artefato

Baixar tudo (.zip)

---
name: stage-progression-validator
description: Validate that a Salesforce opportunity genuinely meets its claimed stage's exit criteria. For each opp that progressed in a window, the skill checks deterministic field rules, cross-references rep-claimed milestones against Gong call evidence, and emits a pass/flag/fail verdict with the specific gap. Designed as a coaching trigger for RevOps weekly reviews, not as an enforcement gate.
---

# Stage progression validator

## When to invoke

Whenever you need to audit deals that progressed between Salesforce stages and want to know which progressions were buyer-driven versus rep-optimistic. Typical cadence: a weekly batch keyed to the forecast meeting (run Sunday night, review Monday morning). Also valid: a one-shot run on a single opportunity ID before a deal-desk review or before a manager 1:1.

Take an `Opportunity.Id` (single mode) or a window expressed as `week_ending=YYYY-MM-DD` (batch mode), plus a path to the methodology rubric. Produce a structured Markdown report with a row per progression and a verdict per row.

Do NOT invoke this skill for:

- **Auto-stage rollback.** The skill emits verdicts; it must not write back to Salesforce. A "fail" verdict is a coaching input, not an instruction to demote the deal — that decision is the manager's, with rep context the skill cannot see.
- **Performance management of reps.** Verdicts are noisy at the per-deal level and only meaningful as patterns over weeks. Using a single "fail" in a PIP is misuse and will collapse rep trust in the tool.
- **Comp implications.** Stage assignments drive forecast, sometimes accelerators. Routing this skill's output into comp calculations creates a direct incentive for reps to game the validator (refusing Gong recording, omitting rep notes, etc.). Keep this output separate from comp data flows.
- **Deals in stages without documented exit criteria.** Garbage in, garbage out. If the methodology doc has no rubric for the stage being validated, return `needs_methodology` rather than guessing a verdict.

## Inputs

- Required: `opp_id` OR `week_ending` — single opportunity or a Sunday-anchored ISO date for the batch window
- Required: `methodology_path` — path to the team's stage exit-criteria rubric (see `references/stage-criteria-template.md`)
- Required: `sfdc_token` — Salesforce session token with read on `Opportunity`, `OpportunityFieldHistory`, `Task`, `Event`, `OpportunityContactRole`
- Required: `gong_api_key` — Gong key with `calls/extensive` and `deals` scopes
- Optional: `methodology_mapping` — path to a methodology-mapping doc if the team uses MEDDPICC, MEDDIC, SPICED, or a custom framework (see `references/methodology-mapping-template.md`)
- Optional: `borderline_threshold` — float in `[0, 1]`, default `0.6`. Verdicts where the deterministic-criteria score falls between the threshold and `1.0 - threshold` are emitted as `needs_manager_review` rather than `flag`/`fail`.

## Reference files

Always read these from `references/` before scoring. Without them, the verdicts collapse to checking Salesforce required-field logic, which Salesforce itself already enforces.

- `references/stage-criteria-template.md` — the team's stage-by-stage exit criteria. Replace the template contents with the team's real rubric.
- `references/methodology-mapping-template.md` — maps the team's chosen sales methodology (MEDDPICC, MEDDIC, SPICED, BANT, custom) onto fields in Salesforce. The skill uses this to know which field holds the economic-buyer name, which holds the metric, etc.
- `references/sample-output-format.md` — the exact Markdown format for the report. The renderer downstream (Slack digest, email) parses this format.

## Method

Run the steps in order. Steps 3 and 4 are where the engineering choices matter; do not skip them.

### 1. Pull the candidate set

For batch mode, query `OpportunityFieldHistory` where `Field = 'StageName'` and `CreatedDate` falls inside the window. For single mode, query the same table filtered to the supplied `opp_id` and take the most recent `StageName` change. Skip progressions where the new stage has no entry in the methodology rubric — emit those as `needs_methodology`, not as `fail`.

### 2. Score deterministic criteria

For each candidate, compute a deterministic score in `[0, 1]` from the methodology rubric. Each rule in the rubric is one of three types:

- **Field rule** — a Salesforce field must hold a non-default value (e.g. `Economic_Buyer__c IS NOT NULL`).
- **Activity rule** — a logged activity of a specified type must exist in the prior 30 days (e.g. `Task.Type = 'Demo'`).
- **Stakeholder rule** — `OpportunityContactRole` must contain a contact with a role matching a regex (e.g. `Role MATCHES /^(VP|Director|C.+O)/`).

The score is the fraction of rules satisfied. This is structured-rubric, not free-form, by design: free-form natural-language criteria force the skill to interpret edge cases inconsistently across runs and produce verdicts that reps cannot predict or trust.

### 3. Cross-reference qualitative claims with Gong

The methodology mapping flags certain fields as `evidence_required: gong`. For each such field that holds a non-default value, the skill must find a Gong call within 30 days where the relevant phrase appears in the transcript.

Phrase matching is methodology-aware, not methodology-agnostic. For MEDDPICC's `Economic Buyer`, the skill searches transcripts for the buyer's name within 12 tokens of decision-language ("approve", "sign off", "budget owner", "final say"). For SPICED's `Critical Event`, it searches for date-bounded urgency language. The mapping doc names the phrase patterns per field — if the mapping says `evidence_required: gong` but provides no patterns, the skill emits `needs_methodology` rather than guessing what counts as evidence.

Why methodology-aware: a generic "look for any mention of the buyer name" check produces too many false passes (the rep mentioning the buyer in a call to a different stakeholder is not evidence of buyer commitment).

### 4. Combine scores into a verdict

Let `D` be the deterministic score from step 2 and `Q` be the fraction of qualitative claims with Gong evidence from step 3. Combine:

- `pass` — `D == 1.0` and `Q == 1.0`
- `flag` — `D >= 0.8` or `Q >= 0.8`, but not both at `1.0`
- `fail` — `D < borderline_threshold` and `Q < borderline_threshold`
- `needs_manager_review` — neither `pass`, `flag`, nor `fail`. The deal sits in the borderline band where false positives and false negatives both have non-trivial cost.

The `needs_manager_review` band exists because the alternative — forcing a binary `flag` versus `fail` on every borderline deal — produces noise that reps learn to dismiss. The borderline bucket goes to a separate queue that the manager hand-resolves, which preserves the signal in the `flag` and `fail` queues.

### 5. Emit the report

Write the report to stdout in the exact format from `references/sample-output-format.md`. Include the deterministic-rule misses verbatim (which rule failed) and the qualitative-claim misses with the field name and the phrase pattern that did not match. Do not paraphrase Salesforce field names or rep notes — the manager will compare the report against the Salesforce UI.

## Output format

```markdown
# Stage progression validation — week ending 2026-05-02

Window: 2026-04-26 → 2026-05-02
Opportunities scored: 18
- pass: 9
- flag: 4
- fail: 3
- needs_manager_review: 2
- needs_methodology: 0

## fail (3)

### Acme Corp — Stage 4 Negotiation
- Owner: jane.doe@example.com
- Progressed: 2026-04-29
- Deterministic score: 0.40 (2 of 5 rules satisfied)
- Qualitative score: 0.00 (0 of 2 claims supported)

Deterministic misses:
- `Economic_Buyer__c` is NULL
- `Decision_Criteria__c` is NULL
- `OpportunityContactRole` has no role matching `/^(VP|Director|C.+O)/`

Qualitative misses:
- `Economic_Buyer__c` claim: no Gong call in last 30 days references claimed buyer "Pat Ellis" within 12 tokens of decision-language pattern
- `Success_Criteria__c` claim: no Gong call in last 30 days contains success-criteria pattern

### {next fail row}
...

## flag (4)
...

## needs_manager_review (2)
...

## pass (9)
| Opp | Owner | New stage | Deterministic | Qualitative |
|---|---|---|---|---|
| ... | ... | ... | 1.00 | 1.00 |
```

## Watch-outs

- **Over-strict validation pushes reps to game stages.** If the rubric demands more than reps can plausibly satisfy without a buyer conversation that isn't yet warranted, reps will park deals one stage below their reality. Guard: instrument a "stage age" metric; if median stage age in the stage just before the strict gate balloons after the skill ships, the rubric is wrong, not the reps. Tune the rubric down before keeping the skill running.
- **Methodology mismatch.** A team that runs MEDDPICC in slides but stores nothing structured in Salesforce will fail every qualitative check. Guard: run the skill in `dry_run` mode for two weeks first; if more than 40% of opps emit `needs_methodology` or score `Q < 0.2` across the board, the methodology mapping doc is fictional — fix the doc or instrument the missing fields before going live.
- **Validator drift from real exit criteria.** Sales leaders quietly change what "Stage 3" means in QBRs; the rubric file does not get updated. Guard: append a `last_reviewed` field at the top of `references/stage-criteria-template.md` and have the skill emit a warning at the top of every report if `last_reviewed` is more than 90 days old. Stale rubrics produce confidently wrong verdicts, which is worse than no verdicts.
- **Gong recording-coverage gaps look like rep dishonesty.** Some calls genuinely happen off-Gong (in-person meetings, customer-side dial-in policies). Guard: the methodology mapping must include a `recording_coverage_floor` per stage; if a deal's recorded-call count is below the floor, emit `needs_manager_review` and surface the coverage gap explicitly rather than emitting `fail`.
- **Single-deal rage at a `fail` verdict.** A "fail" on a deal a rep is confident in will trigger pushback. Guard: the report must include the deterministic-rule misses and the unmatched phrase patterns verbatim. The rep can then either (a) update the field/log the activity and re-run, or (b) point to off-Gong evidence the manager accepts. Either way, the conversation is grounded in the specific gap, not in the verdict label.

# Stage exit-criteria rubric — TEMPLATE

> Replace this template's contents with the team's real stage-by-stage rubric.
> The stage-progression-validator skill reads this file on every run.
> Without your real rules, the verdicts are meaningless.

## Last reviewed

YYYY-MM-DD — bump this date every time the rubric is materially changed. The skill warns at the top of the report if this date is more than 90 days old.

## Methodology in use

One of: `MEDDPICC`, `MEDDIC`, `SPICED`, `BANT`, `custom`. Keep this string in sync with `methodology-mapping-template.md` so the skill loads the right phrase patterns.

## Stages

For each stage that the skill should validate, list rules under three buckets: `field_rules`, `activity_rules`, `stakeholder_rules`. Stages omitted from this file are emitted as `needs_methodology` rather than scored.

### Stage 2 — Discovery confirmed

field_rules:
- `Pain_Point__c IS NOT NULL`
- `Decision_Timeline__c IS NOT NULL`
- `Budget_Range__c IS NOT NULL`

activity_rules:
- `Task.Type = 'Discovery Call'` in last 30 days

stakeholder_rules:
- `OpportunityContactRole` includes a contact with role matching `/^(Manager|Director|VP)/`

evidence_required (qualitative — checked against Gong):
- `Pain_Point__c`
- `Decision_Timeline__c`

### Stage 3 — Solution validated

field_rules:
- `Success_Criteria__c IS NOT NULL`
- `Technical_Validation_Complete__c = true`
- `Decision_Criteria__c IS NOT NULL`

activity_rules:
- `Task.Type = 'Demo'` in last 45 days
- `Task.Type = 'Technical Deep Dive'` in last 30 days

stakeholder_rules:
- `OpportunityContactRole` includes a contact with role matching `/^(VP|Director)/`
- At least one contact with `Is_Technical_Buyer__c = true`

evidence_required (qualitative):
- `Success_Criteria__c`

### Stage 4 — Negotiation

field_rules:
- `Economic_Buyer__c IS NOT NULL`
- `Decision_Criteria__c IS NOT NULL`
- `Paper_Process__c IS NOT NULL`
- `Close_Plan__c IS NOT NULL`
- `Competitive_Landscape__c IS NOT NULL`

activity_rules:
- `Task.Type = 'Pricing Discussion'` in last 30 days

stakeholder_rules:
- `OpportunityContactRole` includes a contact with role matching `/^(VP|Director|C.+O)/`

evidence_required (qualitative):
- `Economic_Buyer__c`
- `Close_Plan__c`

### Stage 5 — Verbal commit

field_rules:
- `Verbal_Commit_Date__c IS NOT NULL`
- `Procurement_Engaged__c = true`
- `MSA_Status__c IN ('In review', 'Approved')`

activity_rules:
- `Task.Type = 'Procurement Call'` in last 21 days

stakeholder_rules:
- `OpportunityContactRole` includes one contact with role `Procurement`
- `OpportunityContactRole` includes one contact with role `Legal` if `MSA_Status__c = 'In review'`

evidence_required (qualitative):
- `Verbal_Commit_Date__c`

## Recording-coverage floor (per stage)

Minimum recorded calls in the prior 30 days for the deal. If the deal is below the floor, the skill emits `needs_manager_review` and surfaces the coverage gap rather than scoring qualitative checks.

| Stage | Min recorded calls in last 30 days |
|---|---|
| Stage 2 | 1 |
| Stage 3 | 2 |
| Stage 4 | 2 |
| Stage 5 | 1 |

# Methodology mapping — TEMPLATE

> Replace this template's contents with the team's real mapping. The skill uses
> this to translate methodology concepts (e.g. MEDDPICC's "Economic Buyer")
> into the Salesforce field that holds the answer and into Gong phrase patterns
> that count as supporting evidence.

## Methodology in use

`MEDDPICC` (replace if your team uses a different framework — see worked examples for MEDDIC, SPICED, and a custom framework below).

## MEDDPICC mapping (replace contents with team's real fields)

| MEDDPICC concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| Metric | `Success_Metric__c` | gong | quantitative-language pattern (numbers, units, deltas) within 20 tokens of the field value |
| Economic Buyer | `Economic_Buyer__c` | gong | the buyer's name within 12 tokens of decision-language: `approve`, `sign off`, `budget owner`, `final say`, `the call is mine` |
| Decision Criteria | `Decision_Criteria__c` | none | n/a |
| Decision Process | `Decision_Process__c` | gong | step-language pattern: ordinal markers (`first`, `then`, `after that`) with named owners |
| Paper Process | `Paper_Process__c` | gong | procurement or legal entity name within 30 tokens of `MSA`, `redline`, `security review`, `vendor onboarding` |
| Identify Pain | `Pain_Point__c` | gong | the rep-claimed pain phrase or a synonym in customer's own voice (not the rep's) |
| Champion | `Champion__c` | gong | the named contact speaking on the customer's behalf in at least one call where the rep is mostly listening |
| Competition | `Competitive_Landscape__c` | none | n/a |

## MEDDIC mapping (worked example for teams on MEDDIC, not MEDDPICC)

Replace your `methodology in use` above with `MEDDIC` and use this table instead:

| MEDDIC concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| Metrics | `Success_Metric__c` | gong | quantitative-language pattern |
| Economic Buyer | `Economic_Buyer__c` | gong | name within 12 tokens of decision-language |
| Decision Criteria | `Decision_Criteria__c` | none | n/a |
| Decision Process | `Decision_Process__c` | gong | step-language pattern |
| Identify Pain | `Pain_Point__c` | gong | pain phrase in customer's voice |
| Champion | `Champion__c` | gong | customer-led call segment |

## SPICED mapping (worked example)

| SPICED concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| Situation | `Current_State__c` | none | n/a |
| Pain | `Pain_Point__c` | gong | pain phrase in customer's voice |
| Impact | `Quantified_Impact__c` | gong | quantified-cost language: currency or time units within 20 tokens of pain |
| Critical Event | `Critical_Event__c` | gong | date-bounded urgency: a specific date or quarter within 15 tokens of consequence-language (`miss`, `slip`, `risk`) |
| Decision | `Decision_Process__c` | gong | named decision steps with owners |

## Custom framework template

If the team uses a homegrown rubric, list each concept on its own row with the same four columns. The skill treats `Salesforce field` as the ground truth for "what was claimed" and the `Phrase patterns` as the ground truth for "what counts as supporting evidence in Gong."

| Custom concept | Salesforce field | Evidence required | Phrase patterns |
|---|---|---|---|
| {concept} | {field} | `gong` or `none` | {regex or natural-language phrase rule} |

## Last reviewed

YYYY-MM-DD

# Sample output format — REFERENCE

> The stage-progression-validator skill must emit the report in this exact
> format. Downstream renderers (Slack digest job, weekly email) parse this
> Markdown — keep section headings and ordering stable.

## Report header

```markdown
# Stage progression validation — week ending YYYY-MM-DD

Window: YYYY-MM-DD → YYYY-MM-DD
Methodology: MEDDPICC (rubric last reviewed YYYY-MM-DD)
Opportunities scored: N
- pass: N
- flag: N
- fail: N
- needs_manager_review: N
- needs_methodology: N
```

If the rubric `last_reviewed` is more than 90 days old, prepend a single line: `> WARNING: stage-criteria rubric last reviewed YYYY-MM-DD (over 90 days).`

## fail section

One block per failed deal. Order by deterministic-score ascending (worst first), tie-break by qualitative-score ascending.

```markdown
## fail (N)

### {Account name} — {New stage label}
- Opp ID: 006xxxxxxxxxxxxxxx
- Owner: owner@example.com
- Progressed: YYYY-MM-DD
- Deterministic score: D.DD (X of Y rules satisfied)
- Qualitative score: D.DD (X of Y claims supported)

Deterministic misses:
- `{field}` is NULL
- `OpportunityContactRole` has no role matching `/{regex}/`
- `Task.Type = '{type}'` not found in last {N} days

Qualitative misses:
- `{field}` claim: no Gong call in last 30 days matches pattern `{pattern_name}`
- `{field}` claim: no Gong call in last 30 days contains `{pattern}` near claimed value

Recording coverage: {N} recorded calls in last 30 days (floor: {M}).
```

## flag section

Same block format as `fail`. Order by combined score ascending.

## needs_manager_review section

Same block format. Add a one-line `Reason:` field naming why the deal landed in the borderline band — `low recording coverage`, `one rule short`, `mixed signal across deterministic and qualitative`, etc.

## needs_methodology section

```markdown
## needs_methodology (N)

| Opp | Owner | New stage | Reason |
|---|---|---|---|
| {Opp ID} | {owner} | {stage label} | no rubric entry for stage |
```

## pass section

Tabular, no per-deal block — passes are not interesting in the digest.

```markdown
## pass (N)

| Opp | Owner | New stage | Deterministic | Qualitative |
|---|---|---|---|---|
| {Opp ID} | {owner} | {stage label} | 1.00 | 1.00 |
```

## Footer

```markdown
---
Generated by stage-progression-validator skill at YYYY-MM-DDTHH:MM:SSZ
Inputs: methodology_path={path}, borderline_threshold={float}
```