claude-skill

Pontue leads contra um rubric de ICP usando Claude

Dificuldade

intermediário

Tempo de setup

30min

Para

revops

RevOps

Stack

Uma skill do Claude que recebe qualquer linha de lead, roda contra o rubric de ICP da sua equipe e retorna um score de 0 a 10, um racional por critério citando o rubric, uma ação recomendada por tier e um flag de escalação para casos limítrofes. Projetada para se conectar a uma coluna de AI do Clay, a uma custom-code action do HubSpot ou a uma execução standalone via CLI sobre um CSV. Substitui a matriz de scoring em planilha que ninguém atualizou desde o ano passado — sem fingir que também consegue fazer scoring de intenção ou comportamental, o que não é possível.

O bundle é entregue em apps/web/public/artifacts/lead-scoring-icp-rubric-skill/ e contém SKILL.md mais três templates de referência que o usuário adapta antes da primeira execução.

Quando usar

Use esta skill quando você tem MQLs inbound se acumulando mais rápido do que sua equipe de SDR consegue triagear, e o scoring existente é inexistente (“tudo é um lead”) ou desatualizado (“matriz de scoring do HubSpot calibrada pela última vez em 2023, ninguém confia nela”). Também é útil para outbound: pontue uma lista fria enriquecida antes de atribuí-la, e você para de queimar tempo de SDR em empresas fora do ICP que parecem boas superficialmente.

A skill é scoring de fit, não scoring de intenção. Ela responde “esta é o tipo certo de empresa para nós” — não “elas estão no mercado esta semana”. Essa distinção importa: se você só pontua por fit, vai sequenciar contas de ótimo fit que não têm necessidade atual e ignorar contas de fit ruim que estão ativamente comprando. Combine esta skill com qualquer sinal de comportamento in-market — Bombora, 6sense, seus próprios eventos de uso de produto, acessos à página de preços — para rotear corretamente.

Concretamente, invoque-a a partir de:

Uma coluna de AI do Clay que dispara em cada nova linha em uma tabela de leads, escrevendo o score e o racional de volta em duas colunas.
Uma custom-code action do HubSpot em um workflow acionado por Lifecycle stage = MQL, que chama a skill e escreve tanto o score quanto o racional em propriedades do lead.
Um CLI standalone sobre um export CSV — útil para scoring único de lista antes do lançamento de uma campanha.

Quando NÃO usar

Pule esta skill quando:

Você quer rejeitar leads automaticamente sem humano no loop. O output é uma recomendação. A skill marca explicitamente casos limítrofes com escalate: needs_human_review, mas se você conectá-la para deletar leads pontuados C ou abaixo, vai silenciosamente destruir pipeline sempre que o rubric ficar desatualizado. Mantenha sempre um caminho de revisão pelo SDR para pelo menos o tier C.
Seu “rubric” são intuições. A skill se recusa a pontuar contra um rubric sem pesos e valores de tier explícitos. Se sua equipe ainda não teve a discussão sobre o que uma indústria de tier A realmente é, tenha essa discussão primeiro. A skill não pode tornar o rubric defensável se a fonte não for.
Você precisa de scoring comportamental ou de intenção. Isso é apenas scoring de fit. Tentar codificar “engagement score” ou “última visita ao site” no rubric obriga você a atualizá-lo constantemente; use uma ferramenta de intenção dedicada para os sinais que variam com o tempo e mantenha esta skill para os sinais estáticos de fit.
Você opera em um domínio regulamentado que exige explicabilidade além do racional por critério. Os outputs por critério são auditáveis, mas não são o mesmo que um model card defensável perante um regulador. Se precisar disso, invista em um serviço de scoring adequado, não em uma skill do Claude.

Setup

O setup leva cerca de 30 minutos depois que você tiver o rubric redigido. O rubric em si leva mais tempo — geralmente uma sessão de trabalho de 60 minutos com o gerente de SDR, um AE e alguém de RevOps para discutir pesos.

Instale a Skill. Coloque apps/web/public/artifacts/lead-scoring-icp-rubric-skill/SKILL.md e a pasta references/ no seu diretório .claude/skills/lead-scoring/ (ou faça upload como Skill no claude.ai). O name e description no frontmatter são o que aciona a Skill nos prompts relevantes.
Substitua o template de rubric. Abra references/1-icp-rubric-template.md e substitua as linhas de placeholder em “Criteria” pelos seus critérios reais, pesos (1-5) e valores de tier (A / B / C). Preencha a seção “Hard disqualifiers” — esses rodam como checks determinísticos antes de qualquer chamada LLM. Atualize “Last edited” para que o SHA-256 que a skill imprime em todo rodapé de output reflita quem é o dono da versão atual.
Substitua a matriz tier-para-ação. Abra references/2-tier-to-action-matrix.md e substitua as linhas de exemplo pelo que sua equipe realmente faz em cada combinação de (tier, source_of_lead). Os padrões são razoáveis mas não são seus.
Conecte a fonte de input. No Clay, aponte uma coluna de AI para a Skill, passe a linha de lead enriquecida como lead, o arquivo de rubric como rubric e a coluna de origem como source_of_lead. No HubSpot, envolva a Skill em uma custom-code action que lê as propriedades do contato e da empresa em um objeto lead e posta o output estruturado de volta. Em um script, itere sobre o CSV, poste cada linha, escreva o score e o racional em duas novas colunas.
Configure o destino. Tanto o score quanto o racional vão para o lead. Score em uma propriedade numérica (para lógica de roteamento), racional em uma propriedade de texto longo (para o SDR que vai lê-la antes da ligação). Conecte o campo escalate a uma propriedade booleana ou enum separada para que o gerente de SDR possa filtrar para revisão.
Calibre. Antes de ativar, rode a skill sobre 20 leads closed-won e 20 closed-lost dos últimos 6 meses. A distribuição de scores deve separar claramente os dois grupos. Se não separar, o rubric é o problema, não a skill — volte ao passo 2 e reargumente os pesos.

O que a skill realmente faz

A skill roda quatro etapas em uma ordem fixa. Etapas anteriores bloqueiam as posteriores; não paralelize.

Etapa 1 — checks firmográficos determinísticos. Antes de qualquer chamada LLM, código simples roda os hard disqualifiers do rubric (país sancionado, indústria desqualificada, headcount abaixo do seu mínimo, domínio de e-mail gratuito) e o check de campos obrigatórios (email e company_domain precisam estar presentes). Hits retornam imediatamente — disqualified com a citação, ou escalate: insufficient_data com os campos ausentes. Por que determinístico primeiro: é gratuito, rápido e nunca alucina. Queimar tokens para confirmar que uma barbearia de 3 pessoas não está no seu ICP de SaaS enterprise é desperdício.

Etapa 2 — scoring LLM por critério com ponderação explícita. Para cada critério restante, o modelo emite um tier (A / B / C) e um racional de uma frase citando a linha do rubric. A skill multiplica o tier (A=3, B=2, C=1) pelo peso do critério e soma. Por que por critério em vez de um prompt holístico: outputs holísticos misturam critérios silenciosamente e você perde a capacidade de debugar por que um lead recebeu 8 em vez de 5. Por que ponderação explícita em vez de deixar o modelo equilibrar: pesos declarados são a única forma de o rubric permanecer a fonte da verdade. Se o modelo decide seu próprio equilíbrio, as revisões de rubric se tornam teatro.

Etapa 3 — fallback limítrofe para revisão humana. Se o score final está dentro de 0,5 de uma fronteira de tier, ou se mais de 3 critérios foram pontuados com dados ausentes ou inferidos, a skill define escalate: needs_human_review e nomeia os campos ausentes. O erro de scoring mais caro não é um tier errado em um lead confiante — é um tier errado em um lead que sempre foi limítrofe.

Etapa 4 — montagem do output. A skill emite o Markdown descrito em references/3-sample-output.md: score principal e tier, ação recomendada vinculada da matriz tier-para-ação, tabela por critério com razões, check de disqualifier, lista de lacunas de dados, e um rodapé com o SHA-256 do rubric e a data da última edição.

Custo real

O custo de tokens por lead depende do tamanho do rubric, mas para um rubric típico de 6 critérios com output estruturado por critério, espere aproximadamente 1.500-2.500 tokens de input e 400-700 tokens de output por lead. Com o preço do Claude Sonnet 4.x (aproximadamente $3 por milhão de input e $15 por milhão de output a partir do final de 2026), isso é cerca de $0,01-0,02 por lead pontuado.

Uma equipe processando 5.000 MQLs inbound por mês gasta aproximadamente $50-100/mês em tokens do Claude. Uma equipe processando 50.000 leads outbound enriquecidos por mês gasta $500-1.000/mês — ponto em que o batching, o prompt caching do rubric e a pré-filtragem com a etapa determinística importam muito. A skill padrão usa um único prompt estruturado por lead (em vez de 6-10 prompts pequenos) precisamente para manter o uso de tokens limitado.

Os custos não relacionados a tokens são maiores. Construir o rubric é uma sessão de trabalho de 60 minutos que você faz uma vez e refaz trimestralmente. Calibrar contra 20 closed-won + 20 closed-lost leva outra hora. Conectar a integração com o Clay ou HubSpot é meio dia. Depois disso a skill funciona sozinha até o rubric derivar.

Métrica de sucesso

A métrica a acompanhar é a correlação score-conversão: dos leads pontuados A nos últimos 90 dias, que fração converteu para oportunidades? Dos pontuados B? C? Se a curva é monotônica — A converte a uma taxa maior que B, B a uma taxa maior que C — o rubric está funcionando. Se C converte a uma taxa similar a B, o rubric não separa fit de não-fit e precisa ser reargumentado.

Métrica secundária: tempo de SDR para primeiro contato em leads tier A. Um sistema de scoring que funciona colapsa isso para menos de 1 hora para inbound. Se leads tier A ainda ficam em fila por 24h, o roteamento — não o scoring — é o gargalo.

vs alternativas

vs HubSpot Predictive Lead Scoring. O score preditivo built-in do HubSpot é uma caixa-preta treinada nos seus dados históricos de conversão. Funciona depois que você tem volume suficiente de closed-won (o HubSpot recomenda cerca de 500 deals fechados como mínimo). Para equipes abaixo dessa marca, o modelo não tem do que aprender e o score é ruído. Esta skill funciona desde o primeiro dia porque o rubric é feito à mão, não aprendido. O trade-off: o modelo do HubSpot capta padrões que um autor de rubric perderia; esta skill só sabe o que você escreveu. Execute as duas se tiver volume — use o score do HubSpot para “o que me surpreende” e o racional por critério desta skill para “por que este está classificado aqui.”

vs scoring comportamental do Marketo. O Marketo (ou o scoring comportamental do HubSpot) rastreia sinais de engajamento — aberturas de e-mail, visualizações de página, envios de formulário — e adiciona pontos. Isso é scoring de intenção, não de fit, e as duas respostas são perguntas diferentes. Uma conta de ótimo fit que não abriu um e-mail ainda é uma conta de ótimo fit. Uma conta de fit ruim que leu seu blog intensamente ainda é uma conta de fit ruim. Use scoring comportamental além desta skill, não em vez dela; roteie pelo sinal combinado (alto fit + alta intenção → AE direto; alto fit + baixa intenção → nurture; baixo fit + alta intenção → SDR para ligação de fit antes do AE).

vs revisão manual pelo SDR. Para menos de 50 leads inbound por semana, a revisão manual por um gerente de SDR é genuinamente competitiva — humanos captam nuances (“esta empresa acabou de adquirir um dos nossos clientes, priorize”) que a skill perderá. Acima de ~200 leads por semana, a revisão manual se torna o gargalo e a consistência cai. A skill escala linearmente com o orçamento de tokens; humanos não.

Pontos de atenção

Deriva do rubric. Alguém edita o rubric em Markdown, faz deploy da mudança, e os SDRs lendo os novos scores nunca veem um diff. Seis semanas depois, a equipe percebe que o peso de headcount foi alterado de 4 para 2 por acidente e 200 contas de tier stretch foram silenciosamente rebaixadas para C. Proteção: a skill registra o SHA-256 do rubric em todo rodapé de output e adiciona um banner “Rubric atualizado YYYY-MM-DD” sempre que o hash muda entre execuções. Um lembrete trimestral no calendário força uma revisão mesmo que nenhuma edição aconteça.
Amplificação de viés de fonte. Um rubric construído a partir do seu conjunto de closed-won codifica para quem você já vendeu. Pontuar contra ele torna você cego a ICP adjacente e seu pipeline se estreita ao longo do tempo para cópias dos clientes do ano passado. Proteção: todo trimestre, amostre 20 leads que a skill pontuou como tier C e peça a um AE que revise manualmente se algum é realmente fit. Se mais de 3 estiverem mal classificados, adicione uma linha de “ICP stretch” ao rubric e recalibre.
Falsa confiança em dados escassos. Quando o enriquecimento está faltando 4 de 6 campos de critérios, um score de 7,4 é principalmente ruído, mas parece autoritativo. Os SDRs vão tratá-lo como tier A confiante e pular a preparação da ligação. Proteção: a skill define escalate: needs_human_review sempre que mais de 3 critérios são pontuados com dados ausentes ou inferidos, e adiciona uma seção “Lacunas de dados” listando os campos ausentes. Os SDRs são treinados para ler a seção de lacunas antes do número principal.
Proxies de classe protegida. Mesmo com boa intenção, um rubric que pondera “geografia” pode colapsar para nacionalidade, e “indústria” pode colapsar para proxies de demografia empresarial de formas que seu departamento jurídico não vai gostar. Proteção: a skill recusa campos que reconhece como proxies de classe protegida (gênero derivado do nome, foto, sinais de idade). Revise o rubric anualmente com alguém que consiga identificar os proxies menos óbvios.

Stack

Claude — engine de scoring e gerador de racional. Sonnet 4.x é o ponto ideal de custo vs qualidade de raciocínio para esta tarefa; Haiku funciona para o caminho somente-determinístico mas perde qualidade de racional na etapa LLM.
Clay — fonte de leads e camada de enriquecimento preferida para scoring outbound e de lista fria. A coluna de AI é um ponto de integração limpo.
HubSpot — CRM de destino para score, racional, flag de escalação e fonte. Custom-code actions são o ponto de integração para scoring de MQL inbound.
Um editor de Markdown e um calendário — as peças sem glamour. O rubric vive em Markdown, a revisão trimestral vive no calendário de alguém, e ambos importam mais do que a escolha do modelo.

Editar esta página no GitHub

Arquivos deste artefato

Baixar tudo (.zip)

---
name: lead-scoring-icp-rubric
description: Score a single lead or a batch of leads against an explicit ICP rubric. Returns a 0-10 score per lead, a per-criterion rationale citing the rubric, a recommended next action by tier, and an escalation flag for borderline cases. Use when triaging inbound or routing enriched outbound leads — not as a substitute for behavioral or intent-based scoring.
---

# Lead scoring (ICP rubric)

## When to invoke

Invoke whenever you need to score a single lead — or a CSV/JSON batch of leads — against your team's ICP rubric. Typical entry points: a Clay table column, a HubSpot custom-code action firing on a new MQL, a standalone CLI run over a marketing-list export, or a manual paste during deal-desk triage.

The skill takes structured lead data plus the rubric and returns a 0-10 score, per-criterion rationale, a recommended next action by tier, and an escalation flag when the data is too thin to score confidently.

Do NOT invoke this skill for:

- **Auto-rejecting leads.** The output is a recommendation. Disqualifying a lead from outreach without an SDR seeing the rationale silently destroys pipeline when the rubric is wrong (and the rubric is sometimes wrong).
- **Scoring on protected-class proxies.** Do not pass fields like name-derived gender, photo, age, country-of-origin signals. Even if your rubric weights "geography" legitimately for support-hours fit, never collapse that into ethnicity or nationality. The skill refuses fields it recognizes as protected-class proxies.
- **Replacing intent-based or behavioral scoring entirely.** This is fit scoring, not intent. A great-fit account that has not visited your pricing page in 90 days is still a great fit but not a hot lead. Pair this skill with whatever signals "they are in-market right now" — Bombora, 6sense, your own product-usage events.

## Inputs

Required:

- `lead` — a structured lead record. Minimum fields: `email`, `company_domain`. Strongly preferred: `headcount`, `industry`, `country`, `job_title`, `tech_stack` (array), `funding_stage`. Pass whatever your enrichment layer (Clay, Apollo, ZoomInfo, Clearbit) returns.
- `rubric` — path to or inline contents of the ICP rubric markdown (see `references/1-icp-rubric-template.md`). Must contain explicit criterion + weight + tier-value rows. The skill refuses to score against a rubric that has no weights — vibes are not a rubric.

Optional:

- `source_of_lead` — free-text or enum: `inbound_demo`, `inbound_content`, `outbound_sequence`, `partner_referral`, `event`, `cold_list`. Used to bias the recommended-next-action mapping (a partner referral with a B-tier score still gets a human reach-out; a cold-list lead at the same tier does not).
- `batch_size_hint` — when scoring more than one lead, the caller can pass an integer so the skill paces token usage and returns progress markers. Default: process serially, no progress markers.

## Reference files

Always load these from `references/` before scoring. They are the leverage point — a tight rubric makes a defensible score, a vague rubric makes a vibes score that an AE will (correctly) ignore.

- `references/1-icp-rubric-template.md` — the rubric template. Replace placeholder rows with the actual criteria, weights, and tier values your team has agreed on.
- `references/2-tier-to-action-matrix.md` — maps the four tiers (A / B / C / disqualified) and the `source_of_lead` enum to a recommended next action. Edit this once with your team's routing reality, not the defaults.
- `references/3-sample-output.md` — a literal example of the markdown the skill produces, for one fictional lead. Use as the reference when wiring downstream parsers.

## Method

The skill runs these steps in order. Earlier steps gate later steps — do not parallelize.

### 1. Deterministic firmographic checks (no LLM)

Before any LLM call, run plain code over the lead record:

- Hard disqualifiers from the rubric (e.g. `country in ["{sanctioned-country}"]`, `industry in {disqualified-industries}`, `headcount < 10` if the rubric sets that floor) → return tier `disqualified` with the citation, no LLM call.
- Required-field check: if `email` and `company_domain` are missing, return `escalate: insufficient_data`.

Why: deterministic checks are free, fast, and never hallucinate. Burning tokens to confirm that a 3-person hairdresser is not in your enterprise-SaaS ICP is wasteful and slightly embarrassing.

### 2. Per-criterion LLM scoring with explicit rubric weighting

For each remaining criterion in the rubric, prompt the model to produce a tier value (A / B / C) and a one-sentence rationale that cites the rubric row. The skill multiplies the tier-value (A=3, B=2, C=1) by the criterion's weight and sums.

Why per-criterion rather than one holistic prompt: holistic scoring blends criteria silently and you lose the ability to debug why a lead got an 8 instead of a 5. Per-criterion outputs make the score auditable. The cost is roughly 6-10 short prompts per lead (or a single prompt that emits a structured per-criterion response — both work; the skill defaults to a single structured prompt with explicit per-criterion fields to keep tokens down).

Why explicit weighting rather than "let the model balance them": stated weights are the only way the rubric stays the source of truth. If the model invents its own balance, the rubric stops being authoritative and rubric reviews become theatre.

### 3. Borderline case fallback to human review

If the final score is within `+/- 0.5` of a tier boundary, OR if the rubric has more than 3 criteria where the data was missing/insufficient, set `escalate: needs_human_review` with a note naming the missing fields.

Why: the most expensive scoring failure is not a wrong tier on a confident lead — it is a wrong tier on a lead that was always borderline. Surfacing those for human review preserves trust in the confident scores.

### 4. Output assembly

Render the markdown described in "Output format" below. Score is the headline number. Rationale is the per-criterion table. Next action comes from the tier-to-action matrix, joined with `source_of_lead` if provided. Escalation flag is surfaced at the top when set.

## Output format

Literal markdown the skill emits for a single lead:

```markdown
# Lead score — jane.doe@acme.com (acme.com)

**Score:** 7.4 / 10 — Tier B
**Source:** inbound_content
**Escalate:** no

## Recommended next action

Tier B + inbound_content → SDR personalized email within 24h, no auto-sequence. Reference content piece they engaged with.

## Rationale (per criterion)

| Criterion | Weight | Tier | Reason |
|---|---|---|---|
| Industry | 5 | A | "Vertical SaaS / RevOps" matches in-ICP row in rubric. |
| Headcount | 4 | B | 240 employees — in stretch range (200-500), not core (500-2000). |
| Geo | 3 | A | HQ US-east, in supported region. |
| Tech stack | 4 | B | Salesforce + Marketo present (fit signals); no data warehouse cited. |
| Funding stage | 2 | C | Bootstrapped — out of preferred Series B-D band. |
| Job title | 4 | A | "Director, RevOps" matches champion-target pattern. |

## Disqualifier check

None triggered.

## Data gaps

- `revenue` field not provided by enrichment.
```

For batch input, the skill emits one such block per lead, separated by `\n---\n`, plus a top-level summary table (`email | tier | escalate`).

## Watch-outs

- **Rubric drift.** The rubric is a markdown file that someone edits. Edits are silent — no diff is shown to the SDRs reading scores. **Guard:** the skill records the rubric's SHA-256 in every output footer and prepends a "Rubric updated {date}, last verified by {name}" line if the hash differs from the previous run's. A weekly job (or a calendar reminder, if you are not that fancy) opens a PR-style review of the rubric every quarter.
- **Source-bias amplification.** If the rubric was built from your closed-won set, it encodes who you have already sold to. Repeatedly scoring against it narrows your pipeline to lookalikes and makes you blind to adjacent ICP. **Guard:** every quarter, sample 20 leads the skill scored as C-tier and have an AE review whether any are actually fit. If more than 3 are misclassified, the rubric is over-fit and needs a "stretch ICP" row added.
- **False confidence on thin data.** When enrichment is missing 4 of the 6 criteria fields, a 7.4 score is mostly noise. **Guard:** the skill sets `escalate: needs_human_review` whenever more than 3 criteria are scored on missing/inferred data, and adds a "Data gaps" section listing the absent fields. SDRs are trained to read the gaps section before the headline number.

# ICP rubric — TEMPLATE

> Replace this template's contents with your team's actual ICP rubric.
> The lead-scoring skill scores each criterion against this rubric. Vague
> rows (no weights, no tier values) cause the skill to refuse the run.

## How the skill reads this file

- Each row in "Criteria" must have an explicit `weight` (1-5) and three tier values (A / B / C). Anything else is treated as malformed and the skill returns an error rather than guessing.
- Rows in "Hard disqualifiers" run as deterministic checks before any LLM call. Keep them tight; one wrong row here silently kills good pipeline.
- The "Last edited" line is hashed into the SHA-256 the skill records in every output footer. Update it when you make material changes so SDRs reading scores can see the rubric moved.

## Criteria

| Criterion | Weight | A (best fit) | B (stretch) | C (poor fit) |
|---|---|---|---|---|
| Industry | 5 | {industries you win in} | {adjacent industries} | {everything else} |
| Headcount | 4 | {core range, e.g. 500-2000} | {stretch range, e.g. 200-500 or 2000-5000} | {below/above stretch} |
| Geo | 3 | {primary regions} | {secondary regions} | {regions you do not support} |
| Tech stack | 4 | {tools that signal fit, e.g. Salesforce + Marketo} | {one of the fit tools present} | {competing system of record} |
| Funding stage | 2 | {preferred stages, e.g. Series B-D} | {adjacent stages} | {unfit, e.g. pre-seed or post-IPO} |
| Job title | 4 | {champion-target patterns} | {adjacent titles} | {non-buying-committee titles} |

## Hard disqualifiers

Single signals that drop a lead to `disqualified` regardless of other criteria. Run as deterministic checks before LLM scoring.

- `country in [{sanctioned-or-unsupported-list}]`
- `industry in [{disqualified-industries — e.g. adult, gambling if you do not serve them}]`
- `headcount < {floor — e.g. 10}` (if you have a floor)
- `email_domain in [{free-mail providers if your motion blocks them}]`

## Tier thresholds

The skill maps the weighted sum to a tier. Defaults shown — adjust to your team's calibration run.

| Score | Tier |
|---|---|
| 8.0 - 10.0 | A |
| 6.0 - 7.99 | B |
| 4.0 - 5.99 | C |
| < 4.0 | disqualified |

## Last edited

{YYYY-MM-DD} — by {name}

# Tier-to-action matrix — TEMPLATE

> Replace this template's contents with your team's actual routing reality.
> The lead-scoring skill joins the score's tier with the lead's
> `source_of_lead` to pick a recommended next action. Edit once with your
> SDR/AE manager so the recommendations match what your reps actually do.

## How the skill reads this file

- Rows are `(tier, source_of_lead) → action`. The skill picks the row whose tier matches the score and whose source matches the input. If the source is missing or unrecognized, it falls back to the row marked `*` (any source).
- An action is one short imperative sentence. The skill emits this verbatim under "Recommended next action" — keep it copy-pasteable.

## Matrix

| Tier | Source | Action |
|---|---|---|
| A | inbound_demo | Round-robin to AE within 5 minutes; book meeting in same business day. |
| A | inbound_content | SDR call within 1 hour; reference content piece. Auto-sequence as backup if no answer in 24h. |
| A | outbound_sequence | Move to high-touch sequence; SDR adds 2 personalized steps. |
| A | partner_referral | AE handles directly. Loop in partner manager for warm intro. |
| A | event | SDR call within 24h referencing the event session/booth conversation. |
| A | cold_list | Treat as outbound: enrich further, hand to SDR for personalized first touch. |
| A | * | SDR personalized outreach within 24h. |
| B | inbound_demo | SDR qualification call within 4 hours before AE handoff. |
| B | inbound_content | SDR personalized email within 24h, no auto-sequence. Reference content piece. |
| B | outbound_sequence | Standard outbound sequence, no escalation. |
| B | partner_referral | SDR call within 48h; loop in partner if no response. |
| B | event | SDR email + follow-up call within 48h. |
| B | cold_list | Standard outbound sequence. |
| B | * | SDR email within 48h. |
| C | inbound_demo | SDR fit-call within 24h; many will self-disqualify on the call. |
| C | inbound_content | Add to nurture; no SDR touch unless engagement signals appear. |
| C | outbound_sequence | Pause sequence; do not waste SDR cycles. |
| C | partner_referral | SDR courtesy call within 1 week (relationship cost of ignoring). |
| C | event | Add to nurture only. |
| C | cold_list | Drop. |
| C | * | Nurture only. |
| disqualified | * | Mark `Disqualified — out of ICP` with rubric citation. Do not auto-delete; archive for audit. |

## Escalation overrides

When the skill emits `escalate: needs_human_review`, the action above is replaced with:

> Hold for SDR manager review. Lead is borderline (within 0.5 of tier boundary) or scored on thin data. See "Data gaps" section.

When the skill emits `escalate: insufficient_data`, the action is:

> Re-enrich lead and re-score. Required fields missing: {list}.

## Last edited

{YYYY-MM-DD} — by {SDR manager name}

# Sample output — for parser wiring

> A literal example of what the skill emits for one fictional lead. Use
> this when wiring the downstream parser (Clay AI column → property
> mapping, HubSpot custom-code action → property writeback, CSV
> post-processor). The schema below is what the skill commits to; the
> values are illustrative.

## Single-lead output

```markdown
# Lead score — jane.doe@northwind.com (northwind.com)

**Score:** 7.4 / 10 — Tier B
**Source:** inbound_content
**Escalate:** no

## Recommended next action

Tier B + inbound_content → SDR personalized email within 24h, no auto-sequence. Reference content piece they engaged with.

## Rationale (per criterion)

| Criterion | Weight | Tier | Reason |
|---|---|---|---|
| Industry | 5 | A | "Vertical SaaS / RevOps" matches in-ICP row in rubric. |
| Headcount | 4 | B | 240 employees — in stretch range (200-500), not core (500-2000). |
| Geo | 3 | A | HQ US-east, in supported region. |
| Tech stack | 4 | B | Salesforce + Marketo present (fit signals); no data warehouse cited. |
| Funding stage | 2 | C | Bootstrapped — out of preferred Series B-D band. |
| Job title | 4 | A | "Director, RevOps" matches champion-target pattern. |

## Disqualifier check

None triggered.

## Data gaps

- `revenue` field not provided by enrichment.

---

_Rubric SHA-256: 4f9c...a812 | Last edited 2025-12-15 by Sam Patel_
```

## Batch output

For a batch of N leads, the skill prepends a summary table and emits one block per lead separated by `\n---\n`:

```markdown
# Batch summary (12 leads)

| Email | Tier | Score | Escalate |
|---|---|---|---|
| jane.doe@northwind.com | B | 7.4 | no |
| ahmed@tailspintoys.io | A | 8.9 | no |
| j.smith@gmail.com | disqualified | 0 | hard_disqualifier:free_email |
| ... | ... | ... | ... |

---

# Lead score — jane.doe@northwind.com (northwind.com)
...
---
# Lead score — ahmed@tailspintoys.io (tailspintoys.io)
...
```

## Field contract for parsers

If you write a parser instead of consuming the markdown, these are the stable fields:

- `email` — string, lowercased
- `domain` — string, lowercased
- `score` — float, 0.0 to 10.0, one decimal
- `tier` — enum: `A` / `B` / `C` / `disqualified`
- `source` — pass-through of the input `source_of_lead`, or `unknown`
- `escalate` — enum: `no` / `needs_human_review` / `insufficient_data` / `hard_disqualifier:{reason}`
- `next_action` — string, single sentence
- `rationale[]` — list of `{criterion, weight, tier, reason}`
- `data_gaps[]` — list of strings (field names)
- `rubric_sha256` — string, 8-character prefix in the markdown footer; full hash available via the skill's structured-output mode