claude-skill

Audit an ABM list against an ICP rubric with Claude

Dificultad

intermedio

Tiempo de setup

30-60 min

Para

revops

RevOps

Stack

Un Claude Skill que toma una lista de cuentas objetivo ABM y una rubrica ICP, y devuelve un informe de defectos por cuenta — cada cuenta que no cumple los criterios recibe un código de defecto de una taxonomía definida (wrong-size, wrong-industry, wrong-geo, stale-data, low-intent, missing-field), un nivel de calidad (Q1 a Q4), una puntuación de calidad de la lista y una cola de remediación priorizada. El bundle se encuentra en apps/web/public/artifacts/abm-list-quality-audit-skill/ e incluye SKILL.md más tres plantillas de referencia que el usuario adapta antes del primer uso.

Responde la pregunta que la mayoría de las campañas ABM omiten antes del lanzamiento: “De las 300 cuentas en esta lista, ¿cuántas realmente cumplen nuestro ICP, y qué tiene de malo exactamente las que no cumplen?” Sin esa respuesta, el gasto en plataformas ABM — 6sense, Demandbase, LinkedIn matched audiences — va hacia cuentas que nunca convertirías, y los decepcionantes resultados de la campaña se atribuyen al mensaje o al canal en lugar de a la calidad de la lista.

Cuándo usar

Usa este skill antes de cargar cualquier lista ABM en una plataforma de medios pagos, antes de asignar cuentas nombradas a AEs, y antes del lanzamiento de cualquier campaña donde la lista fue ensamblada hace más de 90 días. Las listas ABM se degradan más rápido de lo que la mayoría de los equipos de RevOps creen: los datos de headcount se vuelven obsoletos, las etapas de financiamiento cambian, las empresas son adquiridas, y la rubrica ICP en sí misma a veces cambia sin que la lista sea reevaluada.

El skill también es la herramienta adecuada para la higiene trimestral de listas. Ejecútalo sobre todo tu universo ABM — no solo las listas de campaña — para encontrar cuentas que fueron añadidas cuando tu ICP era diferente y no han sido reevaluadas desde entonces. La tabla de frecuencia de defectos te dice qué vacíos de enriquecimiento son más comunes en tu universo, lo que es accionable para quien sea el dueño del workflow de enriquecimiento de Clay.

Invócalo desde:

Una tabla de Clay donde cada fila es una cuenta, activada manualmente antes del lanzamiento de una campaña o en un cron trimestral. El skill escribe quality_tier y defect_codes de vuelta a dos columnas de Clay; la automatización downstream puede filtrar en estas para suprimir cuentas Q3/Q4 de las cargas de campañas.
Una verificación de pre-vuelo de CSV antes de importar en 6sense o cualquier plataforma de publicidad ABM. Ejecutar la auditoría elimina cuentas que de otro modo pagarías para alcanzar — a las tasas típicas de CPM de ABM ($20-40 por 1.000 impresiones), eliminar 50 cuentas fuera del ICP de una lista de 500 reduce el desperdicio en un 10%.
Un trigger basado en informe de Salesforce sobre cuentas nombradas en un segmento, escribiendo ABM_Quality_Tier__c y ABM_Defect_Codes__c de vuelta al registro de cuenta.

Cuándo NO usar

Omite este skill cuando:

Quieres puntuar MQLs inbound. La auditoría está diseñada para listas de cuentas nombradas outbound. Para la clasificación de leads inbound, el skill lead-scoring-icp-rubric es la herramienta adecuada — maneja el flujo de lead individual y la lógica de escalamiento borderline que importa para inbound.
Tu rubrica ICP aún no existe. El skill audita contra una rubrica que tú proporcionas. Si no has tenido la discusión sobre el ICP — qué industrias, rangos de headcount y geografías realmente ganas — esa conversación debe ocurrir primero. Ejecutar una auditoría contra una rubrica de marcador de posición produce una falsa sensación de rigor.
La lista necesita deduplicación, no auditoría. Si el objetivo es eliminar clientes actuales, competidores, cuentas canceladas o contactos suprimidos por GDPR, eso es una operación de filtro, no una auditoría ICP. Ejecuta esas exclusiones antes de la auditoría, o el skill gastará tokens puntuando empresas que ya sabes que quieres excluir.
Necesitas generar la lista, no auditarla. El skill toma una lista existente como entrada. No ejecuta descubrimiento de TAM ni genera cuentas nuevas. Usa un workflow dedicado de construcción de listas — Clay más criterios ICP — para producir la lista en bruto primero.
La lista tiene menos de 20 cuentas. Por debajo de ese tamaño, un RevOps o AE experimentado puede revisar manualmente cada cuenta en menos de una hora. El costo de configuración del skill (configuración de rubrica, personalización de taxonomía de defectos) no vale la pena.

Configuración

La configuración toma entre 30 y 60 minutos asumiendo que la rubrica ICP existe. La discusión sobre la rubrica — alinear a RevOps, el liderazgo GTM y un AE o dos sobre qué significa realmente una industria y un rango de headcount de nivel A — lleva más tiempo y ocurre antes de la configuración.

Instala el Skill. Copia apps/web/public/artifacts/abm-list-quality-audit-skill/SKILL.md y la carpeta references/ en tu directorio .claude/skills/abm-audit/, o súbelo como Skill en claude.ai. El name y description del frontmatter son el disparador en prompts relevantes.
Configura la rubrica ICP. Abre references/1-icp-rubric-template.md. Si tu equipo ya usa el skill lead-scoring-icp-rubric, puedes referenciar el mismo archivo de rubrica — la estructura es idéntica. Reemplaza las filas de marcador de posición con criterios reales, pesos (1-5) y valores de nivel (A / B / C). Completa la sección de descalificadores duros. Actualiza “Last edited” — el SHA-256 que el skill registra en cada pie del informe asegura que las partes interesadas puedan saber cuándo se movió la rubrica.
Configura la taxonomía de defectos. Abre references/2-defect-taxonomy.md. Los códigos de defecto en sí mismos son fijos — no los renombres, ya que los parsers downstream usan las cadenas de código. Edita la columna “Remediation action” para que coincida con el proceso real de tu equipo: qué columna de Clay proporciona el re-enriquecimiento de headcount, quién es el dueño de la suscripción de ZoomInfo, qué segmento es dueño de las cuentas de desbordamiento empresarial.
Prepara los scores de intención (opcional pero de alto valor). Si usas 6sense o Bombora, exporta un mapa domain → intent_score para tu universo de cuentas y pásalo como entrada intent_scores. Esto añade anotaciones low-intent e intent-spike sobre los scores de rubrica — el flag intent-spike es particularmente valioso para cuentas Q2 que están en ICP pero borderline, porque las saca a la superficie para priorización incluso antes del re-enriquecimiento.
Establece el umbral de obsolescencia de enriquecimiento. Actualiza enrichment_staleness_days para que coincida con qué tan agresivamente tu capa de enriquecimiento recicla. Clay + ZoomInfo típicamente se actualiza en un programa de 90 días; si ejecutas enriquecimiento mensual, puedes establecer 45 días. Esto impulsa el código de defecto stale-data.
Prueba en una lista conocida. Ejecuta el skill sobre 20-30 cuentas que conoces bien — una mezcla de clientes actuales, cuentas canceladas y prospectos de calidad variable. Verifica que los niveles de calidad coincidan con la intuición de tu equipo. Si las cuentas Q1 muestran códigos de defecto, la rubrica está mal calibrada. Si cuentas obviamente fuera del ICP puntúan Q2, los descalificadores duros o los pesos necesitan ajuste.

Qué hace el skill en realidad

El skill ejecuta cuatro pasos en un orden fijo.

Paso 1 — barrido de descalificadores duros. Antes de cualquier llamada LLM, cada cuenta se verifica contra los descalificadores duros de la rubrica: país en lista de sanciones, industria descalificada, headcount por debajo del mínimo absoluto, cuentas en la lista de exclusión explícita (competidores, clientes actuales). Las que coinciden reciben el código de defecto hd:{reason} y un nivel de calidad de disqualified. Este paso es determinista y se ejecuta en cada cuenta en milisegundos. Por qué ejecutarlo primero: en una lista de 500 cuentas, es común que del 5 al 15% de las cuentas sean descalificaciones inmediatas — ejecutar puntuación LLM en esas cuentas desperdicia tokens y agrega latencia sin agregar información.

Paso 2 — puntuación de rubrica ICP por cuenta. Las cuentas que superaron el barrido de descalificadores duros se puntúan contra cada criterio de la rubrica. Para cada criterio, el modelo emite un nivel (A / B / C), un peso (de la rubrica) y una razón de una oración que cita la fila de la rubrica. La suma ponderada se mapea a un nivel de calidad: Q1 (puntuación ≥ 8,0), Q2 (6,0-7,99), Q3 (4,0-5,99), Q4 (< 4,0). Los criterios fallidos generan los códigos de defecto correspondientes — una puntuación de criterio C de headcount en una cuenta por debajo del mínimo del nivel B genera wrong-size:too-small.

Por qué por criterio en lugar de una puntuación holística: los códigos de defecto que impulsan la cola de remediación requieren saber qué criterio específico falló, no solo que la puntuación general fue baja. Una cuenta Q3 con missing-field:tech_stack es una tarea de remediación diferente de una cuenta Q3 con wrong-industry — la primera necesita enriquecimiento, la segunda necesita eliminación.

Paso 3 — detección de defectos suplementarios. Después de la puntuación de rubrica, el skill verifica defectos no cubiertos por la rubrica: stale-data (enriquecimiento más antiguo que el umbral), missing-field:{field} (criterios que no pudieron puntuarse), low-intent e intent-spike de los scores de intención proporcionados. El flag intent-spike puede aparecer incluso en cuentas Q2 — saca a la superficie cuentas donde el comportamiento en el mercado debería anular la puntuación de rubrica borderline y desencadenar de todos modos el contacto directo del AE.

Paso 4 — agregación a nivel de lista. Después de la puntuación por cuenta, el skill calcula la puntuación de calidad de la lista (Q1% + Q2% - Q3% - 2×Q4%, escalado a 100), la tabla de frecuencia de defectos y la cola de remediación. La cola de remediación está ordenada por levantamiento estimado de re-auditoría: las cuentas con mayor probabilidad de convertirse en Q1 después del re-enriquecimiento aparecen primero. Una puntuación de calidad de lista por debajo de 30 es la señal de go/no-go del skill — la sección de recomendación dirá “No lanzar hasta que las cuentas Q3/Q4 sean remediadas o eliminadas.”

Realidad de costos

El costo de tokens por cuenta depende del tamaño de la rubrica y cuántos datos de cuenta se proporcionan. Para una rubrica típica de 6 criterios con output estructurado por criterio y un registro de cuenta de 300-500 tokens de datos, espera aproximadamente 1.200-2.000 tokens de entrada y 300-500 tokens de salida por cuenta. Con los precios de Claude Sonnet 4.x (aproximadamente $3 por millón de tokens de entrada y $15 por millón de tokens de salida a principios de 2026), eso es $0,008-0,015 por cuenta.

Una auditoría de pre-campaña de 500 cuentas cuesta $4-8 en tokens de Claude. Un paso trimestral de higiene sobre un universo ABM de 2.000 cuentas cuesta $16-30. Estos son menores al costo de una sola secuencia mal enrutada de AE. El costo no relacionado con tokens es mayor: configurar correctamente la rubrica y la taxonomía de defectos es una sesión de 60-90 minutos; planifícala.

El costo de tokens por cuenta es menor que el skill de puntuación de leads porque las cuentas ABM típicamente tienen datos estructurados más ricos (menos campos faltantes) y los códigos de defecto son más compactos que una justificación por criterio completa. Si tus cuentas tienen muchos campos faltantes, más del procesamiento cae en el paso de defecto suplementario, que es determinista y gratuito.

El caché de prompts de los archivos de rubrica y taxonomía de defectos vale la pena de manera significativa a escala — en una auditoría de 500 cuentas, la rubrica se carga una vez y se almacena en caché en todo el lote. En una verificación puntual de 5 cuentas no importa.

Métrica de éxito

La métrica principal para la auditoría es la tendencia de puntuación de calidad de la lista: ejecuta la auditoría sobre el mismo universo ABM cada trimestre y rastrea si la puntuación de calidad de la lista aumenta. Una puntuación en aumento significa que tu cadencia de enriquecimiento está funcionando, tu rubrica es estable y tu proceso de construcción de listas se ha ajustado. Una puntuación en caída — o una puntuación que permanece estable a pesar del esfuerzo de remediación — significa que la rubrica ha cambiado o que la fuente de enriquecimiento no es confiable.

Métrica secundaria: tasa de conversión de campaña ABM por nivel de calidad. Después de 90 días de ejecutar campañas contra listas auditadas, compara la tasa de conversión a oportunidad para cuentas Q1 vs cuentas Q2 vs cuentas que fueron remediadas de Q3 antes de ser incluidas. Q1 debería convertir a una tasa mayor que Q2, y Q2 después de la remediación debería convertir a una tasa mayor que Q3 no auditado. Si no hay diferencia de conversión entre niveles, la rubrica no es predictiva y necesita ser re-argumentada.

Modos de falla

Códigos de defecto que acusan a la rubrica, no a la lista. Si el 35% de tu lista recibe wrong-size:too-small, el problema es a menudo el mínimo de headcount en la rubrica, no la lista. La rubrica puede haber sido establecida cuando tu movimiento era puramente empresarial y no se ha actualizado desde que abriste un segmento SMB. Actuar sobre esos códigos de defecto eliminando el 35% de la lista es el movimiento equivocado; re-examinar la rubrica es el correcto. Guard: después de cada auditoría, verifica si algún código de defecto único aplica a más del 25% de las cuentas. Si es así, revisa el criterio de rubrica que genera ese código antes de remediar la lista. La tabla de frecuencia de defectos de la salida de auditoría hace esta verificación fácil — el código más común siempre es la fila uno de la tabla.
Enriquecimiento obsoleto produciendo falsos negativos en buenas cuentas. Una cuenta con un last_enrichment_date de 14 meses atrás puede haber triplicado su headcount, levantado una Serie B y añadido Salesforce a su tech stack desde que se recopilaron esos datos. El veredicto Q4 del skill sobre esa cuenta no es un veredicto sobre la empresa — es un veredicto sobre tu cadencia de enriquecimiento. Eliminar o desclasificar esas cuentas antes de re-enriquecerlas pierde pipeline real. Guard: el skill añade stale-data a cualquier cuenta donde el enriquecimiento supere el umbral de obsolescencia y anota “scored on potentially stale data” en la justificación. La cola de remediación coloca las cuentas stale-data + alto potencial de puntuación de rubrica en la cima. La regla vigente: nunca eliminar una cuenta de la lista únicamente por stale-data; siempre re-enriquecerla primero.
Inflación de score de intención por comportamiento de usuario único. Una empresa en un segmento de “alta intención” de 6sense puede estar ahí porque un analista junior de la empresa leyó tres publicaciones del blog. Presentar esa empresa como intent-spike y enrutarla al contacto directo del AE en base a esa señal es un falso positivo que consume tiempo del AE. Guard: cuando se proporcionan intent_scores, el skill muestra la puntuación de intención en bruto y la fuente junto con el flag intent-spike. La orientación vigente en la salida del skill: antes de actuar sobre cualquier señal intent-spike, verifica con 6sense o tu plataforma ABM que la actividad de intención proviene de personas del comité de compra — nivel director y superior en áreas funcionales relevantes — en lugar de un solo usuario de baja autoridad.
Deriva de la rubrica invalidando comparaciones históricas de auditoría. Si la rubrica cambia entre la auditoría de Q2 y la auditoría de Q3, las puntuaciones de calidad de lista no son comparables — una puntuación en aumento puede simplemente reflejar una rubrica más laxa, no una mejora real de la lista. Guard: el skill registra el SHA-256 de la rubrica en cada pie de auditoría. Al comparar puntuaciones de calidad de lista trimestre a trimestre, confirma que el SHA-256 de la rubrica es idéntico. Si la rubrica cambió, re-ejecuta la lista del trimestre anterior contra la nueva rubrica antes de hacer comparaciones. La fecha “Last edited” en el archivo de rubrica y el recordatorio trimestral en el calendario para revisar la rubrica trabajan juntos para hacer visible la deriva antes de que distorsione la tendencia.

vs alternativas

vs revisión manual de RevOps. Para una lista de menos de 50 cuentas, un analista de RevOps experimentado con la rubrica ICP abierta puede revisar manualmente cada cuenta en 2-3 horas y producir un resultado mejor calibrado que el skill — los humanos captan casos límite, como “esta empresa tiene un código SIC extraño pero su producto real claramente está en nuestro ICP,” que el skill pasará por alto. Por encima de 150 cuentas, la revisión manual se vuelve inconsistente: la intuición ICP del analista deriva entre la primera cuenta y la número 130. El skill aplica la rubrica de manera consistente en cualquier tamaño de lista.

vs la calificación de cuentas integrada de 6sense. 6sense proporciona una puntuación de ajuste de cuenta basada en su modelo ICP propietario, entrenado en empresas en tu CRM con historial de engagement positivo. Es útil una vez que tienes suficiente historial de CRM para que 6sense aprenda (típicamente 50-100 cuentas cerradas-ganadas). Para equipos por debajo de ese umbral, el modelo de ajuste de 6sense está sub-entrenado y es ruidoso. Este skill funciona desde el primer día porque la rubrica es de autoría manual. La compensación: el modelo de 6sense recoge patrones que no escribiste explícitamente; este skill solo sabe lo que le dijiste. Para equipos con 50+ cerradas-ganadas, ejecuta ambos — usa la puntuación de 6sense para “qué me sorprende” y los códigos de defecto de este skill para “qué específicamente está mal con las cuentas Q3.”

vs una matriz de puntuación ICP en hoja de cálculo. Muchos equipos de RevOps tienen una hoja de cálculo donde califican manualmente cada cuenta contra criterios ICP. El enfoque de hoja de cálculo se desmorona a escala (la consistencia cae por encima de 50 cuentas), no produce una taxonomía de defectos (te dice la puntuación, no por qué está mal), y se vuelve obsoleta en el momento en que la rubrica cambia porque nadie actualiza todas las filas puntuadas previamente. Este skill aplica la rubrica de manera consistente, nombra el defecto específico, y el mecanismo SHA-256 asegura que sepas cuándo se movió la rubrica. La hoja de cálculo es la herramienta adecuada para las primeras 20 cuentas; el skill es la herramienta adecuada después de eso.

Editar esta página en GitHub

Archivos de este artefacto

Descargar todo (.zip)

---
name: abm-list-quality-audit
description: Audit an ABM target list against an explicit ICP rubric and return a defect report for every account that fails. Produces a per-account defect taxonomy (wrong-size, wrong-industry, wrong-geo, wrong-funding, tech-mismatch, stale-data, low-intent, missing-field), a list-level quality score, and a prioritized remediation queue. Use before any ABM campaign goes live — not as a substitute for ICP strategy work.
---

# ABM list quality audit

## When to invoke

Invoke before launching any ABM campaign, before loading a list into a paid-media ABM platform, or before assigning named accounts to AEs. The skill takes a structured account list and your ICP rubric and returns a per-account defect report plus a list-level quality score.

The skill is also useful for quarterly list hygiene: run it over your existing ABM universe to find accounts that were added months ago and no longer match the current ICP, or accounts where enrichment has gone stale.

Invoke from:

- A **Clay table** where each row is an account, triggered manually or on a quarterly schedule. The skill writes defect codes and a quality tier back to two columns.
- A **CSV pre-flight check** before import into 6sense, Demandbase, or any ABM advertising platform that charges per account or per impression — running the audit first removes accounts you would pay to target and never convert.
- A **Salesforce report-based trigger** over named accounts in a specified segment, via a custom-code action that calls the skill and writes `ABM_Quality_Tier__c` and `ABM_Defect_Codes__c` back to the account record.

Do NOT invoke this skill for:

- **Scoring individual inbound leads.** The audit is designed for outbound named-account lists, not for triage of inbound MQLs. For inbound scoring, use the lead-scoring-icp-rubric skill.
- **Replacing the ICP strategy session.** The skill audits against a rubric you provide. If the rubric is a proxy for last year's customers, the audit will reproduce last year's biases. Have the ICP argument with your RevOps and GTM leadership before running the audit.
- **Generating net-new accounts.** The skill audits an existing list. It does not generate new accounts or run discovery on the TAM. Use a dedicated list-building workflow (Clay + ICP criteria) to generate the raw list first.
- **Suppression list management.** If the goal is to remove churned customers, competitors, or current customers from the list, that is deduplication, not auditing. Run those exclusion checks before invoking the skill.

## Inputs

Required:

- `account_list` — a structured list of account records. Minimum fields per account: `company_name`, `company_domain`. Strongly preferred: `industry`, `headcount`, `country`, `revenue_band`, `tech_stack` (array), `funding_stage`, `last_enrichment_date`.
- `rubric` — path to or inline contents of the ICP rubric markdown (see `references/1-icp-rubric-template.md`). Must contain explicit criterion + weight + tier-value rows. If the rubric has no weights, the skill refuses to run.

Optional:

- `intent_scores` — a map of `company_domain → intent_score` from 6sense, Bombora, or your ABM platform. When provided, the skill adds a `low-intent` defect code for accounts below your defined intent floor, and an `intent-spike` positive flag for accounts above your hot-intent threshold.
- `enrichment_staleness_days` — integer, default 90. Accounts where `last_enrichment_date` is older than this value receive a `stale-data` defect code. Adjust to match how aggressively your enrichment layer (Clay, ZoomInfo, Apollo) recycles data.
- `list_name` — string. Used to label the audit report. If omitted, defaults to `"Unnamed list — {run_date}"`.

## Reference files

Always load these before running the audit:

- `references/1-icp-rubric-template.md` — the ICP rubric. Same structure as the lead-scoring skill's rubric; shared between the two skills if your team uses both. Weights and tier values must be explicit.
- `references/2-defect-taxonomy.md` — the full defect code vocabulary with definitions, severity levels (P1 / P2 / P3), and the remediation action for each code. Edit this once with your RevOps lead before first use; the codes in the audit output are only as useful as the definitions in this file.
- `references/3-sample-audit-output.md` — a literal example of the full audit report for a 5-account list. Use when wiring downstream parsers or building the CRM writeback.

## Method

The skill runs four steps in order.

### 1. Hard disqualifier sweep (no LLM)

Before any LLM call, check each account against the rubric's hard disqualifiers: sanctioned country, disqualified industry, headcount below floor. Accounts that hit a hard disqualifier receive defect code `hd:{reason}` (e.g. `hd:sanctioned_country`) and a quality tier of `disqualified`. These are deterministic and cheap; they run first so the LLM does not burn tokens on them.

Why deterministic first: same reason as lead scoring — speed and reliability. A hard disqualifier check on 500 accounts takes milliseconds and never hallucinates.

### 2. Per-account ICP rubric scoring

For each account that cleared the hard disqualifier sweep, score against the ICP rubric using the same per-criterion method as the lead-scoring skill (explicit tier + weight + rationale per criterion). The weighted sum maps to a quality tier:

- **Q1** — score ≥ 8.0: in-ICP, meets criteria. No defect codes from rubric scoring.
- **Q2** — score 6.0-7.99: in-ICP with gaps. Defect codes name the specific failing criteria.
- **Q3** — score 4.0-5.99: borderline. Multiple defect codes; recommend enrichment and re-audit before including.
- **Q4** — score < 4.0: out-of-ICP. Recommend removal from the active list; flag for archive.

Why explicit tier thresholds rather than "let the model decide": same reason as lead scoring — the rubric is the source of truth, and the model's job is to apply it, not to re-weight it.

### 3. Supplemental defect detection

After rubric scoring, run supplemental checks that are not covered by the rubric criteria:

- **`stale-data`**: `last_enrichment_date` is older than `enrichment_staleness_days`. The account's rubric score is suspect because the underlying data may be wrong.
- **`missing-field`**: one or more rubric criteria could not be scored because the field was missing from the account record. List the missing field names.
- **`low-intent`**: `intent_scores[domain]` is below the floor defined in the rubric or passed as input. Applied on top of rubric score — a Q1 account with low intent is still in-ICP but is not hot right now.
- **`intent-spike`**: `intent_scores[domain]` is above the hot-intent threshold. A positive flag, not a defect; surfaced to help prioritize outreach even if the rubric score is only Q2.

### 4. List-level quality report and remediation queue

After per-account scoring, aggregate:

- **List quality score**: Q1% + Q2% - Q3% - 2×Q4%. This is a synthetic score intended to give a single number for "how good is this list" at a glance. A score above 60 means the list is predominantly in-ICP; below 30 means the list needs significant remediation before use.
- **Defect frequency table**: counts of each defect code across the list. The most common defect code tells you the single most valuable enrichment or segmentation fix.
- **Remediation queue**: the Q2 and Q3 accounts with `missing-field` or `stale-data` codes, ordered by estimated re-audit lift (accounts most likely to become Q1 after re-enrichment). This is the queue to hand to whoever owns enrichment.

Why a list-level score: individual account scores are useful for routing; the list-level score is useful for the ABM campaign go/no-go decision. If the list score is below 30, the campaign should not launch — the target list is too weak to justify the ABM platform spend.

## Output format

Literal markdown the skill emits for a 5-account list:

```markdown
# ABM list audit — Q3 2026 DACH expansion (run 2026-05-23)

**List quality score:** 52 / 100
**Accounts audited:** 5
**Breakdown:** Q1: 1 · Q2: 2 · Q3: 1 · Q4: 1

## Recommendation

List is marginal (score 52). Do not launch until Q3/Q4 accounts are remediated or removed.
Priority: re-enrich 2 Q2 accounts with missing headcount data; remove 1 Q4 account.

## Per-account results

| Domain | Quality tier | Score | Defect codes |
|---|---|---|---|
| northwind.com | Q1 | 8.6 | none |
| tailspin.io | Q2 | 7.1 | missing-field:headcount, stale-data |
| fabrikam.de | Q2 | 6.3 | wrong-size:too-small, wrong-funding, low-intent |
| contoso.com | Q3 | 5.0 | wrong-industry, tech-mismatch, missing-field:tech_stack |
| adventure-works.com | Q4 | 3.2 | wrong-size:too-large, wrong-geo, missing-field:revenue |

## Defect frequency table

| Defect code | Count | Action |
|---|---|---|
| missing-field:headcount | 2 | Re-enrich via Clay ZoomInfo column |
| stale-data | 2 | Re-run enrichment on accounts with last_enrichment_date > 90 days |
| wrong-size | 2 | Review headcount band in rubric — may be over-restricted |
| wrong-industry | 1 | Confirm industry mapping — SIC code may be miscategorized |
| wrong-geo | 1 | Remove if DACH-only campaign; keep for global list |
| wrong-funding | 1 | Move to pre-series A nurture vs. growth-stage ABM segment |
| tech-mismatch | 1 | Re-enrich tech stack via BuiltWith or Clay; remove if confirmed miss |
| low-intent | 1 | Move to nurture; re-activate when intent signal appears |
| missing-field:tech_stack | 1 | Re-enrich via BuiltWith or Clay tech-stack column |

## Remediation queue (by re-audit lift)

1. tailspin.io — add headcount; re-enrich; likely Q1 after fix.
2. fabrikam.de — low-intent flag only; already in-ICP. Activate when intent spikes.
3. contoso.com — re-enrich tech_stack; confirm industry; may move to Q2.

---
_Rubric SHA-256: 4f9c...a812 | Last edited 2026-05-01 by RevOps_
```

## Watch-outs

- **Defect codes that indict the rubric, not the account.** If 40% of the list has `wrong-size` codes, the problem is often not the list — it is a headcount floor in the rubric that was set when the company was targeting larger enterprises and was never updated after the SMB segment was opened. **Guard:** after every audit, check whether any single defect code applies to more than 25% of accounts. If so, review the rubric criterion that generates that code before remediating the list. The list might be right and the rubric wrong.
- **Stale enrichment masking real ICP fit.** An account's `last_enrichment_date` of 14 months ago means its headcount, funding stage, and tech stack data may all be wrong. A Q4 score on stale data is not a verdict on the account — it is a verdict on your enrichment cadence. **Guard:** the skill adds `stale-data` to any account where enrichment is older than the `enrichment_staleness_days` threshold, and the per-account rationale notes "scored on potentially stale data" for any such account. Do not remove Q4 + `stale-data` accounts; re-enrich them first and re-audit.
- **Intent score inflation from brand-aware accounts.** An account in a 6sense high-intent segment may be there because of one analyst at the company who reads your blog weekly — not because the buying committee is in-market. **Guard:** when `intent_scores` are provided, the skill shows the raw intent score alongside the `intent-spike` flag and names the intent source. Before acting on an `intent-spike` account, verify the intent signal is from buying-committee personas, not from a single low-authority user.

# ICP rubric — TEMPLATE (ABM audit)

> Replace this template's contents with your team's actual ICP rubric.
> The ABM list audit skill scores each account against this rubric.
> Vague rows (no weights, no tier values) cause the skill to refuse the run.
>
> This file can be shared with the lead-scoring-icp-rubric skill — the
> rubric structure is identical. If your team uses both skills, maintain
> one rubric file and reference it from both.

## How the skill reads this file

- Each row in "Criteria" must have an explicit `weight` (1-5) and three tier values
  (A / B / C). Malformed rows cause the skill to return an error.
- "Hard disqualifiers" run as deterministic checks before any LLM call. A single
  hit drops the account to `disqualified` regardless of other criteria.
- "Intent thresholds" are optional — only used when `intent_scores` is passed
  as input. Set these to match your ABM platform's scoring bands.
- The "Last edited" line is hashed into the SHA-256 recorded in the audit footer.

## Criteria

| Criterion | Weight | A (best fit) | B (stretch) | C (poor fit) |
|---|---|---|---|---|
| Industry | 5 | {industries you win in, e.g. Vertical SaaS, FinTech} | {adjacent industries} | {everything else} |
| Headcount | 4 | {core range, e.g. 200-2000} | {stretch range, e.g. 50-200 or 2000-5000} | {below/above stretch} |
| Geo | 3 | {primary regions, e.g. US, UK, DACH} | {secondary regions} | {unsupported regions} |
| Tech stack | 4 | {signals of fit, e.g. Salesforce + HubSpot present} | {one fit signal present} | {no fit signals or competing system} |
| Funding stage | 2 | {preferred stages, e.g. Series B-D, public mid-cap} | {adjacent stages} | {unfit, e.g. pre-seed or mature enterprise} |
| Revenue band | 3 | {ARR or revenue band that matches your ACV, e.g. $10M-$100M ARR} | {adjacent band} | {below minimum or above ceiling} |

## Hard disqualifiers

Single signals that drop an account to `disqualified` regardless of other criteria.
Run as deterministic checks before LLM scoring.

- `country in [{sanctioned or unsupported regions}]`
- `industry in [{disqualified industries — e.g. adult content, gambling if you do not serve them}]`
- `headcount < {absolute floor, e.g. 25}` (if you have one)
- `company_domain in [{explicit exclusion list — competitors, current customers, churned accounts}]`

## Intent thresholds (optional — only used when intent_scores provided)

Used to assign `low-intent` or `intent-spike` flags on top of the rubric score.

| 6sense / Bombora intent score | Flag applied |
|---|---|
| ≥ {hot threshold, e.g. 75} | `intent-spike` |
| {floor, e.g. 35} — {hot threshold - 1} | no flag (normal) |
| < {floor, e.g. 35} | `low-intent` |

## Quality tier thresholds

| Weighted score | Quality tier |
|---|---|
| 8.0 - 10.0 | Q1 (in-ICP, no rubric defects) |
| 6.0 - 7.99 | Q2 (in-ICP with gaps) |
| 4.0 - 5.99 | Q3 (borderline — remediate before use) |
| < 4.0 | Q4 (out-of-ICP — recommend removal) |

## Last edited

{YYYY-MM-DD} — by {RevOps owner name}

# Defect taxonomy — TEMPLATE

> This file defines every defect code the ABM list audit skill can assign.
> Edit the "Remediation action" column to match your team's actual processes
> before first use. The codes themselves are fixed — do not rename them;
> downstream parsers (CRM writeback, Clay columns) key on the code strings.

## How the skill reads this file

- Each defect code has a `severity` (P1 / P2 / P3). P1 defects are show-stoppers
  that mean the account should be removed or quarantined from the campaign until
  fixed. P2 defects are remediable. P3 defects are informational — the account
  can proceed, but the ABM or AE team should be aware.
- The skill emits defect codes in the per-account row and the defect-frequency
  table. It does not emit the full definition — that lives here for the human
  reviewer.

## Defect codes

### Rubric-sourced defects (from ICP scoring)

| Code | Severity | Definition | Remediation action |
|---|---|---|---|
| `wrong-industry` | P1 | Account's industry is in the C-tier or disqualified row of the rubric. | Remove from active list. Archive with `out-of-icp` tag. |
| `wrong-size:too-small` | P1 | Headcount is below the rubric's B-tier floor. | Remove unless a specific exemption applies (e.g. fast-growing startup with known expansion intent). |
| `wrong-size:too-large` | P2 | Headcount exceeds the rubric's B-tier ceiling. | Flag for enterprise segment or remove from SMB/mid-market campaign. |
| `wrong-geo` | P1 | Account's HQ region is not in the rubric's supported geo tiers. | Remove from geo-targeted campaign; keep in global campaigns if you have capacity to serve. |
| `wrong-funding` | P2 | Funding stage is in the C-tier row. | Move to a different campaign segment (pre-series A nurture vs. growth-stage ABM). |
| `tech-mismatch` | P2 | Tech stack has no fit signals from the rubric's tech-stack criterion. | Re-enrich tech stack; confirm via BuiltWith or Clay. If confirmed miss, remove. |

### Supplemental defects (not from rubric scoring)

| Code | Severity | Definition | Remediation action |
|---|---|---|---|
| `stale-data` | P2 | `last_enrichment_date` is older than the `enrichment_staleness_days` threshold. Rubric score is unreliable. | Re-run enrichment on this account before acting on its quality tier. Do not remove solely because of this code. |
| `missing-field:{field}` | P2 | The named field was absent from the account record. The criterion that uses it was scored as C (worst case) by default. | Re-enrich the specific field. Re-audit after enrichment. |
| `low-intent` | P3 | Intent score from the provided `intent_scores` input is below the floor threshold. | Move to nurture or lower-frequency sequence. Do not assign to AE until intent rises. |
| `hd:{reason}` | P1 | Hard disqualifier triggered. `{reason}` is the specific rubric row that matched (e.g. `hd:sanctioned_country`, `hd:competitor`). | Remove immediately. Archive with `disqualified` tag and the `hd:{reason}` code for audit trail. |

### Positive flags (not defects — appear in the per-account row for awareness)

| Code | Definition | Action |
|---|---|---|
| `intent-spike` | Intent score is above the hot-intent threshold. Account is signaling active in-market behavior. | Prioritize for direct AE outreach regardless of rubric tier. Even a Q2 account with `intent-spike` warrants a personalized touch. |

## Severity definitions

- **P1 — Remove:** the account should not be in the active ABM list. Keeping it wastes budget and suppresses campaign performance metrics.
- **P2 — Remediate:** the account may be a valid target but needs data work or segmentation before it can be activated. Hold from campaign activation until the defect is resolved.
- **P3 — Informational:** the account can proceed, but the campaign team should calibrate expectations. No blocking action required.

## Last edited

{YYYY-MM-DD} — by {RevOps owner name}

# Sample audit output — for parser wiring

> A literal example of what the skill emits for a 5-account list. Use
> when wiring the downstream parser: Clay AI column → property mapping,
> Salesforce custom-code action → property writeback, CSV post-processor.
> The schema below is what the skill commits to; the values are illustrative.

## Full audit report

```markdown
# ABM list audit — Q3 2026 DACH expansion (run 2026-05-23)

**List quality score:** 52 / 100
**Accounts audited:** 5
**Breakdown:** Q1: 1 · Q2: 2 · Q3: 1 · Q4: 1

## Recommendation

List is marginal (score 52). Do not launch until Q3/Q4 accounts are remediated or removed.
Priority: re-enrich 2 Q2 accounts with missing headcount data; remove 1 Q4 account.

## Per-account results

| Domain | Quality tier | Score | Defect codes |
|---|---|---|---|
| northwind.com | Q1 | 8.6 | none |
| tailspin.io | Q2 | 7.1 | missing-field:headcount, stale-data |
| fabrikam.de | Q2 | 6.3 | wrong-size:too-small, wrong-funding, low-intent |
| contoso.com | Q3 | 5.0 | wrong-industry, tech-mismatch, missing-field:tech_stack |
| adventure-works.com | Q4 | 3.2 | wrong-size:too-large, wrong-geo, missing-field:revenue |

## Defect frequency table

| Defect code | Count | Action |
|---|---|---|
| missing-field:headcount | 2 | Re-enrich via Clay ZoomInfo column |
| stale-data | 2 | Re-run enrichment — last_enrichment_date > 90 days |
| wrong-size | 2 | Review headcount band in rubric — may be over-restricted |
| wrong-industry | 1 | Confirm industry mapping — SIC code may be miscategorized |
| wrong-geo | 1 | Remove if DACH-only campaign; keep for global list |
| wrong-funding | 1 | Move to pre-series A nurture vs. growth-stage ABM segment |
| tech-mismatch | 1 | Re-enrich tech stack via BuiltWith or Clay; remove if confirmed miss |
| low-intent | 1 | Move to nurture; re-activate when intent signal appears |
| missing-field:tech_stack | 1 | Re-enrich via BuiltWith or Clay tech-stack column |

## Remediation queue (by re-audit lift)

1. tailspin.io — add headcount; re-enrich; likely Q1 after fix.
2. fabrikam.de — low-intent flag only; already in-ICP. Activate when intent spikes.
3. contoso.com — re-enrich tech_stack; confirm industry; may move to Q2.

---
_Rubric SHA-256: 4f9c...a812 | Last edited 2026-05-01 by Sam Patel_
```

## Field contract for parsers

If you build a parser instead of consuming the markdown, these are the stable fields:

### List-level fields

- `list_name` — string
- `run_date` — ISO date string (YYYY-MM-DD)
- `list_quality_score` — integer, 0-100
- `total_accounts` — integer
- `q1_count`, `q2_count`, `q3_count`, `q4_count` — integers
- `recommendation` — string, one paragraph
- `defect_frequency[]` — array of `{defect_code, count, action}`
- `remediation_queue[]` — array of `{domain, rationale, estimated_tier_after_fix}`

### Per-account fields

- `domain` — string, lowercased
- `quality_tier` — enum: `Q1` / `Q2` / `Q3` / `Q4` / `disqualified`
- `score` — float, 0.0 to 10.0
- `defect_codes[]` — array of strings (defect code vocabulary from `references/2-defect-taxonomy.md`)
- `positive_flags[]` — array of strings (e.g. `intent-spike`)
- `rationale[]` — array of `{criterion, weight, tier, reason}` (same structure as lead-scoring skill)
- `data_notes` — string, e.g. "scored on potentially stale data (last_enrichment_date: 2025-02-14)"

### Salesforce CRM writeback mapping

| Audit field | Salesforce field | Field type |
|---|---|---|
| quality_tier | `ABM_Quality_Tier__c` | Picklist (Q1/Q2/Q3/Q4/disqualified) |
| defect_codes[] joined by `, ` | `ABM_Defect_Codes__c` | Text (255) |
| score | `ABM_ICP_Score__c` | Number (decimal, 1 place) |
| run_date | `ABM_Last_Audited__c` | Date |
| positive_flags[] joined by `, ` | `ABM_Intent_Flags__c` | Text (255) |