Un Claude Skill que toma una lista de cuentas objetivo ABM y una rubrica ICP, y devuelve un informe de defectos por cuenta — cada cuenta que no cumple los criterios recibe un código de defecto de una taxonomía definida (wrong-size, wrong-industry, wrong-geo, stale-data, low-intent, missing-field), un nivel de calidad (Q1 a Q4), una puntuación de calidad de la lista y una cola de remediación priorizada. El bundle se encuentra en apps/web/public/artifacts/abm-list-quality-audit-skill/ e incluye SKILL.md más tres plantillas de referencia que el usuario adapta antes del primer uso.
Responde la pregunta que la mayoría de las campañas ABM omiten antes del lanzamiento: “De las 300 cuentas en esta lista, ¿cuántas realmente cumplen nuestro ICP, y qué tiene de malo exactamente las que no cumplen?” Sin esa respuesta, el gasto en plataformas ABM — 6sense, Demandbase, LinkedIn matched audiences — va hacia cuentas que nunca convertirías, y los decepcionantes resultados de la campaña se atribuyen al mensaje o al canal en lugar de a la calidad de la lista.
Cuándo usar
Usa este skill antes de cargar cualquier lista ABM en una plataforma de medios pagos, antes de asignar cuentas nombradas a AEs, y antes del lanzamiento de cualquier campaña donde la lista fue ensamblada hace más de 90 días. Las listas ABM se degradan más rápido de lo que la mayoría de los equipos de RevOps creen: los datos de headcount se vuelven obsoletos, las etapas de financiamiento cambian, las empresas son adquiridas, y la rubrica ICP en sí misma a veces cambia sin que la lista sea reevaluada.
El skill también es la herramienta adecuada para la higiene trimestral de listas. Ejecútalo sobre todo tu universo ABM — no solo las listas de campaña — para encontrar cuentas que fueron añadidas cuando tu ICP era diferente y no han sido reevaluadas desde entonces. La tabla de frecuencia de defectos te dice qué vacíos de enriquecimiento son más comunes en tu universo, lo que es accionable para quien sea el dueño del workflow de enriquecimiento de Clay.
Invócalo desde:
- Una tabla de Clay donde cada fila es una cuenta, activada manualmente antes del lanzamiento de una campaña o en un cron trimestral. El skill escribe
quality_tierydefect_codesde vuelta a dos columnas de Clay; la automatización downstream puede filtrar en estas para suprimir cuentas Q3/Q4 de las cargas de campañas. - Una verificación de pre-vuelo de CSV antes de importar en 6sense o cualquier plataforma de publicidad ABM. Ejecutar la auditoría elimina cuentas que de otro modo pagarías para alcanzar — a las tasas típicas de CPM de ABM ($20-40 por 1.000 impresiones), eliminar 50 cuentas fuera del ICP de una lista de 500 reduce el desperdicio en un 10%.
- Un trigger basado en informe de Salesforce sobre cuentas nombradas en un segmento, escribiendo
ABM_Quality_Tier__cyABM_Defect_Codes__cde vuelta al registro de cuenta.
Cuándo NO usar
Omite este skill cuando:
- Quieres puntuar MQLs inbound. La auditoría está diseñada para listas de cuentas nombradas outbound. Para la clasificación de leads inbound, el skill lead-scoring-icp-rubric es la herramienta adecuada — maneja el flujo de lead individual y la lógica de escalamiento borderline que importa para inbound.
- Tu rubrica ICP aún no existe. El skill audita contra una rubrica que tú proporcionas. Si no has tenido la discusión sobre el ICP — qué industrias, rangos de headcount y geografías realmente ganas — esa conversación debe ocurrir primero. Ejecutar una auditoría contra una rubrica de marcador de posición produce una falsa sensación de rigor.
- La lista necesita deduplicación, no auditoría. Si el objetivo es eliminar clientes actuales, competidores, cuentas canceladas o contactos suprimidos por GDPR, eso es una operación de filtro, no una auditoría ICP. Ejecuta esas exclusiones antes de la auditoría, o el skill gastará tokens puntuando empresas que ya sabes que quieres excluir.
- Necesitas generar la lista, no auditarla. El skill toma una lista existente como entrada. No ejecuta descubrimiento de TAM ni genera cuentas nuevas. Usa un workflow dedicado de construcción de listas — Clay más criterios ICP — para producir la lista en bruto primero.
- La lista tiene menos de 20 cuentas. Por debajo de ese tamaño, un RevOps o AE experimentado puede revisar manualmente cada cuenta en menos de una hora. El costo de configuración del skill (configuración de rubrica, personalización de taxonomía de defectos) no vale la pena.
Configuración
La configuración toma entre 30 y 60 minutos asumiendo que la rubrica ICP existe. La discusión sobre la rubrica — alinear a RevOps, el liderazgo GTM y un AE o dos sobre qué significa realmente una industria y un rango de headcount de nivel A — lleva más tiempo y ocurre antes de la configuración.
- Instala el Skill. Copia
apps/web/public/artifacts/abm-list-quality-audit-skill/SKILL.mdy la carpetareferences/en tu directorio.claude/skills/abm-audit/, o súbelo como Skill en claude.ai. Elnameydescriptiondel frontmatter son el disparador en prompts relevantes. - Configura la rubrica ICP. Abre
references/1-icp-rubric-template.md. Si tu equipo ya usa el skill lead-scoring-icp-rubric, puedes referenciar el mismo archivo de rubrica — la estructura es idéntica. Reemplaza las filas de marcador de posición con criterios reales, pesos (1-5) y valores de nivel (A / B / C). Completa la sección de descalificadores duros. Actualiza “Last edited” — el SHA-256 que el skill registra en cada pie del informe asegura que las partes interesadas puedan saber cuándo se movió la rubrica. - Configura la taxonomía de defectos. Abre
references/2-defect-taxonomy.md. Los códigos de defecto en sí mismos son fijos — no los renombres, ya que los parsers downstream usan las cadenas de código. Edita la columna “Remediation action” para que coincida con el proceso real de tu equipo: qué columna de Clay proporciona el re-enriquecimiento de headcount, quién es el dueño de la suscripción de ZoomInfo, qué segmento es dueño de las cuentas de desbordamiento empresarial. - Prepara los scores de intención (opcional pero de alto valor). Si usas 6sense o Bombora, exporta un mapa
domain → intent_scorepara tu universo de cuentas y pásalo como entradaintent_scores. Esto añade anotacioneslow-intenteintent-spikesobre los scores de rubrica — el flagintent-spikees particularmente valioso para cuentas Q2 que están en ICP pero borderline, porque las saca a la superficie para priorización incluso antes del re-enriquecimiento. - Establece el umbral de obsolescencia de enriquecimiento. Actualiza
enrichment_staleness_dayspara que coincida con qué tan agresivamente tu capa de enriquecimiento recicla. Clay + ZoomInfo típicamente se actualiza en un programa de 90 días; si ejecutas enriquecimiento mensual, puedes establecer 45 días. Esto impulsa el código de defectostale-data. - Prueba en una lista conocida. Ejecuta el skill sobre 20-30 cuentas que conoces bien — una mezcla de clientes actuales, cuentas canceladas y prospectos de calidad variable. Verifica que los niveles de calidad coincidan con la intuición de tu equipo. Si las cuentas Q1 muestran códigos de defecto, la rubrica está mal calibrada. Si cuentas obviamente fuera del ICP puntúan Q2, los descalificadores duros o los pesos necesitan ajuste.
Qué hace el skill en realidad
El skill ejecuta cuatro pasos en un orden fijo.
Paso 1 — barrido de descalificadores duros. Antes de cualquier llamada LLM, cada cuenta se verifica contra los descalificadores duros de la rubrica: país en lista de sanciones, industria descalificada, headcount por debajo del mínimo absoluto, cuentas en la lista de exclusión explícita (competidores, clientes actuales). Las que coinciden reciben el código de defecto hd:{reason} y un nivel de calidad de disqualified. Este paso es determinista y se ejecuta en cada cuenta en milisegundos. Por qué ejecutarlo primero: en una lista de 500 cuentas, es común que del 5 al 15% de las cuentas sean descalificaciones inmediatas — ejecutar puntuación LLM en esas cuentas desperdicia tokens y agrega latencia sin agregar información.
Paso 2 — puntuación de rubrica ICP por cuenta. Las cuentas que superaron el barrido de descalificadores duros se puntúan contra cada criterio de la rubrica. Para cada criterio, el modelo emite un nivel (A / B / C), un peso (de la rubrica) y una razón de una oración que cita la fila de la rubrica. La suma ponderada se mapea a un nivel de calidad: Q1 (puntuación ≥ 8,0), Q2 (6,0-7,99), Q3 (4,0-5,99), Q4 (< 4,0). Los criterios fallidos generan los códigos de defecto correspondientes — una puntuación de criterio C de headcount en una cuenta por debajo del mínimo del nivel B genera wrong-size:too-small.
Por qué por criterio en lugar de una puntuación holística: los códigos de defecto que impulsan la cola de remediación requieren saber qué criterio específico falló, no solo que la puntuación general fue baja. Una cuenta Q3 con missing-field:tech_stack es una tarea de remediación diferente de una cuenta Q3 con wrong-industry — la primera necesita enriquecimiento, la segunda necesita eliminación.
Paso 3 — detección de defectos suplementarios. Después de la puntuación de rubrica, el skill verifica defectos no cubiertos por la rubrica: stale-data (enriquecimiento más antiguo que el umbral), missing-field:{field} (criterios que no pudieron puntuarse), low-intent e intent-spike de los scores de intención proporcionados. El flag intent-spike puede aparecer incluso en cuentas Q2 — saca a la superficie cuentas donde el comportamiento en el mercado debería anular la puntuación de rubrica borderline y desencadenar de todos modos el contacto directo del AE.
Paso 4 — agregación a nivel de lista. Después de la puntuación por cuenta, el skill calcula la puntuación de calidad de la lista (Q1% + Q2% - Q3% - 2×Q4%, escalado a 100), la tabla de frecuencia de defectos y la cola de remediación. La cola de remediación está ordenada por levantamiento estimado de re-auditoría: las cuentas con mayor probabilidad de convertirse en Q1 después del re-enriquecimiento aparecen primero. Una puntuación de calidad de lista por debajo de 30 es la señal de go/no-go del skill — la sección de recomendación dirá “No lanzar hasta que las cuentas Q3/Q4 sean remediadas o eliminadas.”
Realidad de costos
El costo de tokens por cuenta depende del tamaño de la rubrica y cuántos datos de cuenta se proporcionan. Para una rubrica típica de 6 criterios con output estructurado por criterio y un registro de cuenta de 300-500 tokens de datos, espera aproximadamente 1.200-2.000 tokens de entrada y 300-500 tokens de salida por cuenta. Con los precios de Claude Sonnet 4.x (aproximadamente $3 por millón de tokens de entrada y $15 por millón de tokens de salida a principios de 2026), eso es $0,008-0,015 por cuenta.
Una auditoría de pre-campaña de 500 cuentas cuesta $4-8 en tokens de Claude. Un paso trimestral de higiene sobre un universo ABM de 2.000 cuentas cuesta $16-30. Estos son menores al costo de una sola secuencia mal enrutada de AE. El costo no relacionado con tokens es mayor: configurar correctamente la rubrica y la taxonomía de defectos es una sesión de 60-90 minutos; planifícala.
El costo de tokens por cuenta es menor que el skill de puntuación de leads porque las cuentas ABM típicamente tienen datos estructurados más ricos (menos campos faltantes) y los códigos de defecto son más compactos que una justificación por criterio completa. Si tus cuentas tienen muchos campos faltantes, más del procesamiento cae en el paso de defecto suplementario, que es determinista y gratuito.
El caché de prompts de los archivos de rubrica y taxonomía de defectos vale la pena de manera significativa a escala — en una auditoría de 500 cuentas, la rubrica se carga una vez y se almacena en caché en todo el lote. En una verificación puntual de 5 cuentas no importa.
Métrica de éxito
La métrica principal para la auditoría es la tendencia de puntuación de calidad de la lista: ejecuta la auditoría sobre el mismo universo ABM cada trimestre y rastrea si la puntuación de calidad de la lista aumenta. Una puntuación en aumento significa que tu cadencia de enriquecimiento está funcionando, tu rubrica es estable y tu proceso de construcción de listas se ha ajustado. Una puntuación en caída — o una puntuación que permanece estable a pesar del esfuerzo de remediación — significa que la rubrica ha cambiado o que la fuente de enriquecimiento no es confiable.
Métrica secundaria: tasa de conversión de campaña ABM por nivel de calidad. Después de 90 días de ejecutar campañas contra listas auditadas, compara la tasa de conversión a oportunidad para cuentas Q1 vs cuentas Q2 vs cuentas que fueron remediadas de Q3 antes de ser incluidas. Q1 debería convertir a una tasa mayor que Q2, y Q2 después de la remediación debería convertir a una tasa mayor que Q3 no auditado. Si no hay diferencia de conversión entre niveles, la rubrica no es predictiva y necesita ser re-argumentada.
Modos de falla
- Códigos de defecto que acusan a la rubrica, no a la lista. Si el 35% de tu lista recibe
wrong-size:too-small, el problema es a menudo el mínimo de headcount en la rubrica, no la lista. La rubrica puede haber sido establecida cuando tu movimiento era puramente empresarial y no se ha actualizado desde que abriste un segmento SMB. Actuar sobre esos códigos de defecto eliminando el 35% de la lista es el movimiento equivocado; re-examinar la rubrica es el correcto. Guard: después de cada auditoría, verifica si algún código de defecto único aplica a más del 25% de las cuentas. Si es así, revisa el criterio de rubrica que genera ese código antes de remediar la lista. La tabla de frecuencia de defectos de la salida de auditoría hace esta verificación fácil — el código más común siempre es la fila uno de la tabla. - Enriquecimiento obsoleto produciendo falsos negativos en buenas cuentas. Una cuenta con un
last_enrichment_datede 14 meses atrás puede haber triplicado su headcount, levantado una Serie B y añadido Salesforce a su tech stack desde que se recopilaron esos datos. El veredicto Q4 del skill sobre esa cuenta no es un veredicto sobre la empresa — es un veredicto sobre tu cadencia de enriquecimiento. Eliminar o desclasificar esas cuentas antes de re-enriquecerlas pierde pipeline real. Guard: el skill añadestale-dataa cualquier cuenta donde el enriquecimiento supere el umbral de obsolescencia y anota “scored on potentially stale data” en la justificación. La cola de remediación coloca las cuentasstale-data+ alto potencial de puntuación de rubrica en la cima. La regla vigente: nunca eliminar una cuenta de la lista únicamente porstale-data; siempre re-enriquecerla primero. - Inflación de score de intención por comportamiento de usuario único. Una empresa en un segmento de “alta intención” de 6sense puede estar ahí porque un analista junior de la empresa leyó tres publicaciones del blog. Presentar esa empresa como
intent-spikey enrutarla al contacto directo del AE en base a esa señal es un falso positivo que consume tiempo del AE. Guard: cuando se proporcionanintent_scores, el skill muestra la puntuación de intención en bruto y la fuente junto con el flagintent-spike. La orientación vigente en la salida del skill: antes de actuar sobre cualquier señalintent-spike, verifica con 6sense o tu plataforma ABM que la actividad de intención proviene de personas del comité de compra — nivel director y superior en áreas funcionales relevantes — en lugar de un solo usuario de baja autoridad. - Deriva de la rubrica invalidando comparaciones históricas de auditoría. Si la rubrica cambia entre la auditoría de Q2 y la auditoría de Q3, las puntuaciones de calidad de lista no son comparables — una puntuación en aumento puede simplemente reflejar una rubrica más laxa, no una mejora real de la lista. Guard: el skill registra el SHA-256 de la rubrica en cada pie de auditoría. Al comparar puntuaciones de calidad de lista trimestre a trimestre, confirma que el SHA-256 de la rubrica es idéntico. Si la rubrica cambió, re-ejecuta la lista del trimestre anterior contra la nueva rubrica antes de hacer comparaciones. La fecha “Last edited” en el archivo de rubrica y el recordatorio trimestral en el calendario para revisar la rubrica trabajan juntos para hacer visible la deriva antes de que distorsione la tendencia.
vs alternativas
vs revisión manual de RevOps. Para una lista de menos de 50 cuentas, un analista de RevOps experimentado con la rubrica ICP abierta puede revisar manualmente cada cuenta en 2-3 horas y producir un resultado mejor calibrado que el skill — los humanos captan casos límite, como “esta empresa tiene un código SIC extraño pero su producto real claramente está en nuestro ICP,” que el skill pasará por alto. Por encima de 150 cuentas, la revisión manual se vuelve inconsistente: la intuición ICP del analista deriva entre la primera cuenta y la número 130. El skill aplica la rubrica de manera consistente en cualquier tamaño de lista.
vs la calificación de cuentas integrada de 6sense. 6sense proporciona una puntuación de ajuste de cuenta basada en su modelo ICP propietario, entrenado en empresas en tu CRM con historial de engagement positivo. Es útil una vez que tienes suficiente historial de CRM para que 6sense aprenda (típicamente 50-100 cuentas cerradas-ganadas). Para equipos por debajo de ese umbral, el modelo de ajuste de 6sense está sub-entrenado y es ruidoso. Este skill funciona desde el primer día porque la rubrica es de autoría manual. La compensación: el modelo de 6sense recoge patrones que no escribiste explícitamente; este skill solo sabe lo que le dijiste. Para equipos con 50+ cerradas-ganadas, ejecuta ambos — usa la puntuación de 6sense para “qué me sorprende” y los códigos de defecto de este skill para “qué específicamente está mal con las cuentas Q3.”
vs una matriz de puntuación ICP en hoja de cálculo. Muchos equipos de RevOps tienen una hoja de cálculo donde califican manualmente cada cuenta contra criterios ICP. El enfoque de hoja de cálculo se desmorona a escala (la consistencia cae por encima de 50 cuentas), no produce una taxonomía de defectos (te dice la puntuación, no por qué está mal), y se vuelve obsoleta en el momento en que la rubrica cambia porque nadie actualiza todas las filas puntuadas previamente. Este skill aplica la rubrica de manera consistente, nombra el defecto específico, y el mecanismo SHA-256 asegura que sepas cuándo se movió la rubrica. La hoja de cálculo es la herramienta adecuada para las primeras 20 cuentas; el skill es la herramienta adecuada después de eso.