ooligo
claude-skill

Síntesis de reference-checks con Claude

Dificultad
intermedio
Tiempo de setup
30min
Para
recruiter · talent-acquisition · hiring-manager
Reclutamiento y TA

Stack

Una Claude Skill que toma las notas del reclutador de las llamadas de referencias (transcripción cruda o resumen grabado), el CV del candidato y la rúbrica del rol, y produce un reporte estructurado de referencias: evaluación por dimensión con citas textuales, contradicciones entre referencias, áreas que las referencias no cubrieron (para que el reclutador sepa qué preguntarle a la próxima referencia) y una banda de confianza general — nunca una recomendación de contratar/no contratar. Reemplaza el informe de 90 minutos del reclutador con un ciclo de revisión y edición de 15 minutos, preservando la auditabilidad de los datos de referencia.

Cuándo usarlo

  • Completaste dos o más llamadas de referencias y tienes una transcripción (Fathom, grabaciones de llamadas de Gong o notas detalladas) o resúmenes de las llamadas.
  • El rol tiene una rúbrica escrita (la misma que se usa en structured interviewing), de modo que la síntesis pueda ser sensible a las dimensiones.
  • Quieres que las afirmaciones de las referencias sean auditables más adelante — cada afirmación del reporte debe rastrearse a una cita textual de las notas de la llamada, con el nombre de la referencia y la marca de tiempo de la llamada.

Cuándo NO usarlo

  • Generar una recomendación de contratar/no contratar. La skill produce una evaluación estructurada con confianza por dimensión. La decisión de contratación queda en manos del hiring manager y del interview debrief. Conectar la salida de la skill a una decisión activa las mismas preocupaciones de toma de decisiones automatizada que el rechazo automático en el screening.
  • Reemplazar la llamada de referencia en sí. La skill procesa notas; no entrevista a las referencias. Enviar emails automáticos a las referencias con un formulario (“cuestionario de referencia generado por IA”) produce datos de baja calidad y erosiona la disposición de la referencia a hablar con franqueza en futuras llamadas.
  • Grabar llamadas sin consentimiento. La mayoría de los estados de EE. UU. son de consentimiento de una sola parte para que el reclutador grabe; algunos (CA, IL, FL, MD, MA, MI, MT, NH, PA, WA) son de dos partes. La UE se rige por el GDPR — las llamadas grabadas necesitan una base legal explícita. La skill procesa notas independientemente de cómo se hayan capturado; no autoriza la grabación.
  • Referencias por canales paralelos (backchannel) que el candidato no aprobó. Postura de consentimiento distinta, workflow distinto, exposición legal distinta.

Setup

  1. Coloca el bundle. Pon apps/web/public/artifacts/reference-check-summary-skill/SKILL.md en tu directorio de skills de Claude Code.
  2. Reutiliza la rúbrica del rol. La skill lee el mismo archivo de rúbrica que se usa para screening y entrevistas estructuradas. Si tu equipo no tiene una rúbrica compartida, el interview question bank pack es el prerrequisito.
  3. Configura el registro de consentimiento. La skill escribe un campo consent_check por referencia (¿se grabó la llamada? ¿el candidato autorizó a la referencia? ¿la referencia consintió el procesamiento de las notas?). Si alguna respuesta es no o unknown, el reporte se marca con un encabezado de advertencia de consentimiento.
  4. Dry-run sobre una contratación cerrada. Procesa las referencias de un candidato contratado el trimestre pasado. Compara el reporte de la skill con tu propio informe redactado en el momento. Ajusta los anclajes de la rúbrica si la skill pondera las dimensiones de forma distinta a como lo hizo el equipo.

Lo que hace realmente la skill

Cinco pasos. El orden importa: la validación de consentimiento y el anclaje en la rúbrica ocurren antes de la síntesis, porque una síntesis sin consentimiento ni anclaje en la rúbrica es solo una renarración de las llamadas.

  1. Valida el consentimiento. Revisa consent_check por referencia. Consentimiento ausente o unknown → emite un encabezado de advertencia en el reporte (“Consentimiento no registrado para la referencia R2 — verificar antes de compartir el reporte”) y continúa. No bloquea; el reclutador puede saber que el consentimiento se dio verbalmente y olvidó registrarlo.
  2. Anclaje en la rúbrica. Lee la rúbrica del rol. Las dimensiones de la síntesis son las dimensiones de la rúbrica, no genéricas (“comunicación”, “liderazgo”). Si la rúbrica tiene skill_match, level_fit, ownership_signal, team_collaboration, esos son los encabezados del reporte.
  3. Síntesis por dimensión. Para cada dimensión de la rúbrica, extrae cada cita de las notas de la llamada que aporte evidencia sobre la dimensión. Agrupa por referencia. Etiqueta cada cita con su fuerza (strong-positive, weak-positive, neutral, weak-negative, strong-negative). Las citas son textuales de las notas; la paráfrasis no se permite porque despoja al reporte de la auditabilidad que es la razón de existir de la skill.
  4. Saca a la luz contradicciones y vacíos. Identifica dimensiones donde dos referencias divergen (una strong-positive, otra weak-negative) y expone la contradicción explícitamente. Identifica dimensiones que las referencias no cubrieron (sin citas encontradas) y exponlas como vacíos para que el reclutador sepa qué preguntarle a la próxima referencia, o sobre qué tendrá que apoyarse en cambio el paso de ranking de la rúbrica.
  5. Banda de confianza por dimensión, sin recomendación general. Para cada dimensión, devuelve una banda de confianza: high (varias referencias convergen con strong-positive o strong-negative), medium (mixto pero convergente), low (referencia única o contradicción), not assessed. No devuelve un score general de contratar/no contratar. La decisión queda en manos del hiring manager.

Costo real

Por reporte de candidato (típicamente 2-4 referencias, 60-90 minutos de tiempo total de llamada, 4-8K palabras de notas), con Claude Sonnet 4.6:

  • Tokens del LLM — típicamente 12-20k de entrada (notas + rúbrica + instrucciones de la skill) y 2-4k de salida (reporte estructurado). Al precio de lista de Sonnet 4.6, aproximadamente $0.10-0.18 por candidato. Un equipo que corre 20 ciclos de referencias por mes gasta $2-4 en costo de modelo.
  • Tiempo del reclutador — la ganancia. Escribir a mano un reporte estructurado de referencias toma 60-90 minutos por candidato. Revisar el reporte de la skill y editar el tono o agregar contexto toma 15-25 minutos. El mayor ahorro está en la sección de contradicciones, que un reclutador suele pasar por alto en una primera lectura de sus propias notas.
  • Tiempo de setup — 30 minutos una sola vez para la integración de la rúbrica y el formato de consent-check. La rúbrica de cada rol se reutiliza, así que el setup marginal por rol es cero.

Métrica de éxito

Mide dos números:

  • Satisfacción del hiring manager con el reporte — un puntaje de 1-5 que da el hiring manager después del debrief, sobre si el reporte hizo aflorar las dimensiones correctas y no enterró las contradicciones. Debería ubicarse en 4+ en una rúbrica calibrada.
  • Tiempo de ciclo de referencias — tiempo de reloj desde “última referencia completada” hasta “el hiring manager tiene el reporte”. Debería bajar de 1-2 días a menos de 2 horas.

vs alternativas

  • vs reporte escrito a mano. Escrito a mano es la elección correcta para las contrataciones de mayor riesgo (ejecutivas, frente al directorio) donde la voz narrativa del reclutador es el entregable. La skill amortiza su costo de setup en el 80% de las contrataciones donde el artefacto estructurado es lo que el equipo necesita.
  • vs automatización de referencias nativa del ATS (Greenhouse Reference Check, Crosschq, SkillSurvey). Esos productos se quedan con la recolección de referencias (referencias estilo cuestionario por email). Elígelos si tu empresa prefiere referencias asíncronas tipo cuestionario. Elige esta skill si tu equipo prefiere llamadas en vivo y el cuello de botella es la síntesis posterior. Las dos son complementarias; la skill también funciona sobre la salida de un cuestionario.
  • vs “resumime estas notas de referencia” estilo ChatGPT. El chat genérico devuelve un párrafo que se lee bien y entierra las contradicciones. La Skill es estructuralmente distinta: fuerza el agrupamiento por dimensión, exige citas textuales, se niega a redactar una recomendación general.

A qué prestar atención

  • Sesgo de retrospectiva con referencias de alta confianza. Guarda: la estructura del reporte fuerza el agrupamiento por dimensión en lugar de la narrativa liderada por la referencia, lo que dificulta que una referencia fuertemente opinada domine la lectura.
  • Citas alucinadas. Guarda: la skill está restringida a extracción textual. Las citas que no aparecen textualmente en las notas de la llamada están prohibidas; el prompt instruye explícitamente al modelo a omitir una dimensión si no puede citarse ninguna frase, en lugar de parafrasear.
  • Sobreponderar una sola referencia. Guarda: las contradicciones se exponen explícitamente, con las dos citas lado a lado. La lógica de banda de confianza del reporte baja a low en las dimensiones donde las referencias divergen, lo que previene una lectura confiada pero equivocada.
  • Recomendación implícita de contratación por el orden. Guarda: el reporte ordena las dimensiones por la rúbrica, no por el entusiasmo de la referencia. Las citas strong-positive no flotan hacia arriba; aterrizan en la dimensión a la que pertenecen.
  • Exposición por consentimiento y grabación. Guarda: el campo de consent-check por referencia es entrada obligatoria; el consentimiento ausente dispara un encabezado de advertencia. La skill procesa notas independientemente del estado de grabación, pero no exime al reclutador de la obligación subyacente de consentimiento.
  • Sesgo en la rúbrica subyacente que se arrastra. Guarda: si la rúbrica tiene dimensiones que no pasan un control de fairness (“culture fit” sin anclajes, scoring por prestigio de universidad), la síntesis hereda el sesgo. Pasa primero la rúbrica por el diversity slate auditor para el pool del rol.

Stack

El bundle de la skill vive en apps/web/public/artifacts/reference-check-summary-skill/ y contiene:

  • SKILL.md — la definición de la skill
  • references/1-report-format.md — la plantilla literal de salida (encabezados por dimensión, escala de banda de confianza, sección de contradicciones)
  • references/2-consent-checklist.md — el esquema del consent-check y las reglas del encabezado de advertencia

Herramientas que el workflow asume que usas: Claude (el modelo). Opcionales: Fathom o Gong para grabación de llamadas; Ashby para el registro del candidato. Para el workflow paralelo de interview-debrief, ver interview debrief summary skill.

Conceptos relacionados: structured interviewing, quality of hire, candidate experience.

Archivos de este artefacto

Descargar todo (.zip)