ooligo
claude-skill

Auditor de slate de diversidade com Claude

Dificuldade
avançado
Tempo de setup
45min
Para
recruiter · sourcer · talent-acquisition · dei-leader
Recrutamento e TA

Stack

Um Claude Skill que audita um slate de candidatos (o line-up de entrevistas pretendido pelo recruiter, ou o pool sourced completo, ou o pool de applications) contra o pool de referência relevante de mercado de trabalho do role, superficializa gaps de composição, e emite um registro de auditoria estruturado — sem rodar inferência estatística em candidatos individuais e sem recomendar quais candidatos adicionar ou remover. O output é decision support para o recruiter e o lead de DEI, não um sistema de decisão automatizado.

Quando usar

  • Você está cortando um slate de um pool sourced para mandar para o hiring manager e quer saber se a composição do slate reflete o pool de referência de mercado de trabalho do role antes de mandar.
  • Você está fechando um trimestre e precisa de uma auditoria agregada através de roles para a review do programa de DEI.
  • Você está preparando uma submissão de bias-audit do NYC Local Law 144 e precisa de um pre-check interno da composição do slate antes da auditoria independente formal.

Quando NÃO usar

  • Identificar pertencimento a classe protegida de candidatos individuais. O skill processa apenas dados demográficos agregados e self-reported. Ele recusa inferir demografia a partir de nome, foto, escola, ou qualquer sinal a nível de candidato.
  • Auto-rejeitar candidatos para “rebalancear” um slate. Rejeitar um candidato para bater um número de composição é discriminação reversa e dispara a mesma exposição legal que o desbalanceamento original. O skill superficializa o gap; o fix é upstream (canais de sourcing, search query, linguagem da JD), não no passo de slate-cut.
  • Dados de composição que os candidatos não consentiram. Dados de self-ID têm o próprio fluxo de consent sob a candidate-authorization que o ATS da firma captura (Ashby, Greenhouse, Lever todos expõem isso). O skill processa apenas os dados que o candidato concordou em compartilhar, no agregado.
  • Slates de role único com menos de 5 candidatos. Quanto menor o slate, menos sinal a auditoria significa. O skill avisa em tamanhos abaixo de 5; recusa computar stats de composição abaixo de 3.

Setup

  1. Solte o bundle. Coloque apps/web/public/artifacts/diversity-slate-auditor-skill/SKILL.md no seu diretório de skills do Claude Code.
  2. Configure a fonte de pool de referência. O skill precisa de um pool de referência para comparação — geralmente BLS occupational employment statistics (gratuito, público), aumentado com data industry-específica onde disponível. O seletor de pool de referência em references/1-reference-pools.md documenta qual tabela do BLS mapeia para qual família de role.
  3. Wire o export do ATS. Ashby e Greenhouse ambos expõem exports de self-ID via suas APIs (Ashby /candidate.list com colunas de self-id; Greenhouse endpoint applications com campos EEOC). O skill lê o export; não chama o ATS diretamente. Essa separação significa que a minimização de dados acontece no tempo de export e o skill nunca vê registros de candidato crus.
  4. Defina os guardrails de tamanho de slate. Default: avisar em tamanhos abaixo de 5, recusar em tamanhos abaixo de 3. Tune por família de role se os tamanhos típicos de slate do seu time diferem.
  5. Dry-run em um slate fechado. Audite o slate de um role que você fechou no último trimestre. Compare a análise de gap do skill com a leitura do mesmo slate do seu DEI lead. O skill superficializa deltas de composição; se esses deltas importam é uma chamada de julgamento que o skill não faz.

O que o skill realmente faz

Seis etapas. O skill é estruturado para manter a inferência no nível agregado — nunca no nível de candidato — e para superficializar gaps sem recomendar intervenções, porque a intervenção correta varia por fonte do gap e não é o passo de slate-cut.

  1. Carregue o slate (os candidatos que você pretende entrevistar, ou o pool sourced, ou o pool de application — dependendo do que o recruiter quer auditar). O skill espera um export a nível agregado: self-ID per-candidato é lido mas usado apenas para computar agregados; nenhuma análise per-candidato é emitida.
  2. Carregue o pool de referência para a família de role. BLS occupational employment statistics são o default; o mapeamento de família de role para tabela do BLS vive em references/1-reference-pools.md. Pools de referência industry-específicos (ex. Stack Overflow Developer Survey para software engineering) podem ser substituídos pelo recruiter.
  3. Compute deltas de composição no nível slate vs. pool de referência. Para cada dimensão demográfica em que o slate tem data de self-ID (gênero, raça/etnia per categorias EEOC, status de veterano, status de disability — apenas as dimensões que a firma coleta), compute a porcentagem do slate e a porcentagem do pool de referência. Compute o delta absoluto.
  4. Superficialize gaps por dimensão com uma banda de confiança. Um delta de 5pp num slate de 50 significa mais que o mesmo delta num slate de 8. A banda de confiança reflete o tamanho do slate e a especificidade do pool de referência.
  5. Superficialize candidatos de gap upstream. Para cada delta superficializado, liste 3-5 causas upstream prováveis que o recruiter pode investigar — mix de canal de sourcing, linguagem da search query (o pre-flight de fairness do Boolean search builder pega algumas dessas), linguagem da JD, linguagem do hiring-manager no screen. NÃO rankeie ou recomende; liste candidatos para o recruiter e o DEI lead investigarem.
  6. Emita registro de auditoria. Uma linha JSONL assinada com composição do slate, pool de referência usado, deltas computados, e a versão do skill. Sem PII. O registro de auditoria é o que torna uma submissão de NYC LL 144 ou uma review interna de DEI defensável.

Realidade de custo

Por audit de slate, em Claude Sonnet 4.6:

  • Tokens de LLM — 5-10k de input (agregados do slate + tabela de pool de referência + instruções do skill) e 2-3k de output (análise de gap por-dimensão + candidatos upstream). Grosso modo $0.05-0.10 por auditoria.
  • Data de pool de referência — data do BLS é gratuita. Stack Overflow Developer Survey é gratuito. Datasets industry-específicos variam; o caminho BLS-only custa $0.
  • Tempo de recruiter / DEI-lead — o win. Auditorias de composição são geralmente puladas porque são tediosas; o skill torna a auditoria o custo default em vez de um passo extra. Espere 5-10 minutos por slate para ler a auditoria, mais 20-40 minutos por trimestre para investigar os candidatos de gap upstream superficializados.
  • Tempo de setup — 45 minutos uma vez para o mapeamento de pool de referência e o wiring de export do ATS.

Métrica de sucesso

Trackeie três coisas, mensalmente, não per-slate:

  • Drift do delta de composição ao longo do tempo — o gap slate-vs-pool-de-referência diminui em roles trackeados? Se não, as intervenções upstream não estão funcionando.
  • Shift no mix de canal de sourcing — quando a auditoria superficializa um candidato de gap de canal de sourcing, o mix de canal de fato muda no próximo trimestre? Se sourcing continua recomendando os mesmos canais, a superfície upstream da auditoria não está alcançando sourcing.
  • Gap do NYC LL 144 / audit interno de DEI — quando o bias audit formal anual acontece, os achados dele casam com o que as auditorias slate-by-slate superficializaram ao longo do ano? Se a auditoria formal superficializa gaps que as auditorias de slate perderam, o mapeamento de pool de referência ou as dimensões trackeadas estão incompletas.

vs alternativas

  • vs dashboards de diversidade ATS-native (Greenhouse Inclusion, reporting de diversidade do Ashby). Dashboards ATS-native mostram composição; não computam deltas de pool de referência ou superficializam candidatos upstream. Escolha ATS-native se você só precisa de reporting. Escolha o skill se você precisa de decision support per slate.
  • vs Crosschq Diversity / SeekOut DEI / a camada de diversidade do Eightfold. Esses são produtos mais profundos com seus próprios pools de referência e camadas de análise. Escolha eles se o orçamento suporta o play de plataforma e você quer um produto gerenciado. Escolha o skill se você quer a lógica de auditoria no seu repo, o mapeamento de pool de referência que você controla, e o registro de auditoria portável.
  • vs stats de composição computados à mão. Computados à mão está fino para a review anual de DEI mas escapa na cadência de slate; ninguém computa à mão per slate. O skill torna a auditoria barata o suficiente para rodar em todo slate.
  • vs sem auditoria nenhuma. O default, e a exposição legal sob o NYC LL 144 (bias audit anual requerido para tools de AI usadas em hiring de NYC). O skill é a postura defensável mais barata.

Pontos de atenção

  • Discriminação reversa de “rebalanceamento”. Guard: o skill nunca recomenda adicionar ou remover candidatos individuais. Ajustar um slate removendo candidatos para bater números de composição é discriminação reversa e cria a mesma exposição legal que o desbalanceamento original. A auditoria superficializa; o fix é upstream.
  • Inferir demografia a partir de sinais de candidato. Guard: o skill processa apenas data de self-ID que o candidato consentiu em compartilhar. Ele recusa inferir raça/etnia a partir de nome, gênero a partir de pronomes, idade a partir de ano de graduação, ou qualquer inferência a nível de candidato. Os pools de referência usados para comparação são estatísticas agregadas, não features a nível de candidato.
  • Ruído de slate pequeno. Guard: tamanhos de slate abaixo de 5 produzem um header de warning na auditoria; abaixo de 3 o skill recusa computar stats de composição.
  • Pools de referência estagnados. Guard: o mapeamento de pool de referência em references/1-reference-pools.md carrega uma data last_verified per source. Sources mais antigos que 18 meses disparam um warning para refrescar o mapeamento.
  • Adulteração do audit trail. Guard: registros de auditoria são JSONL append-only com a versão do skill embutida. Modificação quebra a chain de assinatura do arquivo. Retenção rotineira de registro de auditoria deve ser pelo menos tão longa quanto a retenção de registro de hiring da firma (tipicamente 2-7 anos).
  • Risco de exfiltração de data de DEI. Guard: o registro de auditoria contém agregados e deltas, não campos per-candidato. O skill recusa escrever data de self-ID per-candidato no registro de auditoria.

Stack

O bundle do skill vive em apps/web/public/artifacts/diversity-slate-auditor-skill/ e contém:

  • SKILL.md — a definição do skill
  • references/1-reference-pools.md — o mapeamento family-de-role-para-pool-de-referência (BLS, Stack Overflow Developer Survey, etc.)
  • references/2-audit-record-format.md — o formato literal de output para o registro de auditoria JSONL

Tools que o workflow assume que você usa: Claude (o modelo), Ashby ou Greenhouse (o ATS, para o export de self-ID). Para a auditoria paralela de canal de sourcing, veja o Boolean search builder — o pre-flight de fairness dele pega algumas causas de gap upstream.

Conceitos relacionados: diversity recruiting, AI screening bias, structured interviewing.

Arquivos deste artefato

Baixar tudo (.zip)