ooligo
claude-skill

Strukturierter Interview-Loop-Builder mit Claude

Difficulty
Fortgeschritten
Setup time
30min
For
recruiter · hiring-manager · talent-acquisition
Recruiting & TA

Stack

Ein Claude Skill, der eine Stellenbeschreibung, das Level der Rolle, die unverzichtbaren Kompetenzen und den verfügbaren Interviewer-Pool mit den kalibrierten Stärken jedes Interviewers entgegennimmt und daraus ein vollständiges Loop-Design erstellt — Stufenprogression, stufenspezifisches Rubrik-System mit Anker-Beschreibungen, verhaltensbasierte Fragen pro Dimension und eine Interviewer-Zuordnungstabelle mit Begründung für jede Auswahl. Anschließend hält der Skill inne und wartet auf den Review-Gate des Hiring Managers, bevor etwas im ATS konfiguriert wird. Ersetzt das „Wir regeln den Loop, wenn ein Kandidat im Screening ist” durch einen 30-minütigen Design-Durchlauf, der operative Disziplin produziert.

Wann verwenden

  • Sie haben eine genehmigte Stellenbeschreibung, ein bestätigtes Level und eine Liste unverzichtbarer Kompetenzen, die Einstellung von Nicht-Einstellung bei dieser Rolle unterscheiden.
  • Sie verfügen über eine strukturierte Interviewführung-Rubrik-Bibliothek mit Anker-Beschreibungen pro Score-Level pro Level-Band. Die Kompetenz-Vorlage unter apps/web/public/artifacts/interview-loop-builder-skill/references/1-competency-library.md zeigt die Struktur; wenn Sie diese nicht ausfüllen können, haben Sie noch keine Rubrik, aus der dieser Skill schöpfen kann.
  • Sie haben einen Interviewer-Pool mit kalibrierten Stärken, die pro Kompetenz und Level-Band erfasst sind — siehe references/2-interviewer-strengths.md im Bundle für die Matrix.
  • Ein Hiring Manager prüft den Loop, bevor er in Ashby oder Greenhouse konfiguriert wird. Der Skill schreibt Dateien und hält inne; er sendet nicht an das ATS.

Wann NICHT verwenden

  • Auto-Scheduling. Dieser Skill entwirft den Loop. Er plant keine Interviews, gleicht keine Kalender ab und sendet keine kandidatenseitigen Buchungslinks. Das ist Aufgabe von Goodtime, Ashby Scheduling oder Greenhouse Scheduling. Design und Scheduling in einem Skill zu koppeln, verbindet zwei Fehlerquellen, die unabhängig voneinander versagen sollten.
  • Ersetzen des Rubrik-Designs mit dem Hiring Manager. Der Skill gibt Anker-Beschreibungen pro Score-Level aus, indem er die Kompetenz-Bibliothek zieht, aber die Bibliothek selbst — was eine 5 für Systems Design auf IC5-Niveau bedeutet — liegt in der Verantwortung des Hiring Managers und des Funktionskopfs. Ist die Bibliothek leer oder vollständig vorlagenartig, verweigert der Skill die Ausführung und gibt stattdessen ein TODO aus, anstatt Rubrik-Anker für eine Funktion zu erfinden, für die kein kalibriertes Signal vorliegt.
  • Generische Template-Loops ohne rollenspezifische Kalibrierung. Nennen die Eingaben weder Level noch unverzichtbare Kompetenzen noch den verfügbaren Interviewer-Pool, verweigert der Skill die Ausführung. Ein Vier-Stufen-Loop mit generischen Labels wie „Behavioral”, „Technical”, „System Design”, „Leadership” wirkt strukturiert, ist es aber nicht. Jeder Kandidat erhält dieselben Fragen unabhängig von den Rollenprioritäten — das untergräbt den Zweck von Struktur.
  • Rollen unterhalb einer definierten Komplexitätsschwelle. Eine Zwei-Wochen-Contractor-Rolle benötigt keinen Vier-Stufen-Loop. Der Skill warnt und empfiehlt einen einstufigen Screen, wenn die Rolle befristet, stundenbasiert oder unter sechs Monate erwartetem Beschäftigungsverhältnis liegt.
  • Ersetzen von verhaltensbasiertem Interviewing-Training. Die vom Skill ausgegebenen Fragen folgen dem Situation/Verhalten/Ergebnis-Format, aber Interviewer benötigen weiterhin trainierte Kalibrierung, um konsistent zu bewerten. Der Skill ist das Gerüst; das Training ist die Voraussetzung.

Setup

  1. Bundle ablegen. Platzieren Sie apps/web/public/artifacts/interview-loop-builder-skill/SKILL.md in Ihr Claude Code Skills-Verzeichnis (oder claude.ai Custom Skills). Der Skill stellt eine aufrufbare Funktion bereit: design_loop.
  2. Kompetenz-Bibliothek ausfüllen. Kopieren Sie references/1-competency-library.md in Ihr Team-Repository. Ersetzen Sie jeden Platzhalter durch Ihre echten Kompetenzen, Definitionen, abgedeckte Level-Bands und Anker-Beschreibungen pro Score-Level. Der Skill verweigert die Ausführung, wenn die Bibliothek nur aus Vorlagen besteht.
  3. Interviewer-Stärken-Matrix ausfüllen. Kopieren Sie references/2-interviewer-strengths.md. Listen Sie jeden verfügbaren Interviewer, sein Team und die Level-Bands auf, für die er kalibriert ist, jede Kompetenz zu bewerten. Die Spalte „Letztes Interview” ist der Auslöser für eine Re-Kalibrierung nach sechs Monaten Inaktivität.
  4. Eingaben pro Rolle konfigurieren. Übergeben Sie für eine gegebene Rolle den JD-Pfad, das Level, ein Array von 3–6 Kompetenz-IDs und einen Pfad zur ausgefüllten Interviewer-Stärken-Matrix. Der Skill gibt loop.md und stufenspezifische Scorecard-Gerüste unter scorecards/ aus.
  5. Dry-Run auf einem abgeschlossenen Loop. Führen Sie den Skill auf einer Rolle aus, die Sie im letzten Quartal manuell designed haben. Vergleichen Sie die Stufenzuordnung und Interviewer-Zuteilungen des Skills mit dem manuellen Design. Weichen sie ab, liegt das in der Regel an der Kompetenz-Bibliothek oder der Interviewer-Matrix — nicht am Skill-Prompt.

Was der Skill tatsächlich tut

Sechs Schritte in festgelegter Reihenfolge. Die Reihenfolge ist entscheidend: deterministische Validierung und Zuordnung erfolgen, bevor das LLM Rubrik-Anker und Fragen generiert, und der Kandidatenerfahrungs-Durchlauf am Ende liest den zusammengesetzten Loop erneut, um Überlastung zu erkennen, die beim Zuweisen jeder Stufe in Isolation unsichtbar ist.

  1. Eingaben validieren. Jede Kompetenz-ID existiert in der Bibliothek; der Interviewer-Pool hat mindestens eine kalibrierte Person pro unverzichtbarer Kompetenz auf dem Level der Rolle; das Level liegt innerhalb der abgedeckten Bands der Bibliothek. Halt mit expliziten TODOs, wenn eine Prüfung fehlschlägt. Ein Director-Loop mit einer IC-only-Bibliothek produziert aufgeblähte Rubriken — dieser Schritt verhindert das.
  2. Kompetenzen Stufen zuordnen. Der Recruiter-Screen bewertet Fit und Basics (nie rubrikbasiert). Der HM-Screen übernimmt die ein bis zwei differenzierendsten Kompetenzen. Der On-Site-Loop verteilt den Rest nach dem Prinzip einer Kompetenz pro Interview, wo möglich. Die Ein-Kompetenz-pro-Interview-Regel ist bewusst opinioniert — zwei Kompetenzen in ein 60-Minuten-Interview zu bündeln produziert schwächeres Signal für beide und erschwert die Anwendung der Rubrik im Moment.
  3. Stufenspezifische Rubrik generieren. Für jede Post-Screen-Stufe werden die Anker-Beschreibungen für das Level-Band des Kandidaten aus der Kompetenz-Bibliothek gezogen. Pro Dimension werden 3–5 verhaltensbasierte Fragen im Situation/Verhalten/Ergebnis-Format generiert, zuzüglich einer empfohlenen Vertiefungsfrage pro Frage. Hypothetische „Was würden Sie tun”-Fragen sind standardmäßig ausgeschlossen — sie belohnen eloquentes Raten statt belegter Erfahrung.
  4. Interviewer mit Begründung zuordnen. Für jede Post-Screen-Stufe werden 1–3 Interviewer aus dem Pool vorgeschlagen. Kriterien: Kalibrierungsfit (harte Anforderung), Auslastung (kein Interviewer in mehr als einer Stufe desselben Loops) und Perspektivenvielfalt (mindestens ein Interviewer außerhalb des einstellenden Teams, sofern der Pool es erlaubt). Jede Zuweisung enthält eine explizite Begründungszeichenkette.
  5. Kandidatenerfahrungs-Durchlauf. Den zusammengesetzten Loop erneut lesen. Mehr als fünf Stunden aktive Interviewzeit für IC oder sieben für Leadership → markieren und Take-Home vorschlagen. Mehr als sechs unterschiedliche Interviewer → Loop-Fatigue markieren. Zwei Stufen prüfen dieselbe Kompetenz → redundantes Signal markieren. Stufenübergreifende Zeitzonen ohne Anpassung → TODO ausgeben.
  6. Hiring-Manager-Review-Gate. loop.md und scorecards/<NN>-<stage-id>.md schreiben. Stop. Der Skill definiert keine „Publish to ATS”-Aktion. Der HM öffnet die Datei, bearbeitet sie und konfiguriert den Loop selbst in Ashby oder Greenhouse.

Das genaue Ausgabeformat und das Scorecard-Gerüst-Layout befinden sich in references/3-loop-output-format.md im Bundle. Das Format ist fest, da nachgelagerte Konsumenten — der Interviewer, der die Scorecard liest, der Debrief-Moderator, der Scores zusammenstellt — eine vorhersehbare Struktur benötigen.

Kostenrealität

Pro Loop-Design auf Claude Sonnet 4.5:

  • LLM-Tokens — typischerweise 30–60k Input-Tokens (JD plus Kompetenz-Bibliothek plus Interviewer-Matrix plus Skill-Anweisungen) und 10–20k Output-Tokens (Loop plus 3–5 Scorecard-Gerüste mit Ankern und Fragen). Auf Sonnet 4.5 sind das ca. 0,20–0,40 USD pro Loop-Design. Eine Funktion, die acht Rollen pro Quartal besetzt, gibt unter 5 USD an Modellkosten für diesen Skill aus.
  • Recruiter- und Hiring-Manager-Zeit — hier liegt der eigentliche Gewinn. Ein manuelles Loop-Design von Grund auf mit kalibrierten Rubrik-Auszügen dauert 90–120 Minuten HM- plus Recruiter-Zeit im Design-Call und weitere 30–60 Minuten für die Dokumentation von Fragen und Zuteilungen. Der Skill komprimiert das auf einen 30-minütigen Review-Durchlauf des generierten Loops. Pro Rolle werden ca. 90 Minuten Senior-IC- oder Manager-Zeit eingespart.
  • Setup-Zeit — 30 Minuten pro Rolle, sobald Kompetenz-Bibliothek und Interviewer-Matrix ausgefüllt sind. Die Bibliothek und Matrix sind die Voraussetzung — vollständig neu erfordern sie eine Kalibrierungssitzung pro Kompetenz-Band, was eine Investition in strukturiertes Interviewing ist und nicht zum Setup dieses Skills gehört.
  • Compounding Benefit — strukturierte Loops produzieren gemäß jeder publizierten Studie der letzten zwanzig Jahre bessere Quality of Hire als Ad-hoc-Loops. Der Gewinn des Skills liegt darin, „strukturiert” zur Standardvorgabe zu machen statt zur Ausnahme, indem der Design-Overhead pro Rolle entfällt.

Erfolgsmetrik

Drei Kennzahlen pro Rolle pro Quartal im ATS verfolgen:

  • Loop-Design-Durchlaufzeit — Stunden von „Rolle genehmigt” bis „Loop im ATS konfiguriert”. Sollte nach Einführung des Skills deutlich sinken. Sinkt sie nicht, liegt der Engpass beim HM-Review, nicht beim Design — den Loop früher in die Rolle-Kickoff-Sequenz einbringen.
  • Inter-Rater-Übereinstimmung auf der Rubrik — pro Kompetenzdimension: wie oft liegen unabhängige Scores der Interviewer innerhalb eines Punktes. Sollte bei 80 % oder höher auf kalibrierten Kompetenzen liegen. Darunter sind die Anker-Beschreibungen in der Kompetenz-Bibliothek das Stellrad — nicht der Skill.
  • Quality of Hire nach 12 Monaten — die langfristige Metrik, die der Loop bewegen soll. Kohorten, die durch Skill-designed Loops eingestellt wurden, mit Ad-hoc-Loops auf derselben Rollenfamilie vergleichen. Übertrifft die Skill-designed-Kohorte die andere nicht, das Kompetenz-zu-Stufen-Mapping re-evaluieren — nicht die Struktur aufgeben.

vs. Alternativen

  • vs. Ashby’s Structured Interviewing Templates — Ashby besitzt den konfigurierten Loop, das Scorecard-Rendering und den Debrief in einem Produkt. Ashbys Templates wählen, wenn ein verwaltetes UX gewünscht wird und das Team im ATS lebt. Diesen Skill wählen, wenn Rubrik-Anker, Interviewer-Stärken-Matrix und Kompetenz-zu-Stufen-Mapping im eigenen Repository, versionskontrolliert, mit austauschbarem Design-Schritt gewünscht werden, während die Kompetenz-Bibliothek sich weiterentwickelt. Die Ausgabe des Skills ist der Input zur Ashby-Loop-Konfiguration — kein Ersatz dafür.
  • vs. generische Template-Loops — Jedes ATS liefert Standard-Vier-Stufen-Templates (Telefonscreen, HM-Screen, Technical, On-Site-Panel). Sie wirken auf den ersten Blick strukturiert, sind es aber nicht. Dasselbe Template wird auf einen Backend-IC4 und einen CS Manager M2 angewendet, mit denselben generischen Fragen, unabhängig davon, welche Kompetenzen die Einstellung auf der jeweiligen Rolle tatsächlich differenzieren. Der Skill verdient seinen 30-minütigen Setup-Aufwand ab der zweiten Rolle, da das Design rollenspezifisch kalibriert ist statt einheitlich.
  • vs. DIY-Loop-Design durch den Hiring Manager — Ein erfahrener HM kann in 90–120 Minuten einen guten Loop von Grund auf entwerfen. In der Praxis tut er das oft nicht, weil er unter Zeitdruck den letzten Loop wiederverwendet, den er geführt hat — unabhängig davon, ob er passt. Der Gewinn des Skills ist nicht „entwirft besser als ein erfahrener HM auf Hochleistung”; er ist „entwirft konsistent so gut wie ein erfahrener HM, für alle Rollen und alle Wochen”. Die Konsistenz ist der compounding Benefit.
  • vs. kein strukturierter Loop — Die publizierten Meta-Analysen zu strukturiertem Interviewing beziffern die Prognosevalidität strukturierter Interviews bei ca. doppelter Wirksamkeit gegenüber unstrukturierten für Jobleistung. Wenn der Status quo unstrukturiert ist, ist der Skill nicht die Frage — Struktur einzuführen ist es. Der Skill ist der Weg, Struktur günstig genug zu machen, um sie tatsächlich bei jeder Rolle einzusetzen.

Watch-outs

  • Interviewer-Überlastung durch dieselbe Person, die überall eingesetzt wird. Guard: Der Zuweisungsschritt im Skill erzwingt „kein Interviewer in mehr als einer Stufe desselben Loops” als harte Regel. Die Zuweisungstabelle enthält pro Stufe einen Backup-Interviewer, damit der Recruiter einen Fallback hat, wenn der Primäre nicht verfügbar ist, anstatt den Primären in zwei Stufen einzusetzen.
  • Redundantes Signal über Stufen hinweg. Guard: Der Kandidatenerfahrungs-Durchlauf liest den zusammengesetzten Loop erneut und markiert jede Kompetenz, die in mehr als einer Stufe geprüft wird. Die Kompetenz-zu-Stufen-Zuordnungstabelle am Anfang der Loop-Ausgabe macht Redundanz für den Hiring Manager beim Review sichtbar.
  • Kandidatenerfahrung vernachlässigt. Guard: Der Kandidatenerfahrungs-Durchlauf ist ein separater, benannter Schritt im Skill — kein Satz am Ende des Loops. Er erzwingt Gesamtzeit-Caps (5 Stunden IC, 7 Stunden Leadership), Caps für unterschiedliche Interviewer (6), Take-Home-Empfehlungen für Kompetenzen, die den Loop aufblähen, und Zeitzonen-Anpassungs-TODOs. Ohne diesen Durchlauf akkumuliert sich „noch ein 30-minütiges Gespräch” unmerklich.
  • Kalibrierungsdrift innerhalb eines einzigen Loops. Guard: Der pro Stufe ausgegebene Rubrik-Block enthält Anker-Beschreibungen pro Score-Level aus der Kompetenz-Bibliothek — kein Freitext-„Rate von 1 bis 5”. Anker sind das Element, das Kalibrierung hält, wenn derselbe Kandidat von vier verschiedenen Interviewern im selben Loop bewertet wird. Vage Rubrik → vage Scores → Debrief, der jede Dimension anhand von Anekdoten neu verhandelt.
  • Hiring Manager genehmigt das Design ohne Lektüre. Guard: Der Skill hält am Review-Gate inne und schreibt in Dateien. Es gibt keine „Publish to ATS”-Aktion. Der HM muss die Datei öffnen und bearbeiten, bevor er den Loop konfiguriert — diese Reibung ist beabsichtigt. Fangen HMs an, abzusegnen, ohne zu lesen, driftet der Loop-Inhalt von den Rollenprioritäten ab und der Skill verdient seine eingesparte Zeit nicht mehr.
  • Veraltete Interviewer-Kalibrierung. Guard: Die Interviewer-Matrix hat eine Spalte „Letztes Interview”. Einträge, die älter als sechs Monate sind, lösen eine Re-Kalibrierung aus, bevor der Interviewer erneut zugewiesen wird. Wenn Interview Intelligence Fragen aufdeckt, die kein nützliches Signal produzieren, die Anker der Kompetenz-Bibliothek aktualisieren — der Skill gibt die neuen Anker beim nächsten Lauf aus.

Stack

Das Skill-Bundle liegt unter apps/web/public/artifacts/interview-loop-builder-skill/ und enthält:

  • SKILL.md — die Skill-Definition mit Frontmatter, Invoke-Regeln, Inputs, Methode und Watch-outs mit Guards
  • references/1-competency-library.md — die Kompetenz-Taxonomie mit Anker-Beschreibungen pro Score-Level und Level-Band; vor der ersten Ausführung pro Funktion ausfüllen
  • references/2-interviewer-strengths.md — die Matrix des verfügbaren Interviewer-Pools mit kalibrierter Abdeckung pro Kompetenz; vor der ersten Ausführung pro Team ausfüllen
  • references/3-loop-output-format.md — das genaue Markdown-Format, das der Skill ausgibt, einschließlich Scorecard-Gerüst-Layout

Werkzeuge, die der Workflow voraussetzt: Claude (das Modell), Ashby oder Greenhouse (das ATS, in dem der HM den entworfenen Loop konfiguriert), BrightHire oder Metaview (Interview Intelligence, deren Signal in die Anker-Anpassung der Kompetenz-Bibliothek zurückfließt). Direkt verknüpft mit dem JD Writer vorgelagert und der Interview-Debrief-Zusammenfassung nachgelagert.

Files in this artifact

Download all (.zip)