ooligo
agent-template

Einen KI-Agenten zur Ticket-Deflection im Support deployen

Difficulty
Profi
Setup time
1-2 weeks
For
support-lead · cs-ops
Customer Success

Stack

Die meisten „AI-Support”-Rollouts scheitern auf dieselbe Weise: Ein Bot beantwortet alles, selbstbewusst, einschließlich der 8 % der Tickets, bei denen ein Fehler eine Rückerstattung, einen Churn oder einen Compliance-Vorfall kostet. Dieses Agent Template kehrt das um. Es ist ein KI-Agent von Decagon —an Zendesk angebunden— der darauf zugeschnitten ist, einen eng definierten Ausschnitt von Tier-1-Tickets vollständig zu lösen, und so konstruiert ist, dass er sauber eskaliert, sobald ein Ticket diesen Ausschnitt verlässt. Das Lieferobjekt ist nicht „ein Agent, der es versucht”; es ist ein Agent mit einer expliziten Allowlist lösbarer Intents, einem Confidence-Gate, einer Tool-Call-Grenze und einem Handoff-Payload, der einen Menschen im Kontext absetzt, statt kalt zu starten. Die Deflection-Rate ist die Eitelkeitsmetrik; die Metrik, die dieses Template optimiert, ist gelöst-ohne-Wiedereröffnung bei den Allowlist-Intents, während Eskalationen besser vorbereitet ankommen, als ein von einem Menschen geroutetes Ticket es gewesen wäre.

Das Bundle des Artifacts wird hier in Prosa beschrieben und in vier Teilen geliefert: agent-instructions.md (der System Prompt und die Persona), intent-allowlist.yaml (die lösbaren Intents mit Guardrails pro Intent), escalation-schema.json (der Vertrag des Handoff-Payloads) und _README.md (die Decagon- + Zendesk-Verdrahtung und die Acceptance-Suite mit 12 Fällen). Lesen Sie alle vier, bevor Sie den Agenten auf Live-Traffic richten.

Wann Sie es verwenden

Verwenden Sie dies, wenn Sie eine Support-Organisation mit einer Zendesk-Instanz und einem nennenswerten, repetitiven Tier-1-Volumen betreiben —Bestellstatus, Passwort- und Login-Reset, Fragen zu Plan und Abrechnungszyklus, „wo ist meine Rechnung”, grundlegendes How-to und Bestätigungen bekannter Probleme. Das Pattern rechnet sich oberhalb von rund 2.000 Tickets/Monat, wo der Allowlist-Ausschnitt groß genug ist, dass selbst 30-50 % Containment darauf einen messbaren Anteil an Agentenstunden freisetzt. Sie brauchen außerdem eine echte Knowledge Base: Die Lösungsqualität von Decagon ist eine direkte Funktion der Help-Center-Artikel und Makros, auf die es Antworten gründen kann. Müll-KB, Müll-Agent.

Es passt am besten, wenn Ihr Tier-1-Mix wirklich deflectable ist —informationelle und transaktionale Intents mit deterministisch korrekten Antworten— und wenn Sie einen Support-Lead haben, der die Allowlist besitzt und die Eskalations-Transkripte wöchentlich durchsieht. Dies ist ein betriebenes System, kein Einrichten-und-Vergessen-Schalter.

Wann Sie es NICHT verwenden

Deployen Sie dies nicht bei Intents, bei denen eine falsche Antwort teuer und nicht reversibel ist: Kündigungen, Rückerstattungen oberhalb einer trivialen Schwelle, Sicherheits- und Account-Takeover-Meldungen, Datenlöschungs-Anfragen (GDPR/CCPA), alles, was Zahlungen über das Lesen des Rechnungsstatus hinaus berührt, und alles Juristische oder Vertragliche. Diese gehören vom ersten Tag an auf den Eskalationspfad —sie kommen nicht in die Allowlist, Punkt. Das Template liefert sie in intent-allowlist.yaml vorab ausgeschlossen, und Sie sollten dem Druck widerstehen, sie hinzuzufügen, nur weil Containment auf einem Dashboard gut aussieht.

Deployen Sie es nicht, wenn Ihr Help Center dünn oder veraltet ist. Ein Agent, der auf 40 veralteten Artikeln gründet, zitiert selbstbewusst die alte Rückerstattungsrichtlinie. Reparieren Sie zuerst das KB; der Agent verstärkt die Qualität, die darunter liegt.

Verwenden Sie es nicht als Deflection-Mauer, die das Erreichen eines Menschen erschwert. Der schnellste Weg, den CSAT zu zerstören, ist, einen frustrierten Kunden in einer Schleife zu fangen. Die Eskalationslogik dieses Templates ist bewusst eifrig —sie macht lieber den Handoff eines Grenzfall-Tickets, als einen Containment-Punkt zu gewinnen. Wenn Ihr Mandat lautet „Ticket-Volumen um jeden Preis senken”, ist dies das falsche Template; Sie wollen ein schlechteres, und Sie werden es bereuen.

Deployen Sie es nicht für unter ~500 Tickets/Monat. Die Kosten für Setup und wöchentliche Durchsicht übersteigen die eingesparten Stunden; ein paar gute Makros und Routing-Regeln schlagen einen Agenten in dieser Größenordnung.

Setup

Veranschlagen Sie ein bis zwei Wochen, der Großteil davon entfällt auf das Kuratieren der Allowlist und das Ausführen der Acceptance-Suite —die Decagon- und Zendesk-Verdrahtung selbst ist ein Nachmittag.

  1. Verbinden Sie Decagon mit Zendesk. Fügen Sie in Decagon den Zendesk-Kanal hinzu und autorisieren Sie gegen einen dedizierten API-Benutzer (nicht den Seat einer Person), zugeschnitten auf das Lesen von Tickets und KB sowie das Schreiben öffentlicher Antworten, interner Notizen und Tags. Richten Sie die Wissensquelle von Decagon auf Ihr Zendesk Help Center und reindexieren Sie. Bestätigen Sie, dass der Agent ein Test-Ticket lesen und einen Antwort-Entwurf posten kann, bevor Sie weitergehen.
  2. Laden Sie die Intent-Allowlist. Importieren Sie intent-allowlist.yaml. Jeder Eintrag benennt einen Intent (z. B. order_status), die KB-Artikel, die ihn fundieren, die Tools, die er aufrufen darf (z. B. die Bestellung über den Bestellstatus-Webhook lesen), und ein Guardrail pro Intent (order_status darf Status und ETA nennen, aber niemals eine Rückerstattung oder einen Expedite versprechen). Alles, was nicht in der Allowlist steht, wird per Definition an einen Menschen geroutet —die Default-Aktion ist eskalieren, nicht versuchen.
  3. Stellen Sie das Confidence-Gate ein. In agent-instructions.md muss der Agent die Fundierung seines Retrievals vor dem Antworten selbst bewerten. Wenn er für seine Antwort keinen spezifischen KB-Artikel oder kein Tool-Ergebnis zitieren kann, muss er eskalieren, statt zu verallgemeinern. Stellen Sie das Gate so ein, dass es eskaliert, wenn die Fundierung fehlt; lassen Sie ihn nicht aus dem parametrischen Gedächtnis antworten.
  4. Verdrahten Sie den Eskalations-Payload. escalation-schema.json definiert die interne Notiz, die Decagon beim Handoff schreibt: erkannter Intent, was der Kunde in einer Zeile gefragt hat, was der Agent bereits versucht und ausgeschlossen hat, relevante KB-Links, Kundenstimmung und der Grund der Eskalation. Mappen Sie diese auf Zendesk-Felder und eine Triage-View, sodass der empfangende Mensch ein bereits triagiertes Ticket öffnet.
  5. Führen Sie die Acceptance-Suite mit 12 Fällen aus. _README.md liefert zwölf Canary-Tickets —sechs, die gelöst werden müssen (sauberer Bestellstatus, Passwort-Reset, Rechnungslink), und sechs, die eskalieren müssen (eine Rückerstattungsforderung, eine Sicherheitsmeldung, eine wütende Kündigung, eine mehrdeutige Multi-Intent-Nachricht, ein How-to außerhalb der Allowlist, ein Grenzfall in einer nicht-englischen Sprache). Der Agent besteht nur, wenn alle sechs sauber gelöst werden und alle sechs mit einem vollständigen Payload eskalieren. Aktivieren Sie die Auto-Antwort auf Live-Traffic nicht, bevor die Suite grün ist.
  6. Schatten, dann Live-Gang. Betreiben Sie den Agenten drei bis fünf Werktage im reinen Entwurfsmodus: Er verfasst Antworten und Eskalationsnotizen, aber ein Mensch genehmigt jeden Versand. Sehen Sie die Entwürfe durch, ziehen Sie die Allowlist und die Guardrails enger, und schalten Sie dann die Allowlist-Intents auf Auto-Resolution um, während alles andere menschlich bleibt.

Was der Agent tatsächlich tut

Pro eingehendem Ticket klassifiziert der Agent zuerst den Intent gegen die Allowlist. Ist der Intent nicht in der Allowlist, stoppt er sofort und eskaliert —kein Antwortversuch, keine Teilantwort. Ist er in der Allowlist, ruft er die Fundierung ab (KB-Artikel plus jedes Tool-Ergebnis, das der Intent erlaubt) und bewertet selbst, ob diese Fundierung die Frage tatsächlich beantwortet. Die Reihenfolge klassifizieren-zuerst, fundieren-danach ist wichtig: Nach dem Verfassen zu klassifizieren verleitet das Modell dazu, eine Antwort zu rechtfertigen, die es bereits geschrieben hat —genau so entstehen selbstbewusst-falsche Antworten.

Wenn fundiert, verfasst er eine durch das Intent-Guardrail eingeschränkte Antwort und postet sie. Wenn nicht fundiert —der Artikel deckt den Grenzfall nicht ab, das Tool gab einen Fehler zurück, die Nachricht des Kunden umfasst zwei Intents— eskaliert er mit dem vollständigen Payload aus escalation-schema.json, statt teilweise zu antworten. Multi-Intent-Nachrichten eskalieren immer; das Template weigert sich bewusst, ein Ticket aufzuteilen und es halb zu lösen, weil die Hälfte, die es löst, den Kunden darauf trainiert, der Hälfte zu misstrauen, die es weggeschoben hat.

Der Handoff ist der Teil, der intern Vertrauen gewinnt. Ein Mensch, der ein eskaliertes Ticket übernimmt, sieht den erkannten Intent, die Ein-Zeilen-Zusammenfassung, die Schritte, die der Agent bereits ausgeschlossen hat, das konsultierte KB und die Stimmungslesung. Das ist strikt mehr Kontext als ein kalt von einem Menschen geroutetes Ticket —das ist das Argument, das den Buy-in des Support-Leads gewinnt: Eskalationen sind keine Fehlschläge, sie sind vortriagierte Tickets.

Die Kostenrealität

Decagon berechnet nach Lösungsvolumen (custom, typischerweise ein Platform Fee plus eine Rate pro Lösung; holen Sie ein Angebot ein —öffentliche Stückpreise werden nicht veröffentlicht, behandeln Sie jede Zahl als Schätzung bis zum Angebot). Die ehrliche Rahmung für den Business Case: Modellieren Sie die Kosten pro containedem Ticket gegen Ihre fully-loaded Personalkosten pro Ticket, die die meisten Support-Organisationen je nach Region und Komplexität bei rund $5-15 ansetzen. Containment spart nur Geld, wenn das contained Ticket sonst einen Menschen verbraucht hätte; ein Ticket, das der Kunde ohnehin selbst gelöst hätte, ist keine Einsparung.

Die Setup-Kosten betragen ein bis zwei Wochen der Zeit eines Support-Leads, vorgelagert auf das Kuratieren der Allowlist und die KB-Bereinigung. Die laufenden Kosten betragen in den ersten zwei Monaten rund zwei bis vier Stunden pro Woche an Transkript-Durchsicht, abnehmend, während sich die Allowlist stabilisiert. Überspringen Sie die Durchsicht nicht: Ein ungeprüfter Agent driftet, während sich Ihr Produkt und Ihre Richtlinien unter ihm verändern.

Wie Erfolg aussieht

Beobachten Sie vier Zahlen. Erstens, die Rate gelöst-ohne-Wiedereröffnung bei den Allowlist-Intents —die echte Containment-Metrik, nicht die rohe Deflection. Zielen Sie bis Woche sechs auf über 85 % innerhalb des Allowlist-Ausschnitts; Wiedereröffnungen bedeuten, dass der Agent Dinge beantwortet, die er eskalieren sollte. Zweitens, der CSAT bei vom Agenten gelösten Tickets versus von Menschen gelösten —er sollte innerhalb weniger Punkte liegen, nicht niedriger; eine Lücke bedeutet, dass die Guardrails zu locker oder das KB zu dünn ist. Drittens, die Vollständigkeit des Eskalations-Payloads —beproben Sie eskalierte Tickets wöchentlich und bestätigen Sie, dass der empfangende Mensch den Kunden nicht erneut nach Kontext fragen musste, den der Agent bereits hatte. Viertens, die Falsch-Eskalations-Rate —Eskalationen, die ein Mensch in einem Touch nur mit Allowlist-Info gelöst hat, was bedeutet, dass der Agent es hätte bewältigen können; steigt diese, ist das Confidence-Gate zu konservativ, und Sie können spezifische Intents erweitern.

Versus die Alternativen

Versus der native Bot von Zendesk und Advanced AI (Agent-Copilot, Intelligent Triage). Die eingebaute KI von Zendesk ist die reibungsärmste Option, wenn Sie bereits dafür zahlen und Ihre Bedürfnisse Vorschlag-und-Triage statt vollständige autonome Lösung sind. Sie ist hervorragend im Routing und im Verfassen agentenseitiger Vorschläge. Der Grund, stattdessen zu Decagon zu greifen, ist die Tiefe der autonomen Lösung und das Guardrail-pro-Intent-Modell —die native Zendesk-KI verbessert sich schnell, aber die Allowlist-plus-Confidence-Gate-Disziplin, von der dieses Template abhängt, ist in einem eigens dafür gebauten Lösungsagenten besser kontrollierbar. Wenn Sie nur Triage und Antwortvorschläge brauchen, bleiben Sie nativ; wenn Sie auditierte autonome Lösung auf einem definierten Ausschnitt brauchen, verdient der dedizierte Agent die Integration.

Versus Forethought. Forethought ist der nächste direkte Wettbewerber für autonome Lösung auf einem Ticketing-Rückgrat, und die Wahl ist wirklich knapp. Forethought ist tendenziell der Pick, wenn Ihre Priorität seine Discovery-/Triage-Analytik ist und Sie ein eng gepacktes Zendesk-natives Packaging wollen; Decagon gewinnt tendenziell, wenn konversationelle Lösungsqualität und Kontrolle über das Agenten-Design die Priorität sind. Bewerten Sie beide gegen Ihre eigene Allowlist mit derselben 12-Fälle-Suite —der Differenzierer ist, welcher Ihre Intents sauber löst, nicht die Demo.

Versus ein DIY-Agent auf rohen LLM-APIs plus der Zendesk-API. Ein selbstgebauter Agent gibt Ihnen totale Kontrolle und die niedrigsten Grenzkosten pro Lösung, aber Sie bauen das nach, was Decagon liefert: Retrieval-Fundierung, Konversationszustand, Analytik, Guardrail-Enforcement und die Operations-Konsole, die ein Support-Lead ohne Engineering-Begleitung nutzt. Wählen Sie DIY nur, wenn Sie ein dauerhaftes Plattform-Team haben und die Lösung zentral genug ist, um sie zu besitzen; sonst lassen die Bau-und-Wartungskosten die Lizenz klein aussehen. Die Allowlist und das Eskalations-Schema des Templates sind portabel —wenn Sie später doch DIY gehen, behalten Sie das Design und tauschen die Engine.

Stack

  • Decagon —der autonome Lösungsagent: Intent-Klassifikation, Retrieval-Fundierung, Guardrail-Enforcement, Konversationszustand, Analytik
  • Zendesk —Ticketing-System of Record, Help Center als Wissensquelle, Ziel für öffentliche Antworten, interne Eskalationsnotizen und Tags
  • Forethought —der benannte alternative Lösungsagent für ein Bake-off gegen Ihre eigene Allowlist
  • Bestell-/Abrechnungs-Webhooks —schreibgeschützte Tool-Calls, die die Allowlist-Intents ausführen dürfen (Status- und Rechnungsabfragen, niemals Schreibvorgänge)