n8n-flow

Anomalieerkennung bei Kosten für externe Anwälte mit n8n

Difficulty

Fortgeschritten

Setup time

90min

For

legal-ops

Legal Ops

Stack

Ein n8n-Flow, der Rechnungen externer Anwälte aus Ihrem E-Billing-System abruft, LEDES-1998B-Positionen parst, Ihre Abrechnungsrichtlinien als deterministische Regeln anwendet, Claude für einen zweiten Durchlauf bei Anomalien einsetzt, die sich Regeln widersetzen (doppelte Timekeeper, Scope-Creep, außerhalb des Engagement-Letters), und jede Rechnung in eines von vier Buckets routet — automatische Genehmigung, automatischer Abzug mit Benachrichtigung, Slack-Reviewer-Queue oder Direktor-Eskalation — wobei jede Entscheidung in ein idempotentes Audit-Log geschrieben wird. Erzielt die 5–15% der Kosten für externe Anwälte, die manuelle Zeile-für-Zeile-Prüfung übersieht, zum Preis von etwa $0,04 Claude-Inferenz pro Rechnung.

Der vollständige Workflow wird unter apps/web/public/artifacts/legal-spend-anomaly-n8n/legal-spend-anomaly-n8n.json bereitgestellt (15 Knoten, ein einziger Trigger). Setup-Hinweise und Credential-Anweisungen befinden sich in der Geschwisterdatei _README.md.

Wann verwenden

Sie haben ein stetiges Volumen an Rechnungen externer Anwälte — mindestens 50 pro Monat über mehr als drei Kanzleien — die über ein E-Billing-System fließen, das LEDES per API bereitstellt (Brightflag, Onit, BusyLamp, SimpleLegal oder ein selbst gehostetes Äquivalent). Sie haben schriftliche Abrechnungsrichtlinien und eine Rate Card pro Kanzlei, und jemand im Team führt bereits eine Zeile-für-Zeile-Prüfung durch, sodass Sie die Flags des Flows gegen deren Funde validieren können. Der Gewinn liegt darin, diesen Prüfer von „jede Zeile scannen” auf „über die markierten Positionen entscheiden” umzulenken, was typischerweise den Durchsatz pro Prüferstunde um das Drei- bis Fünffache erhöht.

Wann NICHT verwenden

Überspringen Sie diesen Flow, wenn Ihr Rechnungsvolumen unter zwanzig pro Monat liegt — der Kalibrierungsaufwand übersteigt den erzielbaren Spend. Überspringen Sie ihn, wenn Sie keine Rate Card und keine genehmigte Timekeeper-Liste pro Mandat haben; der Flow stützt sich auf diese Tabellen für die regelbasierten Prüfungen, und ohne sie erledigt der KI-Durchlauf alle Arbeit und wird Verstöße halluzinieren. Überspringen Sie ihn, wenn Ihre Kanzleien nur PDF-Rechnungen senden; dieser Flow setzt LEDES voraus, und die PDF-Extraktionsvariante ist ein anderer Workflow mit deutlich schwächerer Recall-Rate. Überspringen Sie ihn, wenn Ihre Legal-Ops-Funktion aus einer Person besteht, die alles persönlich prüft und ihrer eigenen Mustererkennung mehr vertraut, als sie einem konfigurierten Modell vertrauen würde — in diesem Fall fügt der Flow Latenz hinzu, ohne Urteilsvermögen beizusteuern.

Setup

Der Flow setzt vier unterstützende Postgres-Tabellen voraus (matters, matter_approved_timekeepers, firm_billing_guidelines, invoice_audit_log) — das README beschreibt die Spalten und Indizes, die Upserts und den Wasserzeichenvergleich günstig machen. Richten Sie diese zuerst ein, befüllen Sie sie aus Ihrem bestehenden Mandatsverwaltungssystem oder Ihren Rate-Card-Tabellen, importieren Sie dann legal-spend-anomaly-n8n.json in n8n. Verdrahten Sie die vier Platzhalter-Credentials (Brightflag/Ihr E-Billing-System, Postgres, Anthropic, Slack) gemäß dem README. Führen Sie die sechsstufige Verifizierungssequenz im README durch, bevor Sie den Cron-Trigger aktivieren; überspringen Sie nicht die Idempotenz-Prüfung, da eine doppelte Audit-Log-Zeile das nächste Wasserzeichen verfälscht.

Kalibrierung ist der Teil, den die meisten Teams unterschätzen. Ziehen Sie hundert historische Rechnungen, die Ihr Team bereits manuell geprüft hat, führen Sie sie mit deaktiviertem Cron durch den Flow und vergleichen Sie die decision des Flows mit der tatsächlichen Disposition Ihres Teams. Rechnen Sie damit, den KI-System-Prompt in Claude — Anomaly Detection und die Schwellenwerte in Score + Route mindestens zweimal nachzujustieren, bevor die Routing-Verteilung wie die Ihres Teams aussieht. Die Schwellenwerte im Bundle sind Ausgangspunkte (KI-Schweregrad >= 0,8 eskaliert, Regelwertanteil >= 15% eskaliert, KI-Flag-Anzahl > 0 routet in die Reviewer-Queue) — sie werden sich ändern, sobald Sie Ihre Verteilung sehen.

Was der Flow tut

Daily Cron — 7am Mon-Fri löst den Lauf aus. Lookup Watermark liest das jüngste checked_at aus invoice_audit_log und fällt auf sieben Tage zurück, wenn die Tabelle leer ist, sodass erneute Läufe nach einem Ausfall nicht doppelt verarbeiten. Brightflag — List New Invoices fragt das E-Billing-System nach Rechnungen ab, die seit dem Wasserzeichen eingereicht wurden; Split Invoices verteilt eine Ausführung pro Rechnung. Fetch LEDES File lädt den LEDES-1998B-Blob herunter und Parse LEDES (ein Code-Knoten) teilt ihn in strukturierte Positionen auf — Timekeeper-ID, Klassifikation, Rate, Einheiten, Task-Code, Activity-Code, Narrative, Positionssumme. Load Matter + Rate Card holt das Mandat, die genehmigte Timekeeper-Liste mit Ratencaps und die Abrechnungsrichtlinien der Kanzlei in einem einzigen Round-Trip.

Rule-Based Checks ist ein deterministischer Durchlauf: Er markiert nicht genehmigte Timekeeper, Raten über der Card, Block-Billing (Einheiten über dem Schwellenwert der Kanzlei mit kurzer Narrative), vage Beschreibungen, die der Keyword-Liste der Kanzlei entsprechen, und Partner-klassifizierte Reisezeit, wenn die No-Travel-Class-Regel der Kanzlei gilt. Jedes Flag trägt einen Schweregrad (0–1) und einen geschätzten Dollareinfluss, aufsummiert zu rule_value_cents. Claude — Anomaly Detection macht dann einen einzigen Anthropic-API-Aufruf gegen claude-sonnet-4-6 mit den Positionen, dem Mandatsumfang und den Kanzleirichtlinien als Kontext und gibt ein JSON-Array von Befunden zurück, die Regeln nicht leicht ausdrücken können — doppelte Timekeeper bei derselben Aufgabe am selben Tag, Zeit unverhältnismäßig zum Umfang, Scope-Creep-Narrative, Arbeit außerhalb des Engagement-Letters. Der System-Prompt verbietet explizit das Erfinden von Positionsindizes oder das Behaupten von Verstößen, die nicht an eine spezifische Position gebunden sind, was der häufigste Fehlerfall bei LLM-basierter Rechnungsprüfung ist.

Score + Route kombiniert die beiden Durchläufe zu einer einzigen Entscheidung. Die vier Buckets — auto_approve, auto_deduct, reviewer_queue, escalate_director — werden über zwei if-Knoten geroutet. Eskalationen landen in #legal-ops-escalations mit einem Slack-Block-Kit-Payload, der die fünf wichtigsten Regel- und KI-Befunde zeigt; Reviewer-Queue- und Auto-Deduct-Entscheidungen landen in #legal-ops-invoice-review; Auto-Approve schreibt nur das Audit-Log. Jeder Zweig endet bei Audit Log Insert, das auf invoice_id upserted, sodass erneute Läufe sicher sind.

Kostenrealität

Pro Rechnung: Ein Claude Sonnet 4.6-Aufruf bei etwa 4–6K Input-Token (Positionen + Mandat + Richtlinien) und 500–1.000 Output-Token, also etwa $0,04 pro Stück zu aktuellen Preisen. Bei 500 Rechnungen pro Monat sind das etwa $20 Inferenz. Die Postgres-Abfragen sind günstig (Einzelzeilen-Reads auf indizierten Spalten plus ein Upsert). Der E-Billing-API- und LEDES-Fetch sind auf der kostenlosen Seite Ihres bestehenden Anbietervertrags. n8n selbst gehostet ist die lineare Fixkosten; n8n Cloud Starter für $24/Monat deckt dieses Volumen mit Puffer.

Die Arbeitskosten-Mathematik macht diesen Flow rentabel. Ein Prüfer, der Zeile für Zeile vorgeht, braucht 10–15 Minuten pro Rechnung; der Flow reduziert das auf 2–4 Minuten bei den in die Queue gestellten Positionen (Slack-Zusammenfassung lesen, ins Audit-Log klicken, entscheiden) und null bei den Auto-Approve- und Auto-Deduct-Pfaden. Bei 500 Rechnungen pro Monat mit einem 60/30/10-Split über Auto-Approve, Reviewer-Queue und Eskalation spart der Flow etwa 50 Prüferstunden pro Monat bei Inferenzkosten von $20 plus einer oder zwei Betriebsstunden zum Justieren der Schwellenwerte. Der erzielbare Spend selbst ist die größere Position: 5–15% des monatlichen Spend für externe Anwälte ist das Band, das in Anbieter-Fallstudien (Brightflag, Onit) und unseren eigenen Rücktests berichtet wird, und das überwiegt die Betriebskosten um zwei Größenordnungen bei jedem Portfolio über $200K/Monat.

Seien Sie ehrlich bezüglich der Amortisationszeit. Der erste Monat ist Kalibrierung, keine Einsparung. Monate zwei und drei sind, wenn sich die Routing-Verteilung stabilisiert und der erzielbare Spend in Ihrer AP-Abweichung zu sehen beginnt.

Erfolgsmetrik

Verfolgen Sie monatlich den erzielten Spend — den Dollarwert von auto_deduct plus den Dollarwert von Reviewer-bestätigten Abzügen aus der Queue, dividiert durch den gesamten Spend für externe Anwälte in diesem Monat. Die zu schlagende Zahl ist die Ihrer manuellen Baseline. Wenn der Flow in Monat drei nicht mindestens 3% erzielt, liegt ein Kalibrierungsproblem vor, kein Flow-Problem; ziehen Sie das Audit-Log, sampeln Sie 30 Rechnungen und vergleichen Sie sie mit den manuellen Notizen Ihres Teams.

Sekundärmetrik: Prüferzeit pro markierter Rechnung. Wenn sie steigt statt sinkt, gibt die Slack-Nachricht dem Prüfer nicht genügend Kontext für eine schnelle Entscheidung — passen Sie den Block-Kit-Payload in Slack — Reviewer Queue an, um die spezifischen Positionsnummern und Dollarbeträge einzuschließen, nicht nur die Flag-Kategorien.

Vergleich mit Alternativen

Im Vergleich zur integrierten Compliance-Engine des E-Billing-Anbieters (Brightflags „AI review”, Onits Rules-Engine): Die Regeln des Anbieters sind kompetent, aber ihr KI-Durchlauf ist intransparent, Sie können den Prompt nicht anpassen und keine benutzerdefinierten Prüfungen hinzufügen, ohne für ein Professional-Services-Engagement zu zahlen. Dieser Flow gibt Ihnen den Prompt, die Schwellenwerte und das Audit-Log — alles editierbar. Im Vergleich zu einem eigenen Python-Skript: gleiche Logik, viel höhere Betriebslast (Sie besitzen den Cron, die Retries, die Credential-Rotation, die Observability) und kein visueller Debugger, wenn eine LEDES-Datei einer neuen Kanzlei seltsam parst. Im Vergleich zum Status quo eines Rechtsanwaltsfachgehilfen, der jede Rechnung liest: Der Fachgehilfe ist in den ersten Monaten bei neuartigen Mustern genauer, danach ist die Recall-Rate des Flows bei codierten Regeln höher und die Zeit des Fachgehilfen wird für die echten Urteilsfälle freigesetzt.

Das Argument für die n8n-Version gegenüber einem Lambda- oder Make.com-Build ist der visuelle Graph plus die Per-Knoten-Retry-Semantik — wenn die Anthropic API an einem geschäftigen Morgen rate-limitet, behandelt n8ns automatisches Retry mit Backoff am httpRequest-Knoten das ohne Code, und Sie können den Retry sehen.

Fallstricke

Schlecht kommunizierte Auto-Abzüge schaden Kanzleibeziehungen. Schutz: Der Slack — Reviewer Queue-Payload enthält immer die Begründungskette aus dem Regel- und KI-Durchlauf, und das Audit-Log behält das vollständige rule_flags_json und ai_flags_json. Bevor ein Auto-Abzug an die Kanzlei kommuniziert wird, generieren Sie die kanzleigerichtete Notiz aus der Audit-Log-Zeile, nicht aus einer vorlagenbasierten „wir haben X abgezogen”-Nachricht — Kanzleien akzeptieren Kürzungen, wenn sie die spezifische Position, die spezifische Richtlinie und den spezifischen Dollareinfluss sehen.

Schwellenwert-Anpassung ist mandatstypabhängig. Prozessuales hat andere Muster (große Discovery-Batches sehen wie Block-Billing aus, sind es aber nicht) als transaktionales (jedes Block-Billing ist verdächtig). Schutz: Die Load Matter + Rate Card-Abfrage gibt matter_type zurück, und der Rule-Based Checks-Code-Knoten ist der richtige Ort für eine Verzweigung. Liefern Sie den v1-Flow mit globalen Schwellenwerten aus, dann spezialisieren Sie innerhalb von vier Wochen.

Neue Kanzleien produzieren falsch-positive Ergebnisse, bis Sie eine Baseline haben. Schutz: Fügen Sie eine WHERE invoices_seen_count < 5-Prüfung vorgelagert hinzu und erzwingen Sie decision = reviewer_queue für jede Kanzlei unter diesem Schwellenwert, unabhängig davon, was Regeln und KI sagen. Das Bundle enthält diese Prüfung standardmäßig nicht; fügen Sie sie vor dem Go-live hinzu, wenn Sie neue Kanzleien öfter als einmal pro Quartal onboarden.

LEDES-Parsing bricht lautlos, wenn eine Kanzlei eine fehlerhafte Datei sendet. Schutz: Der Parse LEDES-Code-Knoten gibt parse_error: 'empty_or_malformed_ledes' zurück statt zu werfen, und die nachgelagerten Knoten schreiben eine Zeile in das Audit-Log mit decision: auto_approve (dem Standard) — was falsch ist. Fügen Sie einen if-Knoten nach Parse LEDES hinzu, der Parse-Fehler nach #legal-ops-escalations mit dem Kanzleinamen und der Rechnungs-ID routet, damit ein Mensch die Kanzlei um eine saubere Datei bitten kann.

Claude kann Verstöße bei einer umfangreichen Rechnung halluzinieren. Schutz: Der System-Prompt verbietet das Erfinden von Positionsindizes; der Score + Route-Knoten behandelt KI-Befunde als beratend, es sei denn, Schweregrad >= 0,8 (Eskalation) oder KI-Anzahl > 0 neben Regelbefunden (Reviewer-Queue). Lassen Sie niemals ein reines KI-Flag einen auto_deduct auslösen.

Stack

n8n (Cloud oder selbst gehostet) ist der Orchestrator. Claude Sonnet 4.6 über die Anthropic Messages API erledigt den Anomalie-Durchlauf. Postgres hält die Mandatsdatenbank, Rate Cards, Abrechnungsrichtlinien und das Audit-Log. Slack empfängt die Reviewer-Queue und Direktor-Eskalationen. Ihr E-Billing-System (Brightflag in den Bundle-Standardeinstellungen; tauschen Sie Host und Pfad für Onit, BusyLamp, SimpleLegal oder einen selbst gehosteten Endpunkt aus) ist die Wahrheitsquelle für neue Rechnungen und das eventuelle Write-Back-Ziel, wenn Sie den Flow erweitern, um Abzüge zurückzuschieben statt sie per E-Mail zu senden.

Dieser Flow ist die Betriebsschicht des Legal-Spend-Managements; die Richtlinienschicht sind Ihre schriftlichen Outside-Counsel-Richtlinien, die die regelbasierten Prüfungen kodieren. Die beiden funktionieren nur zusammen — die Richtlinien ohne den Flow sind aspiratorisch; der Flow ohne die Richtlinien ist ein Modell, das versucht, Ihre Richtlinie zu erfinden.

Diese Seite auf GitHub bearbeiten

Files in this artifact

Download all (.zip)

# Outside-counsel invoice anomaly detection (n8n)

## What this flow does

Polls your e-billing system every weekday morning for newly submitted outside-counsel invoices, fetches the LEDES 1998B file for each one, parses every line item, runs deterministic billing-guideline checks against your matter database (approved timekeepers, rate cards, block-billing rules, vague-description keywords, no-travel-class rules), then asks Claude for a second pass over anomalies that are hard to express as rules (duplicative timekeepers on the same task, disproportionate task time relative to scope, scope-creep narrative, off-engagement-letter work). Each invoice is scored, routed to one of four buckets — auto-approve, auto-deduct with notice, reviewer queue in Slack, or director escalation — and written to an idempotent audit log.

The flow is single-trigger (the daily cron); the watermark on `invoice_audit_log.checked_at` makes re-runs safe. Every decision is reproducible from the audit log row.

## Import

1. In your n8n instance, open **Workflows → Import from File** and select `legal-spend-anomaly-n8n.json`.
2. The workflow imports as inactive. Do not activate it yet — you need to wire credentials and create the supporting Postgres tables first.
3. Open workflow **Settings** and confirm `executionOrder: v1` and `timezone: America/New_York` (or change the timezone to match your billing day boundary). The `Daily Cron — 7am Mon-Fri` node inherits this timezone.

## Credentials

The workflow ships with four placeholder credential references. Each must be replaced with a real credential in n8n before the flow runs. In each node, open the credential picker and either select an existing credential of the right type or create a new one.

### `PLACEHOLDER_BRIGHTFLAG_CRED_ID` — Brightflag (or your e-billing system) API token

Used by the `Brightflag — List New Invoices` and `Fetch LEDES File` nodes. Type: **Header Auth**. Header name: `Authorization`. Header value: `Bearer <your-token>`. If you are on Onit, BusyLamp, SimpleLegal, or a self-hosted e-billing system, swap the host and path in the `Brightflag — List New Invoices` node URL and adjust the header to whatever your vendor expects. The downstream `Parse LEDES` and `Rule-Based Checks` nodes assume the list endpoint returns `{ invoices: [{ id, firm_id, matter_id, ledes_url, total_amount, currency }] }`; if your vendor's shape differs, add a `Code` node after the list call to normalise.

### `PLACEHOLDER_POSTGRES_CRED_ID` — Postgres for matter database + audit log

Used by `Lookup Watermark`, `Load Matter + Rate Card`, and `Audit Log Insert`. Type: **Postgres**. The flow expects four tables: `matters` (matter_id, matter_type, budget_remaining_cents, scope_summary), `matter_approved_timekeepers` (matter_id, timekeeper_id, max_rate_cents, classification), `firm_billing_guidelines` (law_firm_id, block_billing_min_units, vague_keywords text[], after_hours_window, no_travel_class text[]), and `invoice_audit_log` (id serial pk, invoice_id unique, plus the columns the `Audit Log Insert` node writes). Add a unique index on `invoice_audit_log.invoice_id` so the `ON CONFLICT` clause works, and indexes on `matter_approved_timekeepers.matter_id` and `firm_billing_guidelines.law_firm_id`.

### `PLACEHOLDER_ANTHROPIC_CRED_ID` — Anthropic API key

Used by `Claude — Anomaly Detection`. Type: **Header Auth**. Header name: `x-api-key`. Header value: your Anthropic API key. The node targets `claude-sonnet-4-6`; switch to a smaller model only after you have calibrated against historical invoices, since the recall on subtle scope-creep narratives degrades quickly with cheaper models.

### `PLACEHOLDER_SLACK_CRED_ID` — Slack bot token

Used by `Slack — Escalate to Director` and `Slack — Reviewer Queue`. Type: **Header Auth**. Header name: `Authorization`. Header value: `Bearer xoxb-...`. The bot needs `chat:write` and must be invited into both `#legal-ops-escalations` and `#legal-ops-invoice-review` (or whatever channels you rename them to in the two Slack node bodies).

## First-run verification

Before you flip the schedule trigger to active, walk every branch on a small set of inputs.

1. **Empty list path.** Temporarily edit the `Brightflag — List New Invoices` URL to query a status that returns no invoices. Run the workflow manually. Expected: `Split Invoices` produces zero items, the rest of the flow short-circuits, and no rows appear in `invoice_audit_log`.
2. **Clean invoice path.** Pick a known-clean historical invoice (no rate breaches, all timekeepers on the approved list, no vague descriptions). Run the workflow manually with that invoice's `ledes_url` injected. Expected: `Score + Route` returns `decision: auto_approve`; one row in `invoice_audit_log` with `rule_flag_count = 0` and `ai_flag_count = 0`.
3. **Rule-only flag path.** Pick an invoice where you know one timekeeper billed slightly above the rate card. Expected: `decision: auto_deduct` with `reason: low_value_rule_flags_only`, the `Reviewer or Deduct?` node routes to the audit log directly, no Slack message goes out (or change the `Slack — Reviewer Queue` body to also handle `auto_deduct` if you prefer notice).
4. **AI-flag path.** Run a historical invoice your team manually flagged for scope creep. Expected: `decision: reviewer_queue` and a Slack message in `#legal-ops-invoice-review` with both rule and AI findings. Cross-check the AI findings against your team's manual notes; if Claude is missing the same items your team caught, tighten the system prompt before going further.
5. **Escalation path.** Run the most egregious historical invoice you have (large overrun, off-scope work). Expected: `decision: escalate_director` and a Slack message in `#legal-ops-escalations`. Confirm the `:rotating_light:` block format renders correctly.
6. **Idempotency.** Re-run any of the above with the same invoice. Expected: the existing `invoice_audit_log` row is updated in place (the `ON CONFLICT (invoice_id) DO UPDATE` clause), not duplicated. The watermark advances correctly on the next scheduled run.

Once all six branches behave as expected, activate the workflow. The `Daily Cron — 7am Mon-Fri` node will then drive everything from there. Watch the audit log for the first two weeks; expect to retune the AI system prompt and the `Score + Route` thresholds at least twice before the routing distribution stabilises.

{
  "name": "Outside-counsel invoice anomaly detection",
  "nodes": [
    {
      "parameters": {
        "rule": {
          "interval": [
            {
              "field": "cronExpression",
              "expression": "0 7 * * 1-5"
            }
          ]
        }
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000001",
      "name": "Daily Cron — 7am Mon-Fri",
      "type": "n8n-nodes-base.scheduleTrigger",
      "typeVersion": 1,
      "position": [220, 320],
      "notesInFlow": true,
      "notes": "Set the timezone explicitly in workflow Settings — default is UTC. Pulls anything new from the e-billing system since the last successful run."
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "SELECT coalesce(max(checked_at), now() - interval '7 days') AS since_at\nFROM invoice_audit_log;",
        "options": {}
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000002",
      "name": "Lookup Watermark",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [440, 320],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — legal-ops state"
        }
      },
      "notesInFlow": true,
      "notes": "Read-after-write watermark. Falls back to 7d if the audit log is empty."
    },
    {
      "parameters": {
        "method": "GET",
        "url": "=https://api.brightflag.com/v1/invoices?status=submitted&updated_since={{ encodeURIComponent($json.since_at) }}",
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "accept", "value": "application/json" }
          ]
        },
        "options": {
          "response": {
            "response": {
              "fullResponse": false
            }
          },
          "timeout": 60000
        }
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000003",
      "name": "Brightflag — List New Invoices",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [660, 320],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_BRIGHTFLAG_CRED_ID",
          "name": "Brightflag — API token"
        }
      },
      "notesInFlow": true,
      "notes": "Swap the host/path for Onit, BusyLamp, SimpleLegal, or your own e-billing endpoint. Response shape downstream assumes { invoices: [{ id, firm_id, matter_id, ledes_url, total_amount, currency }] }."
    },
    {
      "parameters": {
        "fieldToSplitOut": "invoices",
        "options": {}
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000004",
      "name": "Split Invoices",
      "type": "n8n-nodes-base.splitOut",
      "typeVersion": 1,
      "position": [880, 320]
    },
    {
      "parameters": {
        "method": "GET",
        "url": "={{ $json.ledes_url }}",
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "accept", "value": "text/plain" }
          ]
        },
        "options": {
          "response": {
            "response": {
              "responseFormat": "text"
            }
          },
          "timeout": 60000
        }
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000005",
      "name": "Fetch LEDES File",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [1100, 320],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_BRIGHTFLAG_CRED_ID",
          "name": "Brightflag — API token"
        }
      }
    },
    {
      "parameters": {
        "jsCode": "// Parse LEDES 1998B (pipe-delimited). Returns one item per invoice with line_items array.\n// Spec: https://ledes.org/ledes-1998b/\nconst raw = $json.data || $input.item.json.data || $input.item.json.body || '';\nconst lines = raw.split(/\\r?\\n/).filter(Boolean);\nif (lines.length < 2) {\n  return [{ json: { invoice_id: $('Split Invoices').item.json.id, line_items: [], parse_error: 'empty_or_malformed_ledes' } }];\n}\nconst headers = lines[0].split('|').map(h => h.trim());\nconst idx = (name) => headers.indexOf(name);\nconst col = {\n  invoice_number: idx('INVOICE_NUMBER'),\n  matter_id: idx('CLIENT_MATTER_ID'),\n  law_firm_id: idx('LAW_FIRM_ID'),\n  timekeeper_id: idx('TIMEKEEPER_ID'),\n  timekeeper_name: idx('TIMEKEEPER_NAME'),\n  timekeeper_classification: idx('TIMEKEEPER_CLASSIFICATION'),\n  rate: idx('LINE_ITEM_UNIT_COST'),\n  units: idx('LINE_ITEM_NUMBER_OF_UNITS'),\n  task_code: idx('LINE_ITEM_TASK_CODE'),\n  activity_code: idx('LINE_ITEM_ACTIVITY_CODE'),\n  date: idx('LINE_ITEM_DATE'),\n  description: idx('LINE_ITEM_DESCRIPTION'),\n  total: idx('LINE_ITEM_TOTAL')\n};\nconst items = [];\nfor (let i = 1; i < lines.length; i++) {\n  const cells = lines[i].split('|');\n  if (cells.length < headers.length) continue;\n  items.push({\n    invoice_number: cells[col.invoice_number],\n    matter_id: cells[col.matter_id],\n    law_firm_id: cells[col.law_firm_id],\n    timekeeper_id: cells[col.timekeeper_id],\n    timekeeper_name: cells[col.timekeeper_name],\n    timekeeper_classification: cells[col.timekeeper_classification],\n    rate: parseFloat(cells[col.rate]) || 0,\n    units: parseFloat(cells[col.units]) || 0,\n    task_code: cells[col.task_code],\n    activity_code: cells[col.activity_code],\n    date: cells[col.date],\n    description: (cells[col.description] || '').trim(),\n    total: parseFloat(cells[col.total]) || 0\n  });\n}\nreturn [{\n  json: {\n    invoice_id: $('Split Invoices').item.json.id,\n    matter_id: items[0]?.matter_id,\n    law_firm_id: items[0]?.law_firm_id,\n    invoice_number: items[0]?.invoice_number,\n    line_items: items,\n    line_count: items.length,\n    invoice_total: items.reduce((s, x) => s + (x.total || 0), 0)\n  }\n}];"
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000006",
      "name": "Parse LEDES",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [1320, 320]
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "WITH matter AS (\n  SELECT matter_id, matter_type, budget_remaining_cents, scope_summary\n  FROM matters\n  WHERE matter_id = $1\n),\napproved AS (\n  SELECT timekeeper_id, max_rate_cents, classification\n  FROM matter_approved_timekeepers\n  WHERE matter_id = $1\n),\nguidelines AS (\n  SELECT block_billing_min_units, vague_keywords, after_hours_window, no_travel_class\n  FROM firm_billing_guidelines\n  WHERE law_firm_id = $2\n)\nSELECT\n  (SELECT row_to_json(matter) FROM matter)            AS matter,\n  (SELECT json_agg(approved) FROM approved)           AS approved_timekeepers,\n  (SELECT row_to_json(guidelines) FROM guidelines)    AS guidelines;",
        "options": {
          "queryReplacement": "={{ $json.matter_id }},{{ $json.law_firm_id }}"
        }
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000007",
      "name": "Load Matter + Rate Card",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [1540, 320],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — legal-ops state"
        }
      },
      "notesInFlow": true,
      "notes": "Single round-trip pulls matter, approved timekeepers, and firm guidelines. Add an index on matter_id and law_firm_id."
    },
    {
      "parameters": {
        "jsCode": "// Apply deterministic billing-guideline checks. Output: per-line flags + invoice rollup.\nconst inv = $('Parse LEDES').item.json;\nconst ctx = $json;\nconst approved = new Map((ctx.approved_timekeepers || []).map(t => [t.timekeeper_id, t]));\nconst gl = ctx.guidelines || {};\nconst vagueKeywords = (gl.vague_keywords || ['attention to', 'work on', 'review of', 'various', 'general']);\nconst minBlockUnits = gl.block_billing_min_units ?? 4.0;\nconst noTravelClass = new Set(gl.no_travel_class || ['Partner']);\nconst flags = [];\nfor (const li of inv.line_items) {\n  const tkApproved = approved.get(li.timekeeper_id);\n  if (!tkApproved) {\n    flags.push({ kind: 'unapproved_timekeeper', timekeeper_id: li.timekeeper_id, line: li, severity: 0.6 });\n  } else {\n    const cap = (tkApproved.max_rate_cents || 0) / 100;\n    if (cap > 0 && li.rate > cap) {\n      flags.push({ kind: 'rate_over_card', actual_rate: li.rate, card_rate: cap, line: li, severity: 0.5 });\n    }\n  }\n  if (li.units >= minBlockUnits && /[;,\\.]/.test(li.description) === false && li.description.split(' ').length < 8) {\n    flags.push({ kind: 'block_billing', units: li.units, line: li, severity: 0.4 });\n  }\n  const desc = (li.description || '').toLowerCase();\n  if (vagueKeywords.some(k => desc.startsWith(k.toLowerCase()) || desc === k.toLowerCase())) {\n    flags.push({ kind: 'vague_description', line: li, severity: 0.3 });\n  }\n  if (li.timekeeper_classification && noTravelClass.has(li.timekeeper_classification) && /travel|commute|airport/i.test(li.description)) {\n    flags.push({ kind: 'partner_travel_billed', line: li, severity: 0.5 });\n  }\n}\nconst rule_value_cents = Math.round(\n  flags.reduce((s, f) => {\n    if (f.kind === 'rate_over_card') return s + (f.actual_rate - f.card_rate) * f.line.units * 100;\n    if (f.kind === 'block_billing') return s + (f.line.total * 0.10) * 100;\n    if (f.kind === 'partner_travel_billed') return s + (f.line.total * 0.50) * 100;\n    if (f.kind === 'vague_description') return s + (f.line.total * 0.05) * 100;\n    return s;\n  }, 0)\n);\nreturn [{\n  json: {\n    invoice_id: inv.invoice_id,\n    invoice_number: inv.invoice_number,\n    matter_id: inv.matter_id,\n    law_firm_id: inv.law_firm_id,\n    matter: ctx.matter,\n    invoice_total: inv.invoice_total,\n    rule_flags: flags,\n    rule_flag_count: flags.length,\n    rule_value_cents,\n    line_items: inv.line_items\n  }\n}];"
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000008",
      "name": "Rule-Based Checks",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [1760, 320]
    },
    {
      "parameters": {
        "method": "POST",
        "url": "https://api.anthropic.com/v1/messages",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "anthropic-version", "value": "2023-06-01" },
            { "name": "content-type", "value": "application/json" }
          ]
        },
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendBody": true,
        "specifyBody": "json",
        "jsonBody": "={\n  \"model\": \"claude-sonnet-4-6\",\n  \"max_tokens\": 1500,\n  \"system\": \"You audit outside-counsel legal invoices. You are given an invoice's line items, the matter's scope summary, and the firm's billing guidelines. Surface only items that exceed deterministic rule-based checks: duplicative timekeepers on the same task, disproportionate task time relative to scope, scope-creep narratives, off-engagement-letter work, and suspicious task/activity code combinations. For each finding return {line_index, kind, severity (0-1), reasoning (one sentence), suggested_action ('reduce'|'reject'|'query_firm')}. Return JSON only. If nothing exceeds heuristics, return an empty array. Never invent line indexes; never claim a violation you cannot tie to a specific line.\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"Matter: {{ JSON.stringify($json.matter) }}\\n\\nLine items (index, timekeeper, classification, rate, units, total, description, task_code, activity_code, date):\\n{{ $json.line_items.map((li, i) => `${i}\\t${li.timekeeper_name}\\t${li.timekeeper_classification}\\t${li.rate}\\t${li.units}\\t${li.total}\\t${li.description}\\t${li.task_code}\\t${li.activity_code}\\t${li.date}`).join('\\n') }}\"\n    }\n  ]\n}",
        "options": {
          "timeout": 60000
        }
      },
      "id": "2d2d2d2d-0001-0000-0000-000000000009",
      "name": "Claude — Anomaly Detection",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [1980, 320],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_ANTHROPIC_CRED_ID",
          "name": "Anthropic — x-api-key"
        }
      },
      "notesInFlow": true,
      "notes": "Calibration-sensitive. Run on 100 historical invoices and adjust the system prompt thresholds before going live."
    },
    {
      "parameters": {
        "jsCode": "// Combine rule-based hits and Claude's flags into a single per-invoice score and routing decision.\nconst rb = $('Rule-Based Checks').item.json;\nlet aiFlags = [];\ntry {\n  const text = $json.content?.[0]?.text || '[]';\n  aiFlags = JSON.parse(text);\n  if (!Array.isArray(aiFlags)) aiFlags = [];\n} catch (e) {\n  aiFlags = [];\n}\nconst aiSeverityMax = aiFlags.reduce((m, f) => Math.max(m, Number(f.severity) || 0), 0);\nconst ruleSeverityMax = rb.rule_flags.reduce((m, f) => Math.max(m, Number(f.severity) || 0), 0);\nconst ruleValueShare = (rb.invoice_total > 0) ? (rb.rule_value_cents / 100) / rb.invoice_total : 0;\nlet decision = 'auto_approve';\nlet reason = 'no flags';\nif (aiSeverityMax >= 0.8 || ruleValueShare >= 0.15) {\n  decision = 'escalate_director';\n  reason = aiSeverityMax >= 0.8 ? 'severe_ai_anomaly' : 'large_rule_value_share';\n} else if (aiFlags.length > 0 || ruleSeverityMax >= 0.5) {\n  decision = 'reviewer_queue';\n  reason = aiFlags.length > 0 ? 'ai_flags_present' : 'rule_severity_above_threshold';\n} else if (rb.rule_flag_count > 0) {\n  decision = 'auto_deduct';\n  reason = 'low_value_rule_flags_only';\n}\nreturn [{\n  json: {\n    ...rb,\n    ai_flags: aiFlags,\n    ai_flag_count: aiFlags.length,\n    decision,\n    reason,\n    score: { aiSeverityMax, ruleSeverityMax, ruleValueShare }\n  }\n}];"
      },
      "id": "2d2d2d2d-0001-0000-0000-00000000000a",
      "name": "Score + Route",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [2200, 320]
    },
    {
      "parameters": {
        "conditions": {
          "options": {
            "caseSensitive": true,
            "leftValue": "",
            "typeValidation": "strict"
          },
          "conditions": [
            {
              "id": "is-escalation",
              "leftValue": "={{ $json.decision }}",
              "rightValue": "escalate_director",
              "operator": {
                "type": "string",
                "operation": "equals"
              }
            }
          ],
          "combinator": "and"
        },
        "options": {}
      },
      "id": "2d2d2d2d-0001-0000-0000-00000000000b",
      "name": "Escalation?",
      "type": "n8n-nodes-base.if",
      "typeVersion": 2.2,
      "position": [2420, 320]
    },
    {
      "parameters": {
        "method": "POST",
        "url": "https://slack.com/api/chat.postMessage",
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "content-type", "value": "application/json" }
          ]
        },
        "sendBody": true,
        "specifyBody": "json",
        "jsonBody": "={\n  \"channel\": \"#legal-ops-escalations\",\n  \"text\": \":rotating_light: Escalation — Invoice {{ $json.invoice_number }} (matter {{ $json.matter_id }}, firm {{ $json.law_firm_id }}). Total ${{ $json.invoice_total }}. Reason: {{ $json.reason }}. AI severity {{ $json.score.aiSeverityMax }}, rule value share {{ ($json.score.ruleValueShare * 100).toFixed(1) }}%.\",\n  \"blocks\": [\n    { \"type\": \"section\", \"text\": { \"type\": \"mrkdwn\", \"text\": \":rotating_light: *Escalation* — Invoice `{{ $json.invoice_number }}`\\nMatter `{{ $json.matter_id }}` • Firm `{{ $json.law_firm_id }}` • Total `${{ $json.invoice_total }}`\\nReason: *{{ $json.reason }}*\" } },\n    { \"type\": \"section\", \"text\": { \"type\": \"mrkdwn\", \"text\": \"*AI findings ({{ $json.ai_flag_count }})*\\n{{ ($json.ai_flags || []).slice(0,5).map(f => `• line ${f.line_index} — ${f.kind} (sev ${f.severity}): ${f.reasoning}`).join('\\n') }}\" } },\n    { \"type\": \"section\", \"text\": { \"type\": \"mrkdwn\", \"text\": \"*Rule findings ({{ $json.rule_flag_count }})*\\n{{ ($json.rule_flags || []).slice(0,5).map(f => `• ${f.kind} — line: ${f.line.description?.slice(0,60)}`).join('\\n') }}\" } }\n  ]\n}",
        "options": {}
      },
      "id": "2d2d2d2d-0001-0000-0000-00000000000c",
      "name": "Slack — Escalate to Director",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [2640, 220],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_SLACK_CRED_ID",
          "name": "Slack — bot token"
        }
      }
    },
    {
      "parameters": {
        "conditions": {
          "options": {
            "caseSensitive": true,
            "leftValue": "",
            "typeValidation": "strict"
          },
          "conditions": [
            {
              "id": "is-reviewer-or-deduct",
              "leftValue": "={{ ['reviewer_queue', 'auto_deduct'].includes($json.decision) }}",
              "rightValue": true,
              "operator": {
                "type": "boolean",
                "operation": "equal"
              }
            }
          ],
          "combinator": "and"
        },
        "options": {}
      },
      "id": "2d2d2d2d-0001-0000-0000-00000000000d",
      "name": "Reviewer or Deduct?",
      "type": "n8n-nodes-base.if",
      "typeVersion": 2.2,
      "position": [2640, 420]
    },
    {
      "parameters": {
        "method": "POST",
        "url": "https://slack.com/api/chat.postMessage",
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "content-type", "value": "application/json" }
          ]
        },
        "sendBody": true,
        "specifyBody": "json",
        "jsonBody": "={\n  \"channel\": \"#legal-ops-invoice-review\",\n  \"text\": \"Invoice {{ $json.invoice_number }} — decision: {{ $json.decision }} ({{ $json.reason }}). Total ${{ $json.invoice_total }}; estimated deduction ${{ ($json.rule_value_cents / 100).toFixed(2) }}.\",\n  \"blocks\": [\n    { \"type\": \"section\", \"text\": { \"type\": \"mrkdwn\", \"text\": \"*Invoice* `{{ $json.invoice_number }}` — firm `{{ $json.law_firm_id }}` • matter `{{ $json.matter_id }}`\\n*Decision*: `{{ $json.decision }}` — {{ $json.reason }}\\n*Total*: ${{ $json.invoice_total }} • *Est. deduction*: ${{ ($json.rule_value_cents / 100).toFixed(2) }}\" } },\n    { \"type\": \"section\", \"text\": { \"type\": \"mrkdwn\", \"text\": \"*Rule flags ({{ $json.rule_flag_count }})*: {{ ($json.rule_flags || []).map(f => f.kind).slice(0,8).join(', ') || 'none' }}\\n*AI flags ({{ $json.ai_flag_count }})*: {{ ($json.ai_flags || []).map(f => f.kind).slice(0,8).join(', ') || 'none' }}\" } }\n  ]\n}",
        "options": {}
      },
      "id": "2d2d2d2d-0001-0000-0000-00000000000e",
      "name": "Slack — Reviewer Queue",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [2860, 360],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_SLACK_CRED_ID",
          "name": "Slack — bot token"
        }
      }
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "INSERT INTO invoice_audit_log (\n  invoice_id, invoice_number, matter_id, law_firm_id,\n  decision, reason, rule_flag_count, rule_value_cents,\n  ai_flag_count, ai_severity_max, rule_severity_max, rule_value_share,\n  rule_flags_json, ai_flags_json, checked_at\n) VALUES (\n  $1, $2, $3, $4, $5, $6, $7, $8, $9, $10, $11, $12, $13::jsonb, $14::jsonb, now()\n)\nON CONFLICT (invoice_id) DO UPDATE\nSET decision = excluded.decision,\n    reason = excluded.reason,\n    rule_flag_count = excluded.rule_flag_count,\n    rule_value_cents = excluded.rule_value_cents,\n    ai_flag_count = excluded.ai_flag_count,\n    ai_severity_max = excluded.ai_severity_max,\n    rule_severity_max = excluded.rule_severity_max,\n    rule_value_share = excluded.rule_value_share,\n    rule_flags_json = excluded.rule_flags_json,\n    ai_flags_json = excluded.ai_flags_json,\n    checked_at = excluded.checked_at\nRETURNING id;",
        "options": {
          "queryReplacement": "={{ $json.invoice_id }},{{ $json.invoice_number }},{{ $json.matter_id }},{{ $json.law_firm_id }},{{ $json.decision }},{{ $json.reason }},{{ $json.rule_flag_count }},{{ $json.rule_value_cents }},{{ $json.ai_flag_count }},{{ $json.score.aiSeverityMax }},{{ $json.score.ruleSeverityMax }},{{ $json.score.ruleValueShare }},{{ JSON.stringify($json.rule_flags || []) }},{{ JSON.stringify($json.ai_flags || []) }}"
        }
      },
      "id": "2d2d2d2d-0001-0000-0000-00000000000f",
      "name": "Audit Log Insert",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [3080, 320],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — legal-ops state"
        }
      },
      "notesInFlow": true,
      "notes": "Idempotent on invoice_id. Watermark node reads max(checked_at). Add a unique index on invoice_id."
    }
  ],
  "connections": {
    "Daily Cron — 7am Mon-Fri": {
      "main": [
        [{ "node": "Lookup Watermark", "type": "main", "index": 0 }]
      ]
    },
    "Lookup Watermark": {
      "main": [
        [{ "node": "Brightflag — List New Invoices", "type": "main", "index": 0 }]
      ]
    },
    "Brightflag — List New Invoices": {
      "main": [
        [{ "node": "Split Invoices", "type": "main", "index": 0 }]
      ]
    },
    "Split Invoices": {
      "main": [
        [{ "node": "Fetch LEDES File", "type": "main", "index": 0 }]
      ]
    },
    "Fetch LEDES File": {
      "main": [
        [{ "node": "Parse LEDES", "type": "main", "index": 0 }]
      ]
    },
    "Parse LEDES": {
      "main": [
        [{ "node": "Load Matter + Rate Card", "type": "main", "index": 0 }]
      ]
    },
    "Load Matter + Rate Card": {
      "main": [
        [{ "node": "Rule-Based Checks", "type": "main", "index": 0 }]
      ]
    },
    "Rule-Based Checks": {
      "main": [
        [{ "node": "Claude — Anomaly Detection", "type": "main", "index": 0 }]
      ]
    },
    "Claude — Anomaly Detection": {
      "main": [
        [{ "node": "Score + Route", "type": "main", "index": 0 }]
      ]
    },
    "Score + Route": {
      "main": [
        [{ "node": "Escalation?", "type": "main", "index": 0 }]
      ]
    },
    "Escalation?": {
      "main": [
        [{ "node": "Slack — Escalate to Director", "type": "main", "index": 0 }],
        [{ "node": "Reviewer or Deduct?", "type": "main", "index": 0 }]
      ]
    },
    "Slack — Escalate to Director": {
      "main": [
        [{ "node": "Audit Log Insert", "type": "main", "index": 0 }]
      ]
    },
    "Reviewer or Deduct?": {
      "main": [
        [{ "node": "Slack — Reviewer Queue", "type": "main", "index": 0 }],
        [{ "node": "Audit Log Insert", "type": "main", "index": 0 }]
      ]
    },
    "Slack — Reviewer Queue": {
      "main": [
        [{ "node": "Audit Log Insert", "type": "main", "index": 0 }]
      ]
    }
  },
  "active": false,
  "settings": {
    "executionOrder": "v1",
    "timezone": "America/New_York"
  },
  "versionId": "2d2d2d2d-0001-0000-0000-0000000000ff",
  "meta": {
    "templateCreatedBy": "ooligo",
    "instanceId": "ooligo-legal-ops"
  },
  "id": "legal-spend-anomaly",
  "tags": [
    { "name": "legal-ops" },
    { "name": "anomaly-detection" }
  ]
}