ooligo
n8n-flow

Orchestration de la collecte de preuves pour l'ediscovery avec n8n

Difficulty
avancé
Setup time
180min
For
legal-ops · ediscovery-lead · in-house-counsel
Legal Ops

Stack

Un flow n8n qui orchestre la phase de collecte de l’ediscovery (l’étape « Collection » de l’EDRM) — il extrait les données de la liste des dépositaires depuis le HRIS du cabinet, génère des demandes de collecte par dépositaire auprès des sources de données du cabinet (Google Workspace, Microsoft 365, Slack, partages de fichiers, SaaS personnalisé), suit la complétion de la collecte et la chaîne de traçabilité, et transmet les données collectées vers l’espace de travail Relativity (ou Everlaw / Logikcull) pour traitement. Chaque étape écrit dans un journal d’audit immuable que l’avocat utilise pour défendre l’adéquation de la collecte. Remplace la collecte manuelle par feuilles de calcul et captures d’écran de l’administrateur legal-ops par un flow déterministe.

Quand l’utiliser

  • Les cabinets avec un contentieux régulier — typiquement ceux avec des portefeuilles de litiges actifs où la collecte se produit plusieurs fois par an.
  • Le nombre de dépositaires par affaire est suffisamment élevé pour que la collecte manuelle soit opérationnellement infaisable (typiquement >5 dépositaires par affaire).
  • Le cabinet dispose d’une capacité technique pour câbler la couche de connecteurs (Google Workspace Vault, M365 eDiscovery, Slack Discovery API, etc.). Le flow est l’orchestration ; les connecteurs sont propres à chaque système.
  • L’avocat valide le périmètre de collecte par dépositaire ; le flow s’exécute contre le périmètre approuvé.

Quand NE PAS l’utiliser

  • Collectes à dépositaire unique — le manuel suffit ; le coût de configuration du flow (180 minutes plus le câblage des connecteurs) ne s’amortit pas.
  • Remplacer l’expertise en documentation de chaîne de traçabilité. Le flow génère des enregistrements d’audit ; le responsable ediscovery valide que les enregistrements respectent le standard de chaîne de traçabilité de la juridiction. Les exigences diffèrent selon les juridictions.
  • Définir automatiquement le périmètre de collecte. L’avocat définit le périmètre par affaire ; le flow s’exécute contre ce périmètre, il ne le rédige pas.
  • Premières affaires d’un cabinet sans procédure de collecte établie. Le flow encode une procédure ; s’il n’y a pas de procédure à encoder, définissez-la d’abord.

Configuration

  1. Importez le flow. Déposez apps/web/public/artifacts/evidence-collection-ediscovery-n8n/evidence-collection-ediscovery-n8n.json dans votre instance n8n.
  2. Configurez les credentials. Par source : Google Workspace (API Vault ; compte de service avec autorité déléguée), Microsoft 365 (API Compliance Center ; enregistrement d’application par tenant), Slack (API Discovery — disponible uniquement sur Enterprise Grid), HRIS (source des dépositaires). Plus Relativity / Everlaw / Logikcull (la plateforme d’ediscovery) et Postgres (journal d’audit).
  3. Rédigez le modèle de périmètre de collecte par source. Par source de données, documentez : quels périmètres sont collectables (plage de dates, termes de recherche, filtres spécifiques au dépositaire), quelles sont les limites de débit par source, quel est le format de sortie attendu.
  4. Configurez le modèle de chaîne de traçabilité. Par affaire et par dépositaire : qui a collecté (nom du compte de service + réviseur humain), quand, ce qui a été collecté, hash de la collecte à l’achèvement. Modèle dans _README.md.
  5. Configurez l’intégration avec la plateforme d’ediscovery. API de traitement Relativity ou équivalent pour Everlaw / Logikcull. Le flow téléverse dans un espace de travail par affaire ; le pipeline de traitement (dédoublonnage, OCR, etc.) s’exécute dans la plateforme.
  6. Test à blanc sur une affaire clôturée. Rejouez la collecte pour une affaire finalisée le trimestre dernier. Confirmez que le volume collecté correspond à ce qui a été initialement produit et que les enregistrements de chaîne de traçabilité correspondent à ce que l’avocat a certifié.

Ce que le flow fait

Huit nœuds. Orchestration par dépositaire et par source, avec chaîne de traçabilité à chaque étape.

  1. Collection Request Trigger — webhook depuis la plateforme legal-ops quand l’avocat marque le périmètre de collecte comme approuvé.
  2. Load Custodian + Scope — extrait la liste des dépositaires et le périmètre par dépositaire et par source depuis le plan de collecte de l’affaire.
  3. Per-Source Dispatch — déploie une branche par source de données et par dépositaire. La partie la plus complexe du flow — chaque source possède sa propre API et ses propres contraintes de débit.
  4. Source : Google Workspace Vault — affaire Vault créée (ou réutilisée), suspension émise, recherche exécutée sur Gmail / Drive / Calendrier du dépositaire dans le périmètre, résultats exportés.
  5. Source : M365 Compliance — recherche de contenu exécutée sur la boîte mail / OneDrive / Teams du dépositaire dans le périmètre, résultats exportés via le Compliance Center.
  6. Source : Slack Discovery — API Discovery d’Enterprise Grid Slack ; export par dépositaire et par canal dans le périmètre.
  7. Hash + Chain-of-Custody Append — chaque export par source est hashé (SHA-256), et un enregistrement de chaîne de traçabilité est ajouté à la table d’audit : {matter_id, custodian_id, source, scope_summary, collected_at, collected_by_service_account, hash, file_count, byte_count}.
  8. Upload to E-Discovery Platform — transmission des exports vers l’espace de travail Relativity par affaire ; déclenchement du job de traitement ; enregistrement de l’identifiant de chargement côté plateforme dans le journal d’audit pour la traçabilité.

Réalité des coûts

  • Coûts de connecteurs / plateformes sources — Google Vault, M365 E5 avec Advanced eDiscovery, Slack Enterprise Grid comportent tous des coûts par siège. Le flow ne les réduit pas ; il les utilise efficacement.
  • Exécutions n8n — longue durée (les grands exports prennent des heures) ; utilisez le mode queue de n8n pour la production.
  • Coût de traitement de la plateforme d’ediscovery — Relativity / Everlaw / Logikcull facturent tous par Go traité ; le flow ne change pas ce calcul.
  • Temps de l’administrateur legal-ops — le gain réel. L’orchestration manuelle d’une collecte de 10 dépositaires sur 4 sources représente des jours de travail ; le flow s’exécute en heures sans surveillance.
  • Temps de configuration — 180 minutes pour le flow lui-même + câblage important des connecteurs par source (les connecteurs représentent la majeure partie de la configuration réelle).

Métriques de succès

  • Délai de l’approbation de l’avocat à la collecte terminée — devrait passer de jours/semaines (manuel) à heures (flow), selon la durée des jobs d’export de la plateforme source.
  • Complétude de la chaîne de traçabilité — devrait être de 100 % par affaire. Toute lacune est un risque pour la défendabilité.
  • Dérive de volume — volume collecté par le flow vs périmètre attendu par l’avocat. Dans les 10 % est normal (calibration des filtres) ; >25 % déclenche un examen du périmètre.

Alternatives

  • vs modules de collecte natifs de la plateforme d’ediscovery (Relativity Collect, Everlaw Collections). Choisissez-les si votre équipe vit dans la plateforme et que les connecteurs de la plateforme couvrent vos sources. Le flow est adapté aux affaires avec des sources personnalisées ou couvrant plus de sources que n’importe quelle plateforme unique ne le fait nativement.
  • vs outils commerciaux d’orchestration de collecte (Reveal Brainspace, OpenText EnCase, Cellebrite, Onna). Choisissez-les pour les affaires les plus avancées avec des exigences de niveau forensique. Le flow est la solution intermédiaire légère pour l’ediscovery d’entreprise de routine.
  • vs collecte manuelle. Viable à petite échelle ; ne s’adapte pas aux affaires multi-dépositaires.

Points de vigilance

  • Intégrité de la chaîne de traçabilité. Protection : chaque export par source est hashé au moment de la collecte et à nouveau avant le téléversement vers la plateforme d’ediscovery. Les discordances de hash bloquent le téléversement et alertent le responsable ediscovery.
  • Glissement de périmètre lors de la collecte automatisée. Protection : le périmètre du flow est lu depuis le plan de collecte approuvé par l’avocat ; élargir le périmètre en cours d’exécution nécessite un amendement du plan, pas une modification du flow. Le journal d’audit capture le SHA du plan par exécution.
  • Épuisement des limites de débit de la plateforme source. Protection : limiteurs de débit par source dans les nœuds par source du flow. L’API Discovery de Slack a en particulier des limites de débit agressives — le flow s’adapte en conséquence.
  • Exposition de documents privilégiés lors de la collecte. Protection : la collecte capture tout ce qui entre dans le périmètre ; la revue de confidentialité s’effectue en aval dans la plateforme d’ediscovery (le skill de traitement par lot de revue de privilège est l’étape suivante). Le flow ne pré-filtre PAS le contenu privilégié — c’est une décision en aval.
  • Préoccupations relatives à la vie privée des dépositaires. Protection : le flow opère sur les systèmes que le dépositaire utilise pour son travail ; les comptes personnels (Gmail personnel, Slack personnel) sont hors périmètre, sauf si l’avocat les a explicitement nommés. Le plan de collecte documente la limite.
  • Localisation des données transfrontalières. Protection : les données des dépositaires résidant dans l’UE peuvent être soumises aux considérations de localisation des données RGPD ; le périmètre par dépositaire du flow signale les dépositaires résidant dans l’UE pour une revue de traitement des données avant export vers un espace de travail d’ediscovery hors UE.

Stack

Le bundle se trouve dans apps/web/public/artifacts/evidence-collection-ediscovery-n8n/ :

  • evidence-collection-ediscovery-n8n.json — l’export du flow (squelette — les connecteurs par source réels sont spécifiques au cabinet)
  • _README.md — credentials, schéma de la table d’audit, notes sur les connecteurs par source, modèle de chaîne de traçabilité

Outils : n8n, Relativity (ou Everlaw / Logikcull), Slack (notification uniquement). Connecteurs de plateformes sources : Google Workspace Vault, Microsoft 365 Compliance, Slack Discovery, SaaS personnalisé selon la stack du cabinet.

En lien avec : ediscovery, modèle EDRM, gestion des affaires, revue de privilège.

Files in this artifact

Download all (.zip)