eDiscovery (descoberta eletrônica) é o processo de identificar, preservar, coletar, processar, revisar e produzir informações armazenadas eletronicamente (ESI — Electronically Stored Information) em resposta a litígios, investigações regulatórias ou investigações internas. É o maior e mais maduro problema de engenharia de dados do setor jurídico — uma única resposta a um second request pode ingerir dezenas de milhões de documentos, e um único documento privilegiado não identificado pode virar um processo por malpractice.
O modelo EDRM
O Electronic Discovery Reference Model (EDRM) é o mapa-padrão do workflow de eDiscovery. Nove etapas, executadas (na maior parte) em sequência:
| Etapa | O que acontece |
|---|---|
| 1. Governança da informação | Pré-litígio: políticas de retenção de dados, prontidão para holds |
| 2. Identificação | Quais custodiantes e fontes de dados estão no escopo? |
| 3. Preservação | Emitir legal holds; suspender deleções |
| 4. Coleta | Extrair dados de e-mail, file shares, Slack, mobile, apps na nuvem |
| 5. Processamento | Deduplicar, extrair metadados, OCR, normalizar formatos |
| 6. Revisão | Advogados (ou IA) classificam documentos — responsivo, privilegiado, relevante |
| 7. Análise | Construir a narrativa do caso a partir dos documentos revisados |
| 8. Produção | Produzir documentos responsivos e não privilegiados para a parte requerente |
| 9. Apresentação | Usar os documentos produzidos em depoimentos ou julgamentos |
A maioria dos softwares de eDiscovery (Relativity, Everlaw, Logikcull) cobre as etapas 4-8 do EDRM. As etapas 1-3 são cada vez mais tratadas por ferramentas de governança da informação dentro do Microsoft Purview, Google Vault ou softwares especializados de legal hold.
Por que a revisão é o centro de custo
A revisão é onde vivem mais de 70% dos gastos com eDiscovery. Até recentemente, revisão significava advogados de primeira passagem (frequentemente revisores contratados) examinando cada documento a $50-150/hora. Uma revisão de 1 milhão de documentos exige 5.000-15.000 horas de advogado, chegando a $500K-$2M em custo de revisão antes de qualquer controle de qualidade de segunda passagem.
Duas ondas de automação atacaram esse problema:
- Technology Assisted Review (TAR). Workflows de predictive coding desde o início dos anos 2010. Um advogado sênior treina um modelo em um seed set; o modelo classifica os documentos restantes por responsividade; documentos de menor classificação são revisados com menos intensidade ou nem revisados. Aceito pelos tribunais na maioria das jurisdições dos EUA.
- Revisão assistida por LLM. Desde 2023, IA generativa realiza a revisão de primeira passagem com um nível de qualidade competitivo ao de revisores juniores contratados nas categorias mais comuns (responsivo/não-responsivo, privilegiado, relevante). Everlaw, Relativity e DISCO já lançaram recursos de LLM; players especializados (CARA da Casetext, Luminance Discovery) competem diretamente.
A revisão assistida por LLM está mudando radicalmente a curva de custos — casos bem gerenciados agora conseguem fazer a revisão de primeira passagem por 10-20% do custo histórico — mas tribunais e advogados da parte contrária ainda estão calibrando o que a produção assistida por IA exige em termos de disclosure e validação.
Quando uma empresa precisa de software de eDiscovery?
Para a maioria das empresas não litigantes: nunca. O eDiscovery é adquirido por matéria por meio de advogados externos, que selecionam o fornecedor de eDiscovery para cada caso. A empresa nunca licencia diretamente o Relativity ou o Everlaw.
Empresas que trazem o eDiscovery para dentro costumam ter dois sinais em comum:
- Volume recorrente de litígios ou regulações. Instituições financeiras, saúde, grandes techs, prestadores de serviços governamentais. O volume de matérias justifica uma equipe e ferramentaria dedicadas.
- Dados sensíveis que não querem que saiam do ambiente interno. Algumas equipes jurídicas in-house preferem realizar a coleta e o processamento internamente antes de entregar produções revisadas aos advogados externos.
O eDiscovery in-house é uma responsabilidade de Legal Ops, distinta da função de gestão de matérias. As decisões de ferramentaria (qual plataforma, qual fornecedor de IA) ficam com o Head de eDiscovery ou Head de Legal Ops.
Por que o eDiscovery importa para Legal Ops em geral
Mesmo equipes de Legal Ops que não gerenciam eDiscovery internamente devem se preocupar com ele porque:
- O gasto com eDiscovery por advogados externos é frequentemente o maior item de linha nos orçamentos de litígio. Ferramentas de gestão de gastos jurídicos o rastreiam; estruturas de AFA (valor máximo por documento revisado) o governam cada vez mais.
- As escolhas de governança da informação feitas pelo Legal Ops upstream (retenção, políticas de comunicação) determinam o custo do eDiscovery downstream. Uma política de retenção de 90 dias no Slack é uma decisão de vários milhões de dólares quando a próxima investigação chegar.
Relacionados
- O que é Legal Ops? — a função que possui as decisões de fornecedor e política de eDiscovery
- Melhores plataformas de eDiscovery — comparação direta
- Relativity — a plataforma de eDiscovery enterprise dominante
- Everlaw — principal desafiante nativo de IA
- Logikcull — eDiscovery self-service para matérias menores