El eDiscovery (descubrimiento electrónico) es el proceso de identificar, preservar, recopilar, procesar, revisar y producir información almacenada electrónicamente (ESI) en respuesta a litigios, investigaciones regulatorias o investigaciones internas. Es el mayor y más maduro problema de ingeniería de datos del sector legal —una sola respuesta a una solicitud de segunda vuelta puede ingerir decenas de millones de documentos, y un solo documento privilegiado omitido puede convertirse en una reclamación por negligencia profesional—.
El modelo EDRM
El Electronic Discovery Reference Model (EDRM) es el mapa estándar del sector del workflow de eDiscovery. Nueve etapas, ejecutadas (en su mayoría) en orden:
| Etapa | Qué sucede |
|---|---|
| 1. Gobernanza de la información | Pre-litigio: políticas de retención de datos, preparación para retención legal |
| 2. Identificación | ¿Qué custodios y fuentes de datos están en el alcance? |
| 3. Preservación | Emitir retenciones legales; congelar la eliminación |
| 4. Recopilación | Extraer datos de correo electrónico, archivos compartidos, Slack, dispositivos móviles, aplicaciones en la nube |
| 5. Procesamiento | Deduplicar, extraer metadatos, OCR, normalizar formatos |
| 6. Revisión | Los abogados (o la AI) etiquetan documentos — responsivos, privilegiados, críticos |
| 7. Análisis | Construir el relato del caso a partir de los documentos revisados |
| 8. Producción | Producir los documentos responsivos y no privilegiados a la parte solicitante |
| 9. Presentación | Usar los documentos producidos en deposiciones o juicio |
La mayoría del software de eDiscovery (Relativity, Everlaw, Logikcull) cubre las etapas 4-8 del EDRM. Las etapas 1-3 son gestionadas cada vez más por herramientas de gobernanza de información dentro de Microsoft Purview, Google Vault o software de retención legal dedicado.
Por qué la revisión es el centro de costos
La revisión es donde vive más del 70% del gasto en eDiscovery. Hasta hace poco, la revisión significaba abogados de primera pasada (frecuentemente revisores contratados) inspeccionando cada documento a $50-150/hora. Una revisión de 1 millón de documentos requiere 5.000-15.000 horas de abogado, lo que implica $500K-$2M solo en costos de revisión antes de cualquier control de calidad de segunda pasada.
Dos oleadas de automatización han atacado esto:
- Revisión Asistida por Tecnología (TAR). Workflows de codificación predictiva desde principios de los años 2010. Un abogado senior entrena un modelo con un conjunto semilla; el modelo clasifica los documentos restantes por relevancia; los documentos de menor clasificación se revisan con menor intensidad o no se revisan. Aceptado por los tribunales en la mayoría de las jurisdicciones de EE. UU.
- Revisión asistida por LLM. Desde 2023, la AI generativa gestiona la revisión de primera pasada con una barra de calidad competitiva con la de los revisores contratados junior en categorías comunes (responsivo/no responsivo, privilegiado, crítico). Everlaw, Relativity y DISCO han lanzado características de LLM; los especialistas (CARA de Casetext, Luminance Discovery) compiten directamente.
La revisión asistida por LLM está desplazando drásticamente la curva de costos —los casos bien gestionados pueden hacer ahora la revisión de primera pasada por el 10-20% del costo histórico—, pero los tribunales y las partes contrarias todavía están calibrando qué requiere la producción asistida por AI en términos de divulgación y validación.
¿Cuándo necesita una empresa software de eDiscovery?
Para la mayoría de las empresas sin litigios recurrentes: nunca. El eDiscovery se contrata por asunto a través de los abogados externos, quienes seleccionan el proveedor de eDiscovery para ese caso. La empresa nunca licencia directamente Relativity o Everlaw.
Las empresas que internalizan el eDiscovery típicamente comparten dos señales:
- Volumen recurrente de litigios o investigaciones regulatorias. Instituciones financieras, salud, grandes tecnológicas, contratistas gubernamentales. La cadencia de asuntos justifica un equipo y herramientas dedicadas.
- Datos sensibles que no quieren que salgan de sus instalaciones. Algunos equipos internos prefieren gestionar la recopilación y el procesamiento internamente antes de entregar las producciones revisadas a los abogados externos.
El eDiscovery interno es una responsabilidad de Legal Ops, distinta de la función de gestión de asuntos. Las decisiones sobre herramientas (qué plataforma, qué proveedor de AI) recaen en el Jefe de eDiscovery o el Jefe de Legal Ops.
Por qué el eDiscovery importa para Legal Ops en general
Incluso los equipos de Legal Ops que no gestionan el eDiscovery internamente deben preocuparse por él porque:
- El gasto en abogados externos para eDiscovery suele ser la partida más grande en los presupuestos de litigios. Las herramientas de gestión del gasto legal lo rastrean; las estructuras de AFAs (revisión por documento con tope) lo gobiernan cada vez más.
- Las decisiones de gobernanza de la información tomadas por Legal Ops upstream (retención, políticas de comunicaciones) determinan el costo del eDiscovery downstream. Una política de retención de Slack de 90 días es una decisión de varios millones de dólares cuando llega la próxima investigación.
Relacionado
- ¿Qué es Legal Ops? — la función que gestiona las decisiones de proveedores y políticas de eDiscovery
- Mejores plataformas de eDiscovery — comparación directa
- Relativity — la plataforma de eDiscovery empresarial dominante
- Everlaw — el principal competidor de AI nativa
- Logikcull — eDiscovery de auto-servicio para asuntos más pequeños