ooligo
claude-skill

Claudeによるバッチ特権審査

Difficulty
上級
Setup time
90min
For
legal-ops · in-house-counsel · paralegal
Legal Ops

Stack

ドキュメントのバッチ——通常はeDiscoveryレビュープラットフォームからエクスポートされたメールと添付ファイルのフォルダ、またはCLMから取得した契約のディレクトリ——を受け取り、最初のパスの特権審査を実行するClaude スキルです。各ドキュメントについて privilegednot-privilegedborderline-needs-attorney のいずれかを、引用に基づくエビデンスのスパンとともに出力し、privileged に分類されたすべてのドキュメントについてドラフトの特権ログエントリを生成します。

これはトリアージレイヤーであり、判断レイヤーではありません。スキルは5桁のドキュメント群に対する弁護士の最初のパスをルーティング判断に圧縮します:明らかに特権なしが70〜80%、ドラフトログエントリが事前に作成された明らかに特権ありが10〜15%、特定の懸念事項(弁護士の役割が不明確、第三者の存在、部分的な特権、権利放棄の表示)が名指しされてレビュー中の弁護士が実際に判断を必要とするレコードに時間をかけられるボーダーラインキューが10〜20%。最終的な判断は依然として弁護士の仕事です。

バンドルは apps/web/public/artifacts/privilege-review-batch-skill/ にあり、SKILL.md と、案件チームが本番ドキュメントを実行する前に記入する3つの参照テンプレートが含まれています:references/1-privilege-rubric.mdreferences/2-privilege-log-format.mdreferences/3-jurisdictional-tests.md

使用すべきタイミング

  • eDiscoveryの最初のパス。 収集と重複排除後に5,000〜50,000件のドキュメントのレビュー群がチームに届く。弁護士のみのレビューは、コントラクト弁護士で時給$400〜700、アソシエイト時間にはさらに高額で、1ドキュメントあたり10〜30分かかります。このスキルを先に実行することで、弁護士はボーダーラインキューと高信頼セットのサンプルに触れ、すべてのドキュメントに触れる必要がなくなります。
  • CLMの特権監査。 規制機関のリクエスト、M&Aデューデリジェンス、または内部監査により、「特権」と誤ってタグ付けされたドキュメント(過大請求)や特権タグが欠落しているドキュメント(過小請求)を検索するため、契約リポジトリをスイープする必要がある場合。スキルはコーパスをバッチ処理し、弁護士のレビューのために不一致を表面化します。
  • 調査のトリアージ。 カストディアンのメールボックスを証拠開示のために社外弁護士に渡す前に、社内でスキルが分類し、特権コンテンツが一括引き渡しに含まれるのではなく弁護士を通じてルーティングされるようにします。
  • 新しいルーブリックのキャリブレーション。 案件が新しくチームがまだ特権ルーブリックを確定していない場合、200〜500件のドキュメントのサンプルでスキルを実行し、その判断を弁護士の決定と比較し、references/1-privilege-rubric.md のルーブリックを調整してから繰り返します。キャリブレーションモード(SKILL.md のステップ4)はこのループのために構築されています。

使用すべきでないタイミング

  • 最終的な特権判断。 アウトプットは推奨です。ここで privileged とマークされたドキュメントは、証拠開示から除外する前に依然として弁護士のサインオフが必要です。not-privileged とマークされたドキュメントは、開示する前に依然として弁護士のスポットチェックが必要です。スキルがクリーンと言ったからといって特権文書を提供することは、いかなる信頼スコアも免れない過誤の責任を負います。
  • 非TierAのAIベンダー。 特権コンテンツは、コンシューマーティアのClaude、汎用チャットボット、ブラウザプラグイン、または未検証のSaaSラッパーを通じてルーティングできません。スキルは起動時に references/3-jurisdictional-tests.md の許可リストに対して設定されたエンドポイントをハードチェックし、エンドポイントがリストにない場合は実行を拒否します。基礎となるフレームワークについては法務チームのAIポリシーを参照してください。
  • 自動化された証拠開示判断。 リクエスト元の当事者へのドキュメントの開示を、スキルのアウトプットのみに基づいて行ってはなりません。証拠開示は完全なレコードに対する弁護士の判断です。
  • 社外弁護士との進行中の交渉のドラフト。 ほとんどの法律事務所のAIポリシーはライブのドラフトをAIツールから除外しています。実行済みおよびインバウンドのドキュメントで実行し、現在赤入れ中のものは対象外です。
  • OCRレイヤーのないスキャン画像のPDF。 スキルはドキュメントをNot-Privilegedとしてサイレントに分類するのではなく error: "ocr_required" でアボートします。OCRは別の上流の問題です。

セットアップ

  1. スキルをドロップします。 privilege-review-batch.skill をClaude CodeのスキルディレクトリまたはエンタープライズClaude テナントに配置します。スキルはバッチ全体を実行する単一のエントリポイントを公開します:process_batch(batch_path, metadata_csv, rubric_path, jurisdiction, prior_decisions_csv?, borderline_threshold?)
  2. ルーブリックを記入します。 references/1-privilege-rubric.md を編集して記入します:案件ID、有効な特権基準(attorney-clientwork-product、またはその両方)、社内および社外の弁護士カストディアンリスト(メールアドレス、小文字で本番メタデータに一致)、主題事項のスコープ、特権サークル(受信者ラインに特権を破ることなく含めることができる内部の人員)、案件固有の権利放棄の表示、該当する場合のwork-product訴訟予測日。
  3. ログフォーマットを選択します。 references/2-privilege-log-format.md を編集して、会場が要求するスキーマに一致させます(Federal Rule 26(b)(5)(A)がデフォルト。Delaware Court of ChanceryとSDNY/EDNYにはバリエーションがあります)。スキルはMarkdownでエントリをドラフトします。案件の証拠開示ツールが会場が要求するフォーマットにエクスポートします。
  4. 管轄区域を指定します。 references/3-jurisdictional-tests.md を編集して、案件の管轄区域が承認済みリスト(us-federalus-state-CAukeu は事前定義済み。弁護士のサインオフで他を追加)にあることを確認します。企業が承認したTierAのエンドポイントで ALLOWED_ENDPOINTS 許可リストを記入します。
  5. 弁護士がタグ付けしたサンプルでキャリブレーションします。 この案件または類似の案件で弁護士が以前にレビューした50〜100件のドキュメントを取得します。prior_decisions_csv として以前の決定を渡します。スキルを実行します。キャリブレーションレポート(メソッドのステップ4)を確認します:より広いアウトプットに頼る前に、合意が少なくとも90%であるべきです。低い場合はルーブリックを調整してください——通常は弁護士カストディアンリスト、主題事項のスコープ、または特権サークルがギャップです——そして繰り返します。
  6. バッチ全体を実行します。 エクスポートディレクトリを処理します。最初にボーダーラインキューをレビューし、次にサンプリングされた高信頼の判断をレビューし、次にドラフトログエントリを確定します。

スキルの実際の動作

バッチ内の各ドキュメントについて、4つの順序付きステップ:

  1. 2パスの抽出。 パスAはテキストを抽出し、段落インデックスを保持します。.eml.msg についてはMIMEツリーを解析し、添付ファイルの特権がカバーメールとは独立して評価できるよう、パートごとに1つのレコードを出力します。パスBはドキュメントをメタデータCSVの行に結合し、すべての当事者をルーブリックの弁護士カストディアンリスト(is_attorney: true | false | unknown)に対して解決します。メタデータ駆動の弁護士フラグを明示的な事前分類コンテキストとして表示することで、モデルがそれらをボディから騒々しく再導出することを防ぎ、テキスト抽出が失敗した場合のメタデータのみのフォールバックパスが存在します。
  2. 引用に基づく分類(ドキュメントあたり1パス)。 ドキュメントごとのプロンプトは、ルーブリックの特権基準、references/3-jurisdictional-tests.md の管轄区域のテスト、解決された当事者リスト、ドキュメントのテキストをエンコードします。Claudeは次を返します:分類、根拠(どのテストのプロングが発火したか)、エビデンス(引用座標付きの逐語的なスパン1〜3件)、信頼度、ボーダーラインの判断に対するオプションの concern フィールドで疑問を名指し。ドキュメントごとのプロンプト(1つのメガプロンプトではなく)で失敗のみをリトライでき、各コールのトークンをキャップし、幻覚を単一のレコードに隔離できます。
  3. ボーダーラインのルーティング。 最初一致のルール:閾値未満の信頼度。is_attorney: unknown とフラグされた当事者。特権サークル外の第三者の受信者。または設定された常時ルーティングパターンに一致するドキュメントタイプ。適切に調整されたルーブリックはボーダーライン率10〜20%を生成します。
  4. 特権セットのログエントリのドラフト。privileged ドキュメントについて、references/2-privilege-log-format.md のスキーマからログエントリをドラフトし、attorney_review_status フィールドを draft — pending attorney review にハードコードします。

ステップ2のハルシネーションガード:モデルが返したエビデンススパンのうち、ドキュメントパーツの部分文字列にバイト同一でないものは拒否され、ドキュメントは concern: "evidence_not_grounded" で強制的にボーダーラインキューに入れられます。自信に満ちているが架空のレコードを出力するのではなく。

コストの現実

Claude Sonnet 4.5のAnthropic API公開価格で、ドキュメントあたりのトークン消費は概算で:

  • インプット:ドキュメントあたり3,000〜15,000トークン(テキスト+パーツ+ルーブリック+管轄区域テスト)。長い契約と複数添付のメールは上限に近い。インプットトークン約$3/百万で、ドキュメントあたり$0.009〜$0.045。
  • アウトプット:ドキュメントあたり200〜600トークン(分類レコード+エビデンス+該当する場合のドラフトログエントリ)。アウトプットトークン約$15/百万で、ドキュメントあたり$0.003〜$0.009。

合計:プロンプトキャッシングの前でドキュメントあたり約$0.012〜$0.054。ルーブリックと管轄区域テスト(バッチ全体で一定)をプロンプトキャッシングすることで通常インプットコストが60〜80%削減されます——ルーブリックだけで1,500〜3,000トークンがあり、各ドキュメントで再請求されます。

キャッシングを使用したeDiscoveryスケールでは:

  • 5,000件のドキュメント:$30〜$120
  • 20,000件のドキュメント:$120〜$480
  • 100,000件のドキュメント:$600〜$2,400

コントラクト弁護士が1時間あたり30〜60件を審査する弁護士のみの最初のパスを、時給$400〜700で比較すると:20,000件のドキュメントは約333〜667弁護士時間、つまり純粋な審査労働で$133,000〜$467,000です。スキルは弁護士時間を排除しません——ボーダーラインのレビューと確定は残ります——しかし、判断を必要とするレコードに時間を集中させ、最初のパス対象バッチでの実現した審査スループット改善は通常4〜8倍です。

成功指標

時間の経過とともに注目すべき単一の数値:ボーダーラインキューの合意率——スキルがボーダーラインにルーティングしたドキュメントのうち、弁護士が最終的に高い確信をもって特権ありまたは特権なしと判断した割合。目標は約60〜80%。弁護士がほとんどのドキュメントをためらいなく privileged(または95%を not-privileged)に転換するキューは、スキルが自分で分類すべきだったキューです。ルーブリックまたは閾値を調整してください。すべてのドキュメントに長い審議が必要なキューは適切に調整されています。

バッチごとに追跡される二次指標:

  • 偽非特権率(スキルが not-privileged と言ったが弁護士が privileged と言った——証拠開示リスクのエラー)。目標1%未満。2%超は停止とチューニングのシグナルです。
  • 偽特権率(過大請求リスク、制裁の露出)。目標5%未満。10%超は停止とチューニングのシグナルです。
  • スループット — スキルが実行された後の弁護士1時間あたりのドキュメント数(ボーダーラインのレビューとログの確定作業を含む)。スキル実行前のベースラインは通常30〜60件/時間。スキル実行後はボーダーラインキューと確定作業で150〜300件/時間に達するべきです。

代替手段との比較

  • vs Relativity Active Learning。 Relativityの継続的なアクティブラーニングは、案件での弁護士のコーディング決定でトレーニングされたモデルを使用して、ドキュメントを応答性または特権の可能性でランク付けします。ランキングと優先順位付けに優れています。防御可能なドキュメントごとの説明の生成とログエントリのドラフトは弱いです。このスキルはドキュメントごとの引用に基づくレコードとドラフトログエントリを生成します——チームが監査証跡を必要とする場合やレビューキューではなくログがボトルネックの場合に有用です。両者は補完的であり、代替ではありません:Active Learningがキューをランク付けし、スキルがレコードとログをドラフトします。
  • vs EverlawのML特権検出。 Everlawと同様のプラットフォームは、このスキルが必要とする案件固有のルーブリックなしに機能する、広範な訴訟コーパスでトレーニングされた製品内の特権検出器を提供します。立ち上げは速いですが、案件固有のファクト(総合顧問のメールハンドル、この案件の特権サークル、スコープ内の特定の主題事項)では精度が低くなります。ルーブリック作成の意欲がなく、1回限りの小さな案件では、製品内の検出器が適切な選択です。ルーブリックが存在し、チームがログエントリのドラフトを必要とする案件では、このスキルがより案件に適したアウトプットを生成します。
  • vs 手動コントラクト弁護士の最初のパス。 歴史的なベースライン。信頼性が高く、防御可能で、上記のスケールではおよそ100〜1000倍高価です。スキルはコントラクト弁護士を置き換えません。コントラクト弁護士の時間を「すべてのドキュメントを見る」から「ボーダーラインキューを判断してログを確定する」にシフトします。これは実際に法的判断を必要とする作業です。

注意点

  • 特権の過大請求。 水増しされたログは強制提出の申し立てと制裁リスクを招きます。対策:prior_decisions_csv が提供された場合、スキルは弁護士の決定に対して false_privileged_rate を計算し、5%を超えたときに警告します。以前の決定がない場合、スキルはバッチが終了する前に弁護士のスポットチェックのために privileged の判断の10%をボーダーラインキューにサンプリングします。
  • 部分的な特権ドキュメント。 単一のメールは特権部分(法的アドバイスの段落)と非特権部分(転送されたビジネスアップデート)を含む可能性があります。ドキュメントを1回の判断として扱うことが失敗モードです。対策:抽出はMIMEパートごとに1つのレコードを出力します。分類はパートごとに実行されます。混合分類パーツを持つドキュメントは concern: "partial_privilege"redaction_required: true でボーダラインにルーティングされます。編集自体は弁護士の作業です。
  • work-productと弁護士クライアント特権の混同。 work-product主義は弁護士クライアント特権とは異なるものを保護します(訴訟予測、弁護士の精神的印象対機密の弁護士クライアント法的アドバイス)。work-productのテストはコミュニケーションに弁護士がいることを必要としません。対策:ルーブリックはどの基準が有効かを名指しします。アウトプットの basis フィールドはどのプロングが発火したかを名指しします。スキルがどの基準が適用されるかを解決できない場合、concern: "standard_resolution_required" でボーダラインにルーティングします。
  • 第三者受信者による権利放棄。 特権のある通信でクライアント以外の第三者をCCすることは一般的に特権を放棄します。対策:ボーダーラインルーターはすべての受信者をルーブリックの特権サークルに対してチェックし、外部受信者を持つドキュメントを concern フィールドに第三者を名指した状態でボーダーラインにルーティングします。弁護士はレビューで共通利益の例外または類似の主義を適用できます。
  • TierAベンダーの強制。 未承認のAIエンドポイントを通じて特権ドキュメントをルーティングすると特権が放棄される可能性があります。対策:スキルの起動フックは references/3-jurisdictional-tests.md から ALLOWED_ENDPOINTS 許可リストを読み取り、設定されたエンドポイントがリストにない場合は実行を拒否します。許可リストの所有者はAIポリシーに名指しされています。変更にはサインオフが必要です。
  • 裁判所の開示規範の違反。 AI支援の特権審査はますます受け入れられていますが、会場固有の開示義務が存在します(一部の裁判官は証拠開示プロトコルにAI方法論の説明を期待しています)。争われた案件でスキルに依存する前にローカルの弁護士に確認してください。

スタック

Files in this artifact

Download all (.zip)