Découverte de données générées par l’IA : enjeux juridiques pour les entreprises en 2026

Litigation Minute : Le contenu généré par l’IA est-il découvrable ? Ce que les entreprises doivent savoir en 2026

Les outils d’intelligence artificielle transforment rapidement la manière dont les données électroniques (ESI) sont créées et stockées, en particulier en ce qui concerne le contenu généré par des modèles de langage de grande taille. À mesure que les entreprises adoptent des outils d’IA générative (GenAI) pour la rédaction, le résumé, l’analyse et d’autres usages commerciaux, les tribunaux s’interrogent sur la question de savoir si les données GenAI telles que les prompts (ce qu’un utilisateur tape), les sorties (ce que l’outil d’IA génère) et les logs d’activité (données sur quand et comment les outils ont été utilisés) entrent dans le cadre des obligations de découverte traditionnelles.

Les règles traditionnelles de découverte régissent toujours les données non traditionnelles

Selon le FRCP 26(b)(1), les parties peuvent obtenir la découverte de matériel non privilégié qui est pertinent et proportionnel aux besoins de l’affaire. Les tribunaux ont clairement établi que les nouvelles formes d’ESI ne sont pas exemptées simplement parce qu’elles sont nouvelles. Les principes traditionnels de découverte s’appliquent également aux sources émergentes d’ESI, y compris les données GenAI.

Décisions clés sur la découvrabilité des données GenAI

Le jugement le plus marquant à ce jour concernant la découvrabilité des données GenAI est In re OpenAI, Inc., Copyright Infringement Litigation, où la juge magistrate Ona Wang a ordonné la production de millions de logs GenAI, y compris des prompts utilisateurs et des réponses des modèles, à condition que les références utilisateurs soient anonymisées. Le tribunal a conclu que ces logs étaient pertinents et proportionnels aux revendications des plaignants selon lesquelles les systèmes d’IA du défendeur reproduisaient des œuvres protégées par le droit d’auteur dans leurs sorties. La décision a souligné que les préoccupations en matière de confidentialité peuvent être atténuées par l’anonymisation et des ordonnances de protection, et ne barrent pas catégoriquement la production des sorties de l’IA.

Dans un jugement séparé dans le même litige, la juge Wang a refusé une motion pour contraindre le New York Times à produire du contenu provenant de ses outils d’IA internes, considérant que la demande était à la fois irrelevante et disproportionnée. Le New York Times a soutenu que l’examen d’environ 80 000 entrées prendrait plus de 1 300 heures, ce qui représente un fardeau substantiel compte tenu de la connexion limitée des données aux enjeux.

La pertinence et la proportionnalité demeurent essentielles

Ces jugements soulignent deux concepts clés de la découverte :

  • Pertinence : Les données GenAI sont découvrables lorsqu’elles sont liées à une revendication ou à une défense.
  • Proportionalité : Même des volumes massifs de données GenAI peuvent être découvrables lorsqu’ils sont justifiés par les besoins de l’affaire, mais la proportionnalité reste une enquête très pertinente.

GenAI et e-découverte en pratique

Étant donné le rôle en évolution rapide de GenAI dans tous les aspects de la vie quotidienne, les parties doivent être bien préparées à y faire face lors de la découverte. Il est rarement raisonnable ou proportionné de conserver toutes les données GenAI ; développer une approche défendable qui soit ciblée, raisonnée et bien documentée est crucial dès les premières étapes de l’engagement.

Identifier les données GenAI pertinentes

Déterminer si des conservateurs de données potentiellement pertinentes utilisent des outils GenAI, comment les outils sont utilisés, et où les prompts et les sorties sont stockés. Gardez à l’esprit que des logs d’activité pertinents peuvent exister séparément, y compris sur des plateformes tierces.

Préserver ce qui est potentiellement pertinent

Lorsque des litiges sont anticipés, préservez les données GenAI qui sont liées à des revendications ou à des défenses, en particulier lorsque les données GenAI peuvent contenir des assertions factuelles ou du contenu substantiel. Les étapes varient selon la plateforme, mais peuvent inclure la désactivation des paramètres de suppression automatique, l’exportation des historiques de discussion, la sauvegarde d’échanges clés dans des dépôts de documents, et la coordination avec le service informatique pour comprendre la conservation des logs et des métadonnées. Les conservateurs ne doivent pas modifier ou copier sélectivement les données GenAI de manière à altérer le contexte et doivent divulguer l’utilisation d’outils personnels ou basés sur un navigateur afin que ces sources puissent être évaluées. Les mesures de préservation spécifiques dépendront de l’affaire et des systèmes utilisés ; les avocats doivent être préparés à superviser les efforts de préservation et à fournir des instructions aux conservateurs et au service informatique lors du processus de conservation juridique.

Négocier le champ d’application tôt

Si des données GenAI sont impliquées, abordez la pertinence et la proportionnalité dans les protocoles ESI et lors des discussions de rencontre préliminaire. Des définitions claires et des limites ciblées peuvent prévenir des fouilles abusives et réduire les coûts et les charges.

Aborder la confidentialité

Prendre les préoccupations liées à la vie privée au sérieux. Lorsque cela est possible, utilisez des ordonnances de protection et des protocoles d’anonymisation pour gérer les informations sensibles tout en respectant les obligations de découverte.

Mettre à jour la gouvernance de l’information

Intégrer les données GenAI dans les inventaires ESI, les procédures de conservation juridique et les politiques de rétention pour améliorer la préparation à la découverte. Des politiques spécifiques à l’IA concernant l’utilisation acceptable et la confidentialité des données doivent également être envisagées.

Conclusion

La découvrabilité des données GenAI devient rapidement une question centrale dans l’e-découverte. Les tribunaux ne créent pas d’exemptions pour les données GenAI ; les principes traditionnels de découverte s’appliquent toujours. Lorsque les données GenAI sont au cœur d’un litige, elles seront probablement découvrables, mais la proportionnalité reste une limite significative. Les entreprises et leurs équipes de litige doivent traiter les données GenAI dès le début de la planification de la découverte, travailler en étroite collaboration avec des spécialistes de l’e-découverte pour minimiser le fardeau, et gérer proactivement les préoccupations relatives à la vie privée.

Restez à l’écoute pour un prochain Litigation Minute sur l’intersection des données GenAI avec le privilège avocat-client et la doctrine du produit du travail.

Scroll to Top