Une vulnérabilité inquiétante dans les modèles de langage IA
Une équipe de recherche de Microsoft a découvert une vulnérabilité préoccupante dans les modèles de langage IA : les protections de sécurité peuvent être contournées par un seul prompt utilisant une technique inversant la méthodologie d’entraînement sécuritaire.
