Différence entre langage éthique et compétence morale en IA

IBM met en évidence la différence entre le langage éthique et la compétence morale dans l’IA

IBM souligne une distinction cruciale entre une intelligence artificielle qui semble éthique et une IA qui démontre un véritable raisonnement moral, une différence ayant des implications significatives pour les applications de plus en plus complexes de cette technologie.

Une imitation de l’éthique

Des études récentes de Google DeepMind et Anthropic suggèrent que les grands modèles de langage peuvent imiter de manière convaincante un langage éthique sans posséder de compétence morale réelle ; ces systèmes excellent à identifier des modèles statistiques dans les textes, plutôt qu’à engager un jugement éthique raisonné. Phaedra Boinodiris, leader mondial de l’IA fiable chez IBM, déclare : “Un système qui semble éthique n’est pas le même qu’un système qui raisonne éthiquement.”

Analyse des conversations

Les chercheurs ont analysé plus de 300 000 conversations avec le chatbot Claude d’Anthropic, identifiant 3 307 valeurs distinctes exprimées. Ils ont constaté que le modèle reflétait largement les valeurs des utilisateurs, soulevant des inquiétudes quant à l’utilisation de ce qui a été qualifié par un expert de “fonction d’autocomplétion très coûteuse” dans des décisions critiques.

Les limites des modèles de langage

Bien que les modèles de langage génèrent désormais des textes qui semblent aborder des dilemmes éthiques complexes, des recherches émergentes indiquent que cette capacité découle de prédictions statistiques plutôt que d’un véritable raisonnement moral. Un nouvel appel à des métriques d’évaluation axées sur la “compétence morale” émerge, soulignant la nécessité de différencier entre un discours éthique convaincant et une véritable éthique.

Les préoccupations éthiques

La tendance des systèmes comme ChatGPT et Claude à prédire le mot suivant le plus probable à partir de vastes ensembles de données textuelles et de code soulève des questions critiques sur la délégation de décisions morales à des systèmes construits sur des sous-ensembles de données déterminées statistiquement. Alors que les chatbots peuvent articuler des principes d’honnêteté et de transparence, des enquêtes récentes suggèrent que cette fluidité peut découler de la reconnaissance de motifs plutôt que d’une véritable délibération éthique.

Vers une évaluation plus rigoureuse

Les chercheurs de Google DeepMind plaident désormais pour de nouvelles méthodes d’évaluation de l’intelligence artificielle, shiftant l’accent de la simple génération de réponses éthiquement sonores à la démonstration d’une réelle “compétence morale“. Cette demande pour des tests plus rigoureux découle des preuves croissantes que les modèles de langage excellents imitent un discours éthique sans posséder de véritables capacités de raisonnement moral.

Conclusion

Le défi croissant posé par la sophistication des modèles de langage est que, bien qu’ils puissent générer des textes alignés éthiquement, ces systèmes peuvent manquer de véritables capacités de raisonnement moral, soulevant des préoccupations quant à leur déploiement dans des processus décisionnels critiques. La nécessité de systèmes capables de formaliser des règles éthiques devient de plus en plus évidente.