Scandale des citations fictives dans un guide éthique sur l’IA

Éditeur sous le feu après la découverte de citations « fausses » dans un guide d’éthique de l’IA

Un des plus grands éditeurs académiques au monde a publié un livre sur l’éthique de la recherche en intelligence artificielle qui semble être truffé de citations fictives, y compris des références à des revues qui n’existent pas.

Critiques de l’édition académique

La publication académique a récemment été critiquée pour avoir accepté des articles frauduleux produits par l’IA, qui ont réussi à passer par un processus de révision par les pairs censé garantir des normes élevées.

Le Times a découvert qu’un livre récemment publié par le géant éditorial germano-britannique Springer Nature comprend des dizaines de citations qui semblent avoir été inventées — un signe, souvent, de matériel généré par l’IA.

Le livre en question

Le livre — Aspects sociaux, éthiques et juridiques de l’IA générative — est annoncé comme un examen autoritaire des dilemmes éthiques posés par la technologie et est en vente pour 125 £. Au moins deux chapitres incluent des notes de bas de page qui citent des publications scientifiques qui semblent avoir été inventées.

Dans un chapitre, 8 des 10 citations n’ont pas pu être vérifiées, ce qui suggère que 80 % pourraient avoir été fabriquées.

Préoccupations croissantes dans le milieu académique

Il existe une préoccupation croissante au sein du milieu académique concernant les citations et même des articles de recherche entiers générés par des outils d’IA qui tentent de mimer un travail académique authentique.

En avril, Springer Nature a retiré un autre titre technologique — Mastering Machine Learning: From Basics to Advanced — après qu’il ait été constaté qu’il contenait de nombreuses références fictives.

Analyse des citations

Dans le livre récemment analysé par le Times, une citation prétend se référer à un article publié dans le Harvard AI Journal. La Harvard Business Review a déclaré qu’aucune revue de ce type n’existe.

Guillaume Cabanac, professeur associé en informatique à l’Université de Toulouse et expert dans la détection d’articles académiques faux, a analysé deux chapitres à l’aide de BibCheck, un outil conçu pour identifier les références fabriquées.

Il a constaté qu’au moins 11 des 21 citations dans le premier chapitre ne pouvaient pas être associées à des articles académiques connus. L’analyse a également suggéré que 8 des 10 citations dans le chapitre 4 étaient introuvables.

Recherche inappropriée

« C’est une fraude de recherche : falsification et fabrication de références », a déclaré Cabanac. Il suit de tels cas et affirme avoir observé une augmentation constante des citations « hallucinées par l’IA » dans la littérature académique.

Il a ajouté : « Les chercheurs construisent des connaissances en s’appuyant sur des recherches publiées auparavant… Lorsque [ces études] sont fragiles ou pourries, nous ne pouvons rien construire de robuste par-dessus. »

Conclusion et réaction de l’éditeur

Une revue séparée menée par le Dr Nathan Camp de l’Université de l’État du Nouveau-Mexique a abouti à des conclusions similaires. Camp, qui a étudié l’augmentation des citations générées par l’IA, a trouvé de nombreuses références erronées, mal assorties ou entièrement inventées dans le livre sur l’éthique de l’IA.

James Finlay, vice-président des livres de sciences appliquées chez Springer Nature, a déclaré : « Nous prenons très au sérieux toute préoccupation concernant l’intégrité de notre contenu publié. Notre équipe spécialisée en intégrité de la recherche enquête sur ce cas en priorité. »

Il a ajouté : « Notre équipe d’intégrité travaille avec des éditeurs et utilise une expertise spécialisée et des outils de détection pour maintenir nos normes et détecter tout problème d’intégrité à l’avance. Un petit nombre, cependant, peut passer à travers. »