Éditeur sous le feu après la découverte de citations « fausses » dans un guide d’éthique de l’IA
Un des plus grands éditeurs académiques au monde commercialise un livre sur l’éthique de la recherche en intelligence artificielle qui semble être truffé de citations fictives, y compris des références à des revues qui n’existent pas.
Contexte de la publication académique
La publication académique a récemment été critiquée pour avoir accepté des articles frauduleux produits à l’aide de l’IA, qui ont réussi à passer par un processus de révision par les pairs censé garantir des normes élevées.
Le Times a découvert qu’un livre récemment publié par le géant germano-britannique Springer Nature contient des dizaines de citations qui semblent avoir été inventées, un signe souvent révélateur de matériel généré par l’IA.
Le livre en question
Le livre intitulé Aspects sociaux, éthiques et juridiques de l’IA générative est présenté comme une revue autoritaire des dilemmes éthiques posés par la technologie et est en vente pour 125 £.
Au moins deux chapitres incluent des notes de bas de page qui citent des publications scientifiques apparemment inventées. Dans un chapitre, 8 des 10 citations n’ont pas pu être vérifiées, suggérant que 80 % pourraient avoir été fabriquées.
Préoccupations croissantes dans le milieu académique
Il y a une inquiétude croissante au sein de l’académie concernant les citations et même des articles de recherche entiers générés par des outils d’IA qui tentent d’imiter le véritable travail académique.
En avril, Springer Nature a retiré un autre titre technologique, Maîtriser l’apprentissage automatique : des bases à l’avancé, après avoir constaté qu’il contenait de nombreuses références fictives.
Analyse des citations
Dans le livre analysé par le Times, une citation prétend faire référence à un article publié dans le « Harvard AI Journal ». La Harvard Business Review a déclaré qu’aucune revue de ce type n’existe.
Guillaume Cabanac, professeur associé en informatique à l’Université de Toulouse et expert en détection d’articles académiques falsifiés, a analysé deux chapitres à l’aide de BibCheck, un outil conçu pour identifier les références fabriquées.
Il a trouvé qu’au moins 11 des 21 citations dans le premier chapitre ne pouvaient être associées à des articles académiques connus. L’analyse a également suggéré que 8 des 10 citations dans le chapitre 4 étaient introuvables.
Conséquences de la falsification
Cabanac a déclaré : « C’est une mauvaise conduite en recherche : falsification et fabrication de références. » Il suit de tels cas et a constaté une augmentation régulière des citations « hallucinées » par l’IA dans la littérature académique.
Il a ajouté : « Les chercheurs construisent des connaissances en s’appuyant sur des recherches précédemment publiées. Lorsque ces études sont fragiles ou pourries, nous ne pouvons rien construire de solide dessus. »
Réactions des experts
Une autre revue réalisée par le Dr Nathan Camp de l’Université d’État du Nouveau-Mexique a abouti à des conclusions similaires. Camp, qui a étudié l’augmentation des citations générées par l’IA, a trouvé de nombreuses références erronées, mal assorties ou totalement inventées dans le livre d’éthique de l’IA.
Dans certains cas, les détails de différents articles authentiques semblaient avoir été combinés. Six chapitres apparaissaient cependant comme étant précis. Chaque chapitre a été écrit par un ensemble différent d’auteurs.
Engagement de l’éditeur
James Finlay, vice-président des livres de sciences appliquées chez Springer Nature, a déclaré : « Nous prenons très au sérieux toute préoccupation concernant l’intégrité du contenu que nous publions. Notre équipe spécialisée en intégrité de la recherche enquête sur ce cas en priorité. »
Il a ajouté : « Notre équipe d’intégrité travaille avec des éditeurs et utilise une expertise spécialisée ainsi que des outils de détection pour maintenir nos normes et repérer tout problème d’intégrité à l’avance. Un petit nombre, cependant, peut passer à travers. »
