Les erreurs de données mettant en péril les projets d’IA
La montée rapide de l’IA dans les services financiers a mis en évidence un vieux précepte informatique : “garbage in/garbage out”. Malgré les promesses extraordinaires de l’apprentissage automatique et des modèles de langage de grande taille (LLM), leur efficacité dépend en fin de compte de la qualité et de la pertinence des données sur lesquelles ils s’appuient.
À mesure que les organisations s’engagent davantage dans l’adoption de l’IA, ce principe fondamental devient de plus en plus difficile à ignorer. La qualité des données est considérée comme le facteur déterminant de tout programme d’IA réussi.
La qualité des données comme facteur clé
Pour garantir précision, pertinence et insights supérieurs, il est crucial que les solutions d’IA soient formées sur des ensembles de données spécifiques à l’industrie. Par exemple, dans le secteur de l’assurance, il est essentiel que les données incluent la terminologie et les concepts adaptés. Pour les entreprises de FinTech offrant des services financiers traditionnels de manière innovante, comme la banque numérique, les ensembles de données doivent aussi inclure des termes et concepts nouveaux.
Pour les entreprises opérant dans plusieurs pays, des taxonomies et ontologies peuvent aider à structurer et catégoriser les données afin d’assurer leur application cohérente. La meilleure approche consiste à développer des cas d’utilisation spécifiques aux clients et à définir les données pertinentes pour examen et approbation.
Croissance du scepticisme face à l’IA
Avec une prise de conscience croissante des limites de l’IA, le scepticisme a également augmenté. Les modèles formés sur des données défectueuses ou mal organisées sont plus susceptibles d’échouer. Même l’Institut des ingénieurs électriciens et électroniciens (IEEE) a exprimé des préoccupations, soulignant que l’augmentation de la taille d’un modèle ne garantit pas de meilleures performances.
Une grande partie de cette instabilité provient d’ensembles de données énormes que les développeurs ne peuvent pas entièrement comprendre ou valider. Par conséquent, améliorer la gouvernance des données est essentiel pour le succès de l’IA.
La nécessité d’une gouvernance des données efficace
Pour fonctionner correctement, les systèmes d’IA nécessitent des données structurées, propres et à jour. Cela pousse les organisations à moderniser leurs cadres de gouvernance des données, afin de soutenir à la fois les informations structurées et non structurées. Les programmes de gouvernance existants doivent évoluer pour gérer les vastes volumes de données dont l’IA dépend.
Les programmes de gouvernance d’aujourd’hui appliquent des rôles, des procédures et des outils pour certaines données structurées au sein de l’entreprise. Cependant, les modèles d’IA apprennent à partir de très grands ensembles de données, contenant des données structurées et non structurées, qui doivent toutes être de bonne qualité.
Conclusion
AscentAI a construit son approche sur ce principe, en appliquant une gouvernance stricte à tous les processus d’IA et d’apprentissage automatique. L’entreprise utilise 10 couches de redondance, y compris des revues automatisées et humaines, pour garantir l’exactitude des données. En fin de compte, des données de haute qualité, fiables et structurées sont au cœur d’un déploiement responsable et efficace de l’IA.
