Le déclin des capacités cognitives est une réalité à laquelle l’humain est habitué. Mais lorsqu’il s’agit de machines, cette idée semble presque contre-intuitive. Pourtant, les dernières analyses révèlent que l’intelligence artificielle (IA) pourrait, avec le temps, montrer des signes similaires à la démence humaine. Ce constat soulève des questions sur la fiabilité et l’efficacité à long terme des outils d’IA que nous utilisons au quotidien.
Une étude publiée dans The BMJ s’est penchée sur cette problématique, analysant différentes versions de chatbots populaires. Les conclusions ? Leurs performances déclinent avec le temps, de la même manière que celles des personnes âgées passant des tests cognitifs.
Des tests cognitifs adaptés aux IA
Pour mener cette recherche, les scientifiques ont soumis plusieurs modèles d’IA de pointe – ChatGPT 4 et 4o, Claude 3.5 Sonnet et Gemini 1 et 1.5, au test MoCA (Montreal Cognitive Assessment). Utilisé pour détecter des troubles cognitifs précoces chez l’humain, ce test évalue des fonctions comme la mémoire, l’attention, le langage et les capacités visuo-spatiales.
Un score maximal de 30 est possible, et un résultat de 26 ou plus est considéré comme normal. Parmi les modèles testés :
- ChatGPT 4o a obtenu 26 sur 30, le meilleur score.
- Claude 3.5 Sonnet et ChatGPT 4 ont suivi avec 25 sur 30.
- Gemini 1.0, en revanche, n’a récolté que 16 points.
Les chercheurs ont noté des lacunes marquées dans les tâches visuo-spatiales et les exercices pratiques, comme l’indication de l’heure sur une horloge.
Des failles similaires à celles des humains vieillissants
Si l’IA excelle dans de nombreux domaines, les tests visuels et spatiaux restent un point faible. Des difficultés sont également apparues dans l’interprétation de scènes complexes et la démonstration d’empathie.
Ces observations suggèrent que, tout comme les humains, les outils d’IA peuvent rencontrer des obstacles en matière d’abstraction visuelle et de fonctions exécutives avec le temps. Ce phénomène pourrait, à terme, influencer leur performance et leur utilité dans des environnements exigeants.
Maxime Lefèvre : Rédacteur, passionné de high-tech et de gaming, fan de science-fiction et amateur de bon café.