Les grands modèles de langage (LLM), comme ChatGPT d’OpenAI, présentent des capacités impressionnantes mais aussi des comportements difficiles à prédire, similaires à ceux du cerveau humain. Les recherches menées par une équipe spécialisée ont révélé des erreurs de raisonnement dans ces modèles, souvent dues à des biais cognitifs similaires à ceux des humains. Les tests ont montré que les versions plus anciennes des LLM avaient des performances limitées, tandis que les modèles plus récents comme GPT-4 surpassaient parfois les capacités humaines. Cependant, la variabilité des performances et les changements non documentés dans les modèles soulignent la nécessité de recherches sur des modèles ouverts et transparents pour garantir la reproductibilité et la compréhension des mécanismes sous-jacents.
Les modèles de langage sont des modèles d’intelligence artificielle qui sont capables de comprendre et de générer du langage humain. Schématiquement parlant, les modèles de langage sont capables de prédire, en fonction du contexte, les mots qui ont la plus grande probabilité de figurer dans une phrase.