L'IA de Google ne sait pas épeler Google (ni rien d'autre)
Original : Why Google’s AI can’t spell Google (or anything else)
Pourquoi c'est important
Révèle les faiblesses fondamentales des LLM dans le traitement du langage
L'IA Overviews de Google présente des erreurs d'orthographe basiques, prétendant qu'il y a deux P dans 'Google' et un R dans 'poop'. Ces défaillances illustrent les limitations des LLM qui traitent le texte en tokens plutôt qu'en lettres.
L'IA Overviews de Google génère des erreurs d'orthographe embarrassantes, affirmant qu'il y a deux P dans 'Google' et un R dans 'poop'. Le système épelle mal 'journalism' (j-o-u-r-n-a-d-i-s-m) et le nom du président américain (t-r-p-u-m). Google reconnaît que 'compter dans les mots est un défi connu pour les LLM' et travaille sur une solution. Ces modèles d'IA, basés sur l'architecture transformer, ne 'lisent' pas le texte comme les humains mais le convertissent en représentations numériques via des tokens. Cette limitation fondamentale explique pourquoi les LLM excellent dans le code et les mathématiques mais échouent sur l'orthographe élémentaire.