Leurs travaux s’attaquent à un enjeu central des grands modèles de langage : les erreurs, biais et “hallucinations”, c’est-à-dire la génération d’informations incorrectes ou inventées.
Plutôt que de chercher à comprendre entièrement le fonctionnement interne des modèles, l’équipe du Technion propose une méthode plus pragmatique : analyser leurs calculs internes afin de détecter rapidement des signaux de défaillance, sans avoir à décoder l’ensemble du système.
Cette approche permet de mieux surveiller le comportement des modèles, d’anticiper certaines erreurs et de renforcer leur fiabilité dans des usages critiques comme la médecine, l’éducation ou la recherche.
Les travaux ont déjà été validés par l’acceptation de trois publications dans des conférences internationales majeures (ICLR 2026, NeurIPS 2025 et AAAI 2026), confirmant leur portée scientifique.
Recevez les actualités du Technion France
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form




