- Une étude publiée dans Nature le 4 février 2026 montre que le chatbot OpenScholar peut surpasser les docteurs (PhD) et les postdocs dans la rédaction de revues de littérature scientifique.
- OpenScholar a été conçu par des universitaires américains pour corriger le phénomène d’« hallucinations » courant chez les LLM comme ChatGPT ou Llama lors de la citation de documents de recherche.
- Des experts en informatique, physique, neurosciences et biomédecine ont comparé des revues rédigées par OpenScholar, ScholarQABench et des doctorants.
- Les résultats montrent qu’OpenScholar a été préféré dans 51 % des cas, et ScholarQABench a atteint 70 %, soit nettement plus que les articles écrits par des docteurs.
- L’avantage principal réside dans la couverture et la profondeur des informations, avec des revues d’une longueur moyenne de 1 447 mots (OpenScholar) ou 706 mots, contre 424 mots pour les humains.
- Les résumés générés par ChatGPT n’ont été préférés que dans 31 % des cas en raison d’un manque d’exhaustivité.
- L’étude souligne que les LLM populaires génèrent de fausses citations dans 78 à 90 % des cas, et que 78 à 98 % des titres de documents sont inventés, un problème particulièrement grave en biomédecine.
- À l’inverse, OpenScholar n’a enregistré aucune hallucination dans les revues d’informatique et de biomédecine.
- Le modèle 8B d’OpenScholar a été entraîné sur 45 millions d’articles scientifiques, créant une boucle de rétroaction auto-améliorée pour la précision des citations.
- Depuis le lancement de la démo, OpenScholar compte plus de 30 000 utilisateurs et près de 90 000 requêtes ; le coût par revue varie seulement de 0,01 USD à 0,05 USD.
📌 Conclusion : Une étude parue dans Nature (4 fév. 2026) révèle que le chatbot OpenScholar, avec seulement 8 milliards de paramètres et entraîné sur 45 millions d’articles, surpasse les docteurs et postdocs en synthèse scientifique. Sa force réside dans la profondeur (1 447 mots vs 424 pour l’humain). Alors que les LLM classiques inventent des citations dans 78 à 90 % des cas, OpenScholar affiche zéro hallucination en informatique et biomédecine.

