- Исследование, опубликованное в журнале Nature 4 февраля 2026 года, показывает, что чат-бот OpenScholar может превосходить докторов наук (PhD) и постдоков в написании обзоров научной литературы.
- OpenScholar был разработан американскими учеными для устранения проблемы «галлюцинаций», часто встречающихся у таких LLM, как ChatGPT или Llama, при цитировании исследований.
- Эксперты в области компьютерных наук, физики, нейробиологии и биомедицины сравнили обзоры, написанные OpenScholar, ScholarQABench и аспирантами.
- Результаты показали, что OpenScholar предпочли в 51% случаев, а ScholarQABench — в 70%, что значительно выше показателей работ, написанных людьми.
- Главное преимущество заключается в полноте и глубине информации: обзоры OpenScholar содержат в среднем 1447 слов (или 706 слов) против 424 слов у человека.
- Аннотации, созданные ChatGPT, предпочли лишь в 31% случаев из-за недостаточного охвата содержания.
- Исследование указывает, что популярные LLM генерируют фальшивые цитаты в 78–90% случаев, а 78–98% названий документов являются вымышленными, что особенно критично в биомедицине.
- Напротив, у OpenScholar не было зафиксировано галлюцинаций в обзорах по компьютерным наукам и биомедицине.
- Модель OpenScholar 8B была обучена на 45 миллионах научных статей, создавая цикл самосовершенствования точности цитирования.
- С момента запуска демо-версии у OpenScholar появилось более 30 000 пользователей и почти 90 000 запросов; стоимость одного обзора составляет всего 0,01–0,05 доллара США.
📌 Заключение: Исследование в Nature (4.02.2026) подтверждает, что чат-бот OpenScholar (8 млрд параметров), обученный на 45 млн статей, пишет обзоры лучше докторов наук. Преимущество — в глубине информации (до 1447 слов против 424 у людей). В то время как обычные LLM выдумывают цитаты в 78–90% случаев, OpenScholar продемонстрировал полное отсутствие галлюцинаций в ключевых научных сферах.
