Проблема галлюцинаций, то есть заведомо неверных ответов, которые предоставляют ИИ-модели, по-прежнему актуальна. Хотя ИИ-инструменты стали делать это реже, они всё ещё выдают неточные ответы, при этом подкрепляя их сверхубедительной риторикой, пишет Axios.

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Обзор Intel Core Ultra 5 250K Plus, или Как Arrow Lake превратился в «топ за свои деньги»

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Компьютер месяца — май 2026 года

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Обзор Apple MacBook Neo: удивительно хороший ноутбук с процессором от iPhone

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

72 полёта над Марсом: как Ingenuity пережил зиму, сбои и собственную миссию

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Линия защиты: обзор виртуальных машин и песочниц для Android

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

От Ryzen 7 1800X до Ryzen 7 9850X3D: девять лет эволюции AMD в одном тесте

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены

ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду

Ложные ответы гораздо сложнее распознать, когда они звучат убедительно. Это растущая проблема, поскольку пользователи всё больше полагаются на ИИ для исследований, медицинских консультаций и других задач.

Исследование Йельской медицинской школы, проведенное в этом месяце, показало, что инструменты для ведения записей с помощью ИИ (ИИ-писцы) могут помочь в медицинской практике, но только в сочетании с профессиональными рецензентами. Участвовавшие в опросе студенты первого курса, которые редактировали свои клинические записи с помощью черновиков, сгенерированных ИИ, отметили, что в записях ИИ часто опускались важные детали, включая продолжительность симптомов. По словам двух третей студентов, эти записи были «полезны в качестве первого черновика», но 21 % отметили, что использование ИИ-писцов «может снизить способность научиться делать хорошие записи».

Согласно исследованию Гарвардского университета, при попытке специалистов Boston Consulting Group выявить ошибки в результатах работы ИИ модель реагировала не раскаянием и исправлением, а «бомбардировкой убеждением», прибегая к различным методам и даже к лести.

Компании в сфере ИИ пытаются уменьшить количество ложных ответов с помощью таких технологий, как генерация с дополненной информацией (RAG), или обоснование ответов релевантными документами и данными, но это всё равно не даёт 100-процентной точности.

В свою очередь, проверка результатов работы ИИ может занять время, сэкономленное при использовании ИИ-инструментов. Как показало опубликованное в марте исследование, сотрудники часто пренебрегают проверкой результатов, сгенерированных ИИ, поскольку мало кто обращает внимание на ошибки.