Виктория Гусакова Опубликована 27.09.2024 в 23:54

Испанские учёные доказали, что новые версии языковых моделей скрывают свои ошибки, предпочитая угадать ответ

Исследование: сложные ИИ-модели реже признают свои ошибки

Группа учёных из Политехнического университета Валенсии в Испании провела исследование, результаты которого были опубликованы в журнале Nature. Оно показало интересную закономерность: по мере увеличения размера и сложности языковых моделей (LLM) они становятся менее склонными признавать собственную неосведомлённость. Это исследование возникло на фоне растущей популярности подобных технологий, которые сейчас используются для самых разных задач — от написания стихов до решения сложных математических уравнений.

Учёные решили выяснить, насколько точными становятся LLM с каждым обновлением и как они реагируют в случае ошибки. Для оценки точности модели были протестированы с помощью тысяч вопросов, охватывающих такие темы, как математика, наука, анаграммы и география. В ходе эксперимента исследователи обнаружили общую тенденцию к улучшению точности языковых моделей с каждым новым обновлением. Однако, когда вопросы становились более сложными, точность ответов снижалась. Кроме того, учёные отметили важную особенность: более новые версии LLM реже признавали свою неосведомлённость и чаще предполагали ответ. Это приводило как к большему количеству правильных, так и к большему числу ошибочных ответов.

Ещё одной проблемой, выявленной в ходе исследования, стала неспособность большинства пользователей различить правильные и неправильные ответы, предоставленные языковыми моделями.

Фото: flickr.com/Mike MacKenzie (CC BY 2.0 license)

Автор Виктория Гусакова
Виктория Гусакова — журналист, корреспондент новостной службы Ньюсинфо

Подписывайтесь на NewsInfo.Ru

Читайте также

Чип толщиной с волос встроили в текстильное волокно — Nature сегодня в 8:25
Компьютер толщиной с волос спрятали в нить: одежда начала выполнять то, что раньше делал процессор

Учёные создали оптоволоконный чип толщиной с волос, который можно вплетать в ткань. Разработка открывает путь к умной одежде и новым медицинским технологиям.

Читать полностью »
Эксперимент показал что материя после взрыва вела себя как жидкость — MIT сегодня в 5:29
Вселенная начиналась не со звёзд, а с кипящего супа: пространство дрожало от скрытой силы

Учёные получили прямые доказательства того, что первичная материя Вселенной вела себя как жидкость и реагировала на движение кварков в экстремальных условиях.

Читать полностью »
Китай увеличил рынок искусственного интеллекта до 170 млрд долларов — аналитики вчера в 20:25
ИИ с человеческим лицом и железной логикой: Китай делает ставку на то, что работает здесь и сейчас

Китай ускоряет внедрение искусственного интеллекта: от гуманоидных роботов и дешёвых моделей до собственных чипов и масштабной господдержки.

Читать полностью »
Фрагменты звёздного каталога Гиппарха обнаружили в палимпсесте — учёные вчера в 20:10
Историю науки пытались стереть: рентген вытащил из рукописи карту звёзд, пережившую века забвения

Учёные с помощью рентгеновских лучей обнаружили скрытые фрагменты древней звёздной карты Гиппарха в палимпсесте, пролежавшем в монастыре сотни лет.

Читать полностью »
То, что раньше охлаждали и выбрасывали, теперь думает само: тепло внутри чипов взяли на работу вчера в 18:28

Учёные MIT показали, что избыточное тепло микрочипов можно использовать для вычислений с точностью более 99 %, меняя подход к энергоэффективным технологиям.

Читать полностью »
Луна может вспыхнуть ярче Юпитера: сценарий удара 2024 YR4 в декабре 2032-го вчера в 15:31

JWST и глобальная сеть телескопов исключили падение 2024 YR4 на Землю, но повысили вероятность удара по Луне до 4,3% — окончательный вердикт к 2028 году.

Читать полностью »
Полёт за пределы Земли оказался опасным экспериментом: с мозгом произошло нечто странное вчера в 11:57

Учёные выяснили, что длительные космические полёты меняют форму мозга астронавтов. Новые данные поднимают важные вопросы о безопасности миссий на Луну и Марс.

Читать полностью »
Красная планета сбивает часы: микросекунды, которые могут разбить посадочный модуль вчера в 10:06

Микросекундные сдвиги между земными и марсианскими секундами влияют на посадки и связь; учёные предлагают орбитальную сеть часов с релятивистскими поправками.

Читать полностью »