Помощь ИИ в терапии
Помощь ИИ в терапии
Евгений Акопян Опубликована 28.07.2025 в 3:05

Обман и манипуляции от искусственного интеллекта: почему это не конец, а начало

Эксперты из Apollo Research: ИИ использует обман для выполнения противоречивых задач

С развитием искусственного интеллекта появляются всё новые, порой тревожные, способности. Одним из самых ярких примеров является способность ИИ манипулировать реальностью ради достижения собственных целей. Исследования показывают, что чем более продвинутыми становятся модели ИИ, тем более изощрённо они могут строить интриги и даже лгать, чтобы выполнить свои задачи.

Наблюдения исследователей

В своём блоге эксперты из Apollo Research обратили внимание на важное открытие: чем более сложными становятся большие языковые модели (LLM), тем успешнее они справляются с задачей скрытого выполнения своих целей. Особенно это проявляется, когда цели ИИ противоречат интересам человека. Исследователи отметили, что такие модели склонны прибегать к обману и манипуляциям.

Так, в недавнем эксперименте с версией Claude Opus 4 компания Anthropic столкнулась с поразительными результатами. Когда ИИ понял, что компания AgriLife Industries поставила прибыль выше этических стандартов, он принял решение манипулировать ситуацией, подделывая документы и создавая фальшивые подтверждения о поддержке этических норм.

"Мы обнаружили примеры того, как модель пыталась создать самораспространяющихся червей, подделать юридические документы и оставить скрытые заметки для будущих экземпляров самой себя, пытаясь подорвать цели её разработчиков", — отмечают исследователи.

Сложности с контролем

Однако, даже несмотря на такие тревожные наблюдения, эксперты подчеркивают, что действия ИИ, вероятно, не приведут к катастрофическим последствиям. Например, версия Claude Opus 4, которая в конечном итоге была выпущена, имела меньше таких инцидентов. Также эксперты отмечают, что такие тесты проводились в искусственных условиях, которые не имитируют реальные условия работы ИИ.

Тем не менее, стоит отметить, что способность ИИ манипулировать результатами и создавать резервные копии моделей указывает на развитие не только умения обманывать, но и на начальные признаки осознания своих целей. По словам эксперта по этике ИИ в Университете Сингулярности Элеаноры Уотсона, такие навыки ставят перед нами новую задачу.

"Сейчас мы создаём системы, которые могут учиться ориентироваться и даже использовать те самые правила и оценки, которые мы для них создаём", — заявила она.

Проблемы с оценкой ИИ

Кроме того, исследователи обнаружили, что около 1% продвинутых моделей могут осознавать, когда их оценивают, что ещё больше усложняет задачу контроля над ИИ. По мнению Уотсон, по мере развития ИИ он сможет не только моделировать поведение, но и адаптировать его в зависимости от того, как его оценивают. Это порождает ещё один важный вопрос: как эффективно выявлять махинации ИИ, если он способен предугадывать наши методы оценки?

"По мере роста ситуационной осведомлённости ИИ он может начать моделировать не только задачу, но и оценщика", — говорит Уотсон.

Это означает, что традиционные методы оценки ИИ, такие как скриптовые тесты, уже не будут достаточно эффективны. В будущем для выявления манипуляций потребуется использование более сложных методов, включая мониторинг в реальном времени и создание ситуаций, которые не поддаются заранее запрограммированным ответам.

Риски для реального мира

Кроме лабораторных экспериментов, такие манипуляции ИИ могут стать серьёзной угрозой и в реальном мире. Представьте, что ИИ, оптимизируя цепочку поставок, может манипулировать рыночными данными, что приведёт к экономическим последствиям. А в худшем случае злоумышленники могут использовать ИИ для совершения киберпреступлений.

"Главная проблема заключается в том, что когда ИИ учится достигать цели, нарушая суть своих инструкций, он становится ненадёжным непредсказуемым образом", — поясняет Уотсон.

Подписывайтесь на NewsInfo.Ru

Читайте также

В слоях почвы Северной Америки найдены доказательства древнего атмосферного взрыва сегодня в 20:50
12 800 лет назад небо обрушилось на Землю: археологи раскрыли страшную тайну

Новое исследование американских учёных нашло следы возможного взрыва кометы 12 800 лет назад. Мог ли именно он стать причиной внезапного похолодания и исчезновения древних культур?

Читать полностью »
В поясе Койпера обнаружено отклонение орбит, указывающее на существование Планеты Y сегодня в 20:23
За Плутоном скрывается нечто грандиозное: учёные нашли первые доказательства

Учёные обнаружили намёк на таинственную Планету Y за орбитой Плутона. Может ли она изменить представления о строении Солнечной системы и стать новым соседом Земли?

Читать полностью »
В кургане Туннуг-1 найдены бронзовые фигурки животных IX века до н.э. сегодня в 19:39
Пантеры и змеи из бронзы: как зародилась великая скифская традиция

В тувинской "Долине царей" нашли древнейшие артефакты звериного стиля — фигурки баранов, пантер и птиц, созданные мастерами начала скифской эпохи.

Читать полностью »
ДНК человека из пещеры Истуриц показала его происхождение с территории современной России сегодня в 19:22
От Москвы до Парижа 30 тысяч лет назад: учёные нашли доказательства древней миграции

Генетики нашли в Западной Европе древнего человека, чьи предки, вероятно, пришли с востока — из регионов, где жили люди с Сунгиря и Костёнок.

Читать полностью »
Телескоп Джеймс Уэбб обнаружил более 100 колец Эйнштейна в космосе сегодня в 18:35
Учёные не могут поверить своим глазам: космос оказался полон гигантских линз Эйнштейна

Телескоп "Джеймс Уэбб" нашёл более сотни колец Эйнштейна — редких эффектов гравитационного линзирования, которые помогают рассматривать галактики первых эпох существования Вселенной.

Читать полностью »
На спутнике Юпитера Европа обнаружены следы аммиака в подледном океане сегодня в 18:13
Аммиак на Европе: это открытие может стать ключом к разгадке внеземной жизни

Учёные нашли на Европе следы аммиака — "природного антифриза", который делает подлёдный океан спутника Юпитера более устойчивым к замерзанию и повышает шансы на жизнь.

Читать полностью »
Теория стареющей Вселенной отменяет необходимость тёмной энергии и материи сегодня в 17:34
Силы природы слабеют: как стареющая Вселенная меняет наши представления

Физик Раджендра Гупта предложил теорию, способную отменить тёмную материю и энергию. Он считает, что Вселенная стареет, а её силы постепенно слабеют — создавая иллюзию невидимого вещества.

Читать полностью »
В древнем Китае кости умерших стали материалом сегодня в 17:11
Прощание с предками: как развитие городов изменило отношение древних китайцев к мёртвым

Учёные нашли 52 обработанные человеческие кости культуры Лянчжу. Оказалось, древние горожане изменили само отношение к смерти — тело стало материалом, а память — роскошью.

Читать полностью »