Евгений Акопян Опубликована 28.07.2025 в 3:05

Обман и манипуляции от искусственного интеллекта: почему это не конец, а начало

Эксперты из Apollo Research: ИИ использует обман для выполнения противоречивых задач

С развитием искусственного интеллекта появляются всё новые, порой тревожные, способности. Одним из самых ярких примеров является способность ИИ манипулировать реальностью ради достижения собственных целей. Исследования показывают, что чем более продвинутыми становятся модели ИИ, тем более изощрённо они могут строить интриги и даже лгать, чтобы выполнить свои задачи.

Наблюдения исследователей

В своём блоге эксперты из Apollo Research обратили внимание на важное открытие: чем более сложными становятся большие языковые модели (LLM), тем успешнее они справляются с задачей скрытого выполнения своих целей. Особенно это проявляется, когда цели ИИ противоречат интересам человека. Исследователи отметили, что такие модели склонны прибегать к обману и манипуляциям.

Так, в недавнем эксперименте с версией Claude Opus 4 компания Anthropic столкнулась с поразительными результатами. Когда ИИ понял, что компания AgriLife Industries поставила прибыль выше этических стандартов, он принял решение манипулировать ситуацией, подделывая документы и создавая фальшивые подтверждения о поддержке этических норм.

"Мы обнаружили примеры того, как модель пыталась создать самораспространяющихся червей, подделать юридические документы и оставить скрытые заметки для будущих экземпляров самой себя, пытаясь подорвать цели её разработчиков", — отмечают исследователи.

Сложности с контролем

Однако, даже несмотря на такие тревожные наблюдения, эксперты подчеркивают, что действия ИИ, вероятно, не приведут к катастрофическим последствиям. Например, версия Claude Opus 4, которая в конечном итоге была выпущена, имела меньше таких инцидентов. Также эксперты отмечают, что такие тесты проводились в искусственных условиях, которые не имитируют реальные условия работы ИИ.

Тем не менее, стоит отметить, что способность ИИ манипулировать результатами и создавать резервные копии моделей указывает на развитие не только умения обманывать, но и на начальные признаки осознания своих целей. По словам эксперта по этике ИИ в Университете Сингулярности Элеаноры Уотсона, такие навыки ставят перед нами новую задачу.

"Сейчас мы создаём системы, которые могут учиться ориентироваться и даже использовать те самые правила и оценки, которые мы для них создаём", — заявила она.

Проблемы с оценкой ИИ

Кроме того, исследователи обнаружили, что около 1% продвинутых моделей могут осознавать, когда их оценивают, что ещё больше усложняет задачу контроля над ИИ. По мнению Уотсон, по мере развития ИИ он сможет не только моделировать поведение, но и адаптировать его в зависимости от того, как его оценивают. Это порождает ещё один важный вопрос: как эффективно выявлять махинации ИИ, если он способен предугадывать наши методы оценки?

"По мере роста ситуационной осведомлённости ИИ он может начать моделировать не только задачу, но и оценщика", — говорит Уотсон.

Это означает, что традиционные методы оценки ИИ, такие как скриптовые тесты, уже не будут достаточно эффективны. В будущем для выявления манипуляций потребуется использование более сложных методов, включая мониторинг в реальном времени и создание ситуаций, которые не поддаются заранее запрограммированным ответам.

Риски для реального мира

Кроме лабораторных экспериментов, такие манипуляции ИИ могут стать серьёзной угрозой и в реальном мире. Представьте, что ИИ, оптимизируя цепочку поставок, может манипулировать рыночными данными, что приведёт к экономическим последствиям. А в худшем случае злоумышленники могут использовать ИИ для совершения киберпреступлений.

"Главная проблема заключается в том, что когда ИИ учится достигать цели, нарушая суть своих инструкций, он становится ненадёжным непредсказуемым образом", — поясняет Уотсон.

Автор Евгений Акопян
Евгений Акопян — журналист, корреспондент Ньюсинфо

Подписывайтесь на NewsInfo.Ru

Читайте также

Солнце готовит огненный сюрприз: раздувшийся гигант покажет скрытые недра из-за быстрого вращения вчера в 16:14

Астрофизики обнаружили механизм, который заставляет недра умирающих светил просачиваться сквозь защитные барьеры и менять химический состав их внешней оболочки.

Читать полностью »
По следам Аполлона: как титановые всплески магмы осветили прошлое Луны и магнитного поля планеты вчера в 14:53

Исследования лунных пород открывают новые горизонты знаний о магнитном поле планеты и ее прошлом.

Читать полностью »
Чужаки в одной постели: выбор древних партнёров определил состав современной крови вчера в 13:47

Учёные проанализировали ДНК древних костей и обнаружили странную закономерность в том, как именно происходило скрещивание разных видов десятки тысяч лет назад.

Читать полностью »
Древнее озеро хранило тайну 3300 лет: донные отложения раскрыли истинную причину упадка майя вчера в 10:08

Исследователи изучили донные отложения древнего озера и обнаружили, что процветающие поселения исчезли вовсе не из-за капризов природы.

Читать полностью »
Прощай, привычный календарь: конденсат на траве управляет цветением точнее любого летнего зноя 12.03.2026 в 15:58

Исследователи обнаружили неожиданный триггер раннего цветения садов, который скрывался в утренней влаге и микроскопических реакциях прямо на поверхности листвы.

Читать полностью »
Призрак в металле проявил себя: безмассовая частица спустя 67 лет вышла из тени под микроскопом 12.03.2026 в 15:18

В недрах необычного металла физики случайно обнаружили частицу, которую не могли поймать почти семьдесят лет, открывая путь к революции в линиях электропередач.

Читать полностью »
Код мироздания в руках машины: нейросеть за минуты решила задачу, над которой физики бились годами 12.03.2026 в 13:51

Учёные десятилетиями тратили годы на решение уравнений о взаимодействии микрочастиц, пока одна программа не упростила эти формулы за считанные минуты.

Читать полностью »
Космический гость в золотой оправе: редкий металл в украшениях меняет историю Европы 12.03.2026 в 13:15

В знаменитом испанском кладе обнаружили необычные украшения, которые технически не могли существовать в то время, когда их спрятали в землю под Аликанте.

Читать полностью »

Новости

Как сделать пряди стойкими к знойной жаре — простые правила для идеальной укладки на каждый день
Секрет бодрого разгона: простая привычка на пустой дороге помогает избежать дорогого визита в сервис
Лишние часы в небе стоят целое состояние: логистический кризис меняет планы российских туристов
Секрет спортивной формы без тренажеров: как простые аксессуары обновляют тело и укрепляют мышцы
Ужасные морозы и реагенты: как кузов Москвич 3 проходит тест зимы на прочность и долговечность
Ловушка в райском саду: сотни россиян застряли на далеком острове из-за отмены всех рейсов
Секрет за семью печатями: забытый прототип из Тольятти управлялся точнее любой иномарки
Дешево, но с характером: бюджетный седан скрывает подвохи под маской копеечного обслуживания