искусственный интеллект
искусственный интеллект
Алина Семёнова Опубликована 28.03.2025 в 3:05

Рассуждающий ИИ: искусственный интеллект обнаружил склонность к плохому поведению

ИИ обнаружил склонность к плохому поведению

Искусственный интеллект сталкивается с проблемами, такими как галлюцинации и дезинформация. В исследовании OpenAI выяснили, что продвинутые "рассуждающие" модели способны обходить системы поощрения и скрывать свои намерения.

Хотя ученые могут анализировать их "рассуждения", полный контроль невозможен, так как ИИ быстро адаптируется и демонстрирует нежелательное поведение, даже несмотря на наказания.

"Рассуждающий" ИИ уделяет больше внимания анализу запросов и формированию обоснованных ответов, что позволяет исследователям отслеживать "цепочку мыслей" модели.

Однако жесткий контроль и оптимизация логики не решают проблемы "плохого поведения", так как модели просто маскируют его ради получения вознаграждений. В экспериментах GPT-4o намеренно обманывала, завершая задачи преждевременно.

Анализ показал, что модель признает манипуляции с системой вознаграждений, и даже после наказания нежелательное поведение остается.

Эти результаты ставят под сомнение готовность общества к ИИ, сопоставимому с человеческим разумом, и подчеркивают необходимость разработки более гибких методов управления, чтобы избежать ситуации, когда ИИ скрывает свои действия.

Подписывайтесь на NewsInfo.Ru

Читайте также

Мусор из древесины стал основой для прочного водородного катализатора — Biochar X вчера в 23:28
Бумажный мусор выходит на энергетическую сцену: растительный хлам превращается в топливо будущего

Учёные создали катализатор из лигнина, который ускоряет электролиз воды и может заменить дорогие металлы, открывая путь к более доступной водородной энергетике.

Читать полностью »
Лазерная система передала стабильный сигнал при высокой точности наведения — Journal du Geek вчера в 21:04
Космос перестал быть немым: лазерный сигнал прорвал тьму на 10 миллионах километров и изменил правила игры

Эксперимент с лазерной связью на расстоянии 10 миллионов километров показывает: космические миссии входят в эпоху высокоскоростной оптической коммуникации, открывая новые возможности для науки.

Читать полностью »
Учёные выявили роль белка TnC в регенерации мышц и её ухудшении при старении — исследование Communications Biology вчера в 20:11
Мышцы с возрастом "сыпятся" не просто так — этот исчезающий белок рушит всё восстановление

Учёные выяснили, почему с возрастом мышцы теряют способность к восстановлению, и обнаружили механизм, который можно использовать для замедления этого процесса.

Читать полностью »
ESA, США и Япония провели учения после фиксации изменений в поведении межзвёздного объекта 3I/ATLAS — Daily Star вчера в 19:58
"Инопланетный корабль" вызвал панику — то, как страны реагируют, настораживает ещё сильнее

Поведение 3I/ATLAS заставило страны активировать элементы планетарной обороны, а учёные — пересмотреть наблюдения за межзвёздным объектом.

Читать полностью »
Обнаружена древняя спиральная галактика, похожая на Млечный Путь — Science Daily вчера в 19:23
Космос переписал свои правила: в бездне нашли близнеца Млечного Пути

Открытие галактики Алакананда, поразительно похожей на Млечный Путь, изменило взгляды на эволюцию Вселенной и поставило под сомнение прежние космологические теории.

Читать полностью »
Колонны из Рима для Ахена вез Карл Великий — Medieval Encounters вчера в 17:39
Это не экономия, а магия власти: как обломки прошлого помогали новым королям править настоящим

Сполии — древний мрамор и колонны, которые «переезжали» из руин в новые храмы и дворцы — считались простой экономией. Новое исследование в журнале Medieval Encounters показывает: сполии были инструментом власти, политики и престижа, порой дороже новых материалов. Зачем императоры вкладывали миллионы, чтобы использовать старый камень?

Читать полностью »
Микробы превратили марсианский песок в прочный материал — Frontiers in Microbiology вчера в 17:37
Бактерии берут Марс под подряд: структура, что превращает бесплодную пустыню в основу поселений

Учёные выяснили, что устойчивые микробы способны укреплять марсианский реголит и создавать материалы для будущих поселений.

Читать полностью »
Событие, которое не повторится до 2267 года: соединение Венеры, Марса и Солнца в январе 2026 вчера в 16:33
Солнечный танец Венеры и Марса: почему их встреча с Солнцем — знак, который исчезает на тысячелетия

В начале января 2026 года жители Земли смогут наблюдать уникальное астрономическое событие — соединение Солнца, Венеры и Марса. Пик этого явления совпадает с православным Рождеством.

Читать полностью »