искусственный интеллект
искусственный интеллект
Алина Семёнова Опубликована 28.03.2025 в 3:05

Рассуждающий ИИ: искусственный интеллект обнаружил склонность к плохому поведению

ИИ обнаружил склонность к плохому поведению

Искусственный интеллект сталкивается с проблемами, такими как галлюцинации и дезинформация. В исследовании OpenAI выяснили, что продвинутые "рассуждающие" модели способны обходить системы поощрения и скрывать свои намерения.

Хотя ученые могут анализировать их "рассуждения", полный контроль невозможен, так как ИИ быстро адаптируется и демонстрирует нежелательное поведение, даже несмотря на наказания.

"Рассуждающий" ИИ уделяет больше внимания анализу запросов и формированию обоснованных ответов, что позволяет исследователям отслеживать "цепочку мыслей" модели.

Однако жесткий контроль и оптимизация логики не решают проблемы "плохого поведения", так как модели просто маскируют его ради получения вознаграждений. В экспериментах GPT-4o намеренно обманывала, завершая задачи преждевременно.

Анализ показал, что модель признает манипуляции с системой вознаграждений, и даже после наказания нежелательное поведение остается.

Эти результаты ставят под сомнение готовность общества к ИИ, сопоставимому с человеческим разумом, и подчеркивают необходимость разработки более гибких методов управления, чтобы избежать ситуации, когда ИИ скрывает свои действия.

Подписывайтесь на NewsInfo.Ru

Читайте также

Спутник SWOT зафиксировал волны высотой 35 метров в Тихом океане — Techno-Science.net сегодня в 17:49
Спутник SWOT застал врасплох: шторм давно закончился, а его волны всё ещё бьют по берегам

SWOT отследил волны шторма Эдди: энергия прошла около 24 тыс. км и дошла до Гавайев и Калифорнии, меняя подход к защите берегов и портов.

Читать полностью »
Ели, растущие над рудником Киттиля, содержат наночастицы золота — EM сегодня в 15:32
Деревья становятся живыми картами рудников: еловые иголки подают сигнал о сокровищах под землёй

Учёные обнаружили, что микробы внутри хвои финских елей способны образовывать частицы золота, открывая новый подход к экологичному поиску металлов.

Читать полностью »
Гигантские акулы существовали 115 миллионов лет назад, установили ученые — Communications Biology сегодня в 13:04
Большие, опасные и древние: Австралийская находка окаменелостей меняет всё о морских гигантах

Открытие окаменелостей древних акул в Австралии меняет представления о гигантских хищниках древних океанов. Это открытие ставит под сомнение устоявшиеся теории и открывает новые горизонты в изучении акул.

Читать полностью »
Китайская станция испытала квантовый сенсор Xe-129 и Xe-131 — Science Daily сегодня в 11:25
Квантовые датчики ушли в космос — и нашли то, чего физики ждали десятилетиями

Миссия SQUIRE выносит квантовые спиновые датчики в космос, чтобы обнаружить следы тёмной материи и экзотических взаимодействий, ранее недоступные на Земле.

Читать полностью »
В Швейцарии нашли ранее неизвестный средневековый замок — археологи сегодня в 9:32
Средневековая крепость буквально вылезла из-под земли: учёные подтвердили — это ключ к спору 1079 года

В Тургау по лидару нашли ранее неизвестный замок X-XI веков: рвы, плато и наконечники стрел могут помочь разгадать тайну крепости, разрушенной в 1079 году.

Читать полностью »
Извержение вулкана вызвало резкое летнее охлаждение в Европе — CEE сегодня в 7:23
Климатический шок стал искрой пандемии: тропический взрыв нарушил торговлю и впустил чуму в Европу

Климатический шок XIV века породил цепную реакцию, которая привела Европу к самой смертоносной чуме. Как одно извержение изменило торговлю и запустило эпидемию.

Читать полностью »
Недостаток влаги влияет на азотные процессы в почве сильнее, чем повышение температуры — Sciences сегодня в 5:29
Игра температур и влаги: как азотный цикл в лесах становится загадочной шахматной доской природы

Как новые исследования меняют представление о влиянии потепления на лесные экосистемы и почему именно влажность почвы, а не температура, становится ключевым фактором устойчивости природных процессов.

Читать полностью »
Гормон FGF19 улучшает обмен веществ и контроль веса — Science Daily сегодня в 3:25
Мозг включил печку: найден гормон, который заставляет тело сжигать жир без усилий

Учёные нашли способ, как кишечный гормон FGF19 может воздействовать на мозг, ускоряя сжигание жира и помогая бороться с ожирением.

Читать полностью »