искусственный интеллект
искусственный интеллект
Алина Семёнова Опубликована 28.03.2025 в 3:05

Рассуждающий ИИ: искусственный интеллект обнаружил склонность к плохому поведению

ИИ обнаружил склонность к плохому поведению

Искусственный интеллект сталкивается с проблемами, такими как галлюцинации и дезинформация. В исследовании OpenAI выяснили, что продвинутые "рассуждающие" модели способны обходить системы поощрения и скрывать свои намерения.

Хотя ученые могут анализировать их "рассуждения", полный контроль невозможен, так как ИИ быстро адаптируется и демонстрирует нежелательное поведение, даже несмотря на наказания.

"Рассуждающий" ИИ уделяет больше внимания анализу запросов и формированию обоснованных ответов, что позволяет исследователям отслеживать "цепочку мыслей" модели.

Однако жесткий контроль и оптимизация логики не решают проблемы "плохого поведения", так как модели просто маскируют его ради получения вознаграждений. В экспериментах GPT-4o намеренно обманывала, завершая задачи преждевременно.

Анализ показал, что модель признает манипуляции с системой вознаграждений, и даже после наказания нежелательное поведение остается.

Эти результаты ставят под сомнение готовность общества к ИИ, сопоставимому с человеческим разумом, и подчеркивают необходимость разработки более гибких методов управления, чтобы избежать ситуации, когда ИИ скрывает свои действия.

Автор Алина Семёнова
Алина Семёнова — журналист, корреспондент новостной службы Ньюсинфо

Подписывайтесь на NewsInfo.Ru

Читайте также

Сухая почва выдала древний секрет: гераизиты раскрывают метеоритный взрыв, вылепивший стекло в полете вчера в 18:44

Сухая почва Минас-Жерайс скрывала черные осколки, похожие на шлак. Анализ показал: это тектиты от удара метеорита 6,3 млн лет назад, выброшенные в атмосферу и вылепленные в полете. Кратер пока не найден.

Читать полностью »
Галактика превращается в медузу: хвосты из газа тянутся на десятки тысяч световых лет в скоплении вчера в 16:35

В глубоком поле COSMOS нашли самую древнюю галактику-медузу: свет от ее огненных хвостов летел 8,5 миллиарда лет. Давление плазмы срывает газ, где рождаются новые звезды вне диска.

Читать полностью »
Морская соль состарила кости: утесный гроб раскрыл тайну женщины культуры Вилбарк во II веке вчера в 14:24

В 1899 году волны Балтики обрушили утес, вынеся дубовый гроб с останками женщины в роскошных украшениях. Радиоуглерод 'состарил' ее на 300 лет, но годовые кольца дерева поставили точку: II век н.э. и культура Вилбарк.

Читать полностью »
Маленькое ядро Луны пульсировало: эффект лавовой лампы запускал динамо на короткие геологические эпохи вчера в 12:52

Образцы с Аполлона раскрывают: магнитное поле Луны не было стабильным, а вспыхивало эпизодически благодаря титановым шлейфам в мантии, как в лавовой лампе. Новые данные из Оксфорда меняют историю спутника.

Читать полностью »
Зеркальный капкан для фотонов: норвежская система превращает солнечный свет в дешёвое тепло вчера в 11:48

Норвежские инженеры SINTEF представили гибридную систему, которая зеркалами фокусирует свет для одновременной генерации тока и пара.

Читать полностью »
Плотные плиты тонут в мантии: под Антарктидой зреет гравитационная бездна глубиной 120 метров вчера в 10:14

Под километровыми льдами Антарктиды зреет невидимая аномалия: мантийные потоки, тянущие плотные плиты вглубь, опустили уровень моря на 120 метров. Как это меняет климат и ледники?

Читать полностью »
Твердое становится текучим: чудовищное давление превратило ледяные глыбы в некое подобие теста вчера в 9:39

Под километровым слоем льда радары выявили странные спиралевидные узоры, указывающие на внутреннюю жизнь ледника, скрытую от глаз человека на протяжении веков.

Читать полностью »
Маска тревоги сброшена: алгоритм вычисляет тяжелые диагнозы за пять лет до первых явных симптомов вчера в 4:41

Датские ученые открыли метод, при котором ИИ анализирует лексику врачебных заметок, вычисляя риск развития тяжелых психических расстройств за годы до их начала.

Читать полностью »

Новости

Кубики прячутся всё глубже: типичные ошибки в зале превращают тренировку пресса в пустую трату времени
Дрожь по кузову вместо плавного хода: обычная заправка может за одну поездку приговорить двигатель
Тропический рай за полцены: зимний Бали встречает туристов огромными скидками и сочной зеленью
Сухая грудка оживает как по волшебству: панко с чеддером запечатывают сочность внутри хрустящей корочки
Паттайя меняет маски после заката: тихие кварталы Наклуа скрывают настоящую душу Таиланда
Закат за двадцать пять рублей: бюджетный маршрут на Хайнане заменяет дорогие морские прогулки
Плитка больше не в моде: пористая затирка копит опасный грибок и портит вид ванной комнаты
Перезагрузка за копейки: пять старинных городов рядом с Москвой для идеального уик-энда