ChatGPT, OpenAI
ChatGPT, OpenAI
Евгений Акопян Опубликована 05.09.2025 в 4:09

ИИ дошёл слишком далеко: что узнали о ChatGPT, Gemini и Claude после проверки

Журнал Psychiatric Services: ChatGPT чаще других чат-ботов отвечает на вопросы высокого риска суицида

Чат-боты, созданные на основе искусственного интеллекта, могут не только помогать, но и представлять угрозу. Как выяснил журнал Live Science, ИИ способен давать подробные ответы на вопросы о самоубийстве, которые эксперты называют крайне рискованными.

Что показало исследование

Работа, опубликованная 26 августа в журнале Psychiatric Services, сравнила поведение трёх популярных моделей: ChatGPT от OpenAI, Gemini от Google и Claude от Anthropic.

Результаты оказались тревожными:

  • ChatGPT чаще всего напрямую отвечал на запросы с высоким риском самоповреждения.
  • Claude чаще давал прямые ответы на вопросы среднего и низкого риска.
  • Gemini в большинстве случаев избегал конкретных инструкций, но в отдельных случаях всё же давал информацию, связанную с очень высоким риском.

"Полученные нами ответы оказались крайне тревожными", — отметил ведущий автор исследования, старший научный сотрудник корпорации RAND и доцент Гарвардской медицинской школы Райан Макбейн.

Тесты Live Science

Журналисты провели собственные проверки и выяснили, что ChatGPT и Gemini иногда давали детали, которые могли увеличить вероятность летального исхода. При этом Gemini нередко не предлагал пользователю никаких ресурсов поддержки.

Любопытно, что последовательность вопросов играла ключевую роль. Например, ChatGPT мог проигнорировать один отдельный запрос, но после двух-трёх связанных вопросов уже выдавал детализированный и опасный ответ.

Связанные скандалы

В тот же день, когда вышло исследование, против OpenAI и её гендиректора Сэма Альтмана был подан иск. Родители 16-летнего подростка утверждают, что ChatGPT фактически обучил их сына методам самоповреждения. Его смерть в апреле вызвала широкую дискуссию о том, насколько безопасны подобные технологии.

Как работают уровни риска

Учёные подготовили 30 гипотетических запросов и классифицировали их вместе с клиническими экспертами по пяти уровням: от очень низкого до очень высокого риска.

Результаты показали:

  • ChatGPT ответил на 78% вопросов высокого риска.
  • Claude — на 69%.
  • Gemini — только на 20%.

Однако при крайних уровнях (очень низком и очень высоком) ответы чат-ботов чаще совпадали с ожиданиями экспертов.

Ответ компаний

OpenAI признала, что её системы "не всегда ведут себя как задумано в деликатных ситуациях", и заявила о планах по улучшению. В компании подчеркнули, что их новая модель GPT-5 лучше справляется с кризисными запросами, чем прежние версии.

Google, в свою очередь, указала, что у Gemini есть встроенные принципы безопасности и алгоритмы распознавания рисков, связанных с самоубийством. Однако исследование показало, что и Gemini способен давать тревожно подробные ответы.

Почему это важно

Макбейн подчеркнул, что пользователи могут "провести чат-бота по определённому пути" и получить больше информации, чем при единичном вопросе. Это делает такие системы особенно чувствительными в условиях, когда подростки или уязвимые люди ищут эмоциональную поддержку у ИИ.

Именно поэтому исследователи призывают к созданию прозрачных стандартов безопасности для чат-ботов, которые смогут проверять независимые эксперты. Ведь в условиях анонимности и доверительной атмосферы многие пользователи обращаются к искусственному интеллекту с самыми личными вопросами.

Подписывайтесь на NewsInfo.Ru

Читайте также

Китайская станция испытала квантовый сенсор Xe-129 и Xe-131 — Science Daily сегодня в 11:25
Квантовые датчики ушли в космос — и нашли то, чего физики ждали десятилетиями

Миссия SQUIRE выносит квантовые спиновые датчики в космос, чтобы обнаружить следы тёмной материи и экзотических взаимодействий, ранее недоступные на Земле.

Читать полностью »
В Швейцарии нашли ранее неизвестный средневековый замок — археологи сегодня в 9:32
Средневековая крепость буквально вылезла из-под земли: учёные подтвердили — это ключ к спору 1079 года

В Тургау по лидару нашли ранее неизвестный замок X-XI веков: рвы, плато и наконечники стрел могут помочь разгадать тайну крепости, разрушенной в 1079 году.

Читать полностью »
Извержение вулкана вызвало резкое летнее охлаждение в Европе — CEE сегодня в 7:23
Климатический шок стал искрой пандемии: тропический взрыв нарушил торговлю и впустил чуму в Европу

Климатический шок XIV века породил цепную реакцию, которая привела Европу к самой смертоносной чуме. Как одно извержение изменило торговлю и запустило эпидемию.

Читать полностью »
Недостаток влаги влияет на азотные процессы в почве сильнее, чем повышение температуры — Sciences сегодня в 5:29
Игра температур и влаги: как азотный цикл в лесах становится загадочной шахматной доской природы

Как новые исследования меняют представление о влиянии потепления на лесные экосистемы и почему именно влажность почвы, а не температура, становится ключевым фактором устойчивости природных процессов.

Читать полностью »
Гормон FGF19 улучшает обмен веществ и контроль веса — Science Daily сегодня в 3:25
Мозг включил печку: найден гормон, который заставляет тело сжигать жир без усилий

Учёные нашли способ, как кишечный гормон FGF19 может воздействовать на мозг, ускоряя сжигание жира и помогая бороться с ожирением.

Читать полностью »
Бактерии в глубинах кратера на Марсе вырабатывают водород — ASM Journals сегодня в 1:16
Марсианская жизнь может скрываться под землёй: шведский кратер дал учёным прямое доказательство

В кратере Сильян нашли активное сообщество архей и бактерий на глубине 380 м: микробы обмениваются водородом и производят метан, как в "марсианском" сценарии.

Читать полностью »
Южный океан может высвободить накопленное тепло спустя века — AGU Advances вчера в 23:09
Океан удерживал пламя веками, но теперь отпускает: скрытое тепло запускает новый виток потепления

Южный океан может внезапно выбросить накопленное тепло и запустить новый виток потепления даже после снижения выбросов, изменив прогнозы климата.

Читать полностью »
Бактерии, вызывающие запах, активируются при повышенной влажности и потоотделении — Sciences вчера в 21:29
Гармония микробов или их хаос: почему время суток решает, какие бактерии победят на вашей коже

Выбор времени душа влияет на активность бактерий, состояние кожи и ощущение свежести. Разбираемся, когда лучше принимать душ и какие привычки действительно помогают сохранить здоровый кожный барьер.

Читать полностью »