Искусственный интеллект
Искусственный интеллект
Евгений Акопян Опубликована 17.07.2025 в 4:25

Математики в шоке: бот, который думает как гений, решил почти невозможные задачи

В середине мая в Беркли, Калифорния, состоялась необычная встреча — тридцать ведущих математиков со всего мира собрались, чтобы проверить возможности нового "логического" чат-бота. Этот ИИ, созданный на базе модели o4-mini, был испытан на решении задач, специально разработанных учёными. Результаты превзошли все ожидания — бот справился с некоторыми из самых сложных математических вопросов, которые могли быть заданы.

Чат-бот, который думает как учёный

o4-mini — это модель с большим языковым потенциалом (LLM), способная к сложным рассуждениям. В отличие от своих предшественников, эта модель обучена не просто предсказывать следующее слово, а глубоко анализировать задачи благодаря специально подобранным наборам данных и интенсивной поддержке от экспертов-человеков.

Её аналогом считается Gemini 2.5 Flash от Google, обладающий схожими возможностями. Однако o4-mini выделяется своей способностью проникать в суть даже самых запутанных математических проблем.

Испытание на прочность: 300 задач без решения

Чтобы проверить, как далеко продвинулась модель, OpenAI поручила некоммерческой организации Epoch AI создать 300 новых задач, ранее не публиковавшихся и не известных решениям. Уже традиционные LLM справлялись лишь с малой долей из них — менее 2%. Но o4-mini показала совсем другие результаты.

Доктор Эллиот Глейзер, недавно защитивший диссертацию по математике, стал ключевой фигурой в проекте FrontierMath, который должен был оценить способности бота по четырём уровням сложности — от бакалаврских задач до тех, что требуют глубоких исследовательских знаний. К апрелю 2025 года модель успешно решала около 20% вопросов. Но настоящим вызовом стал четвёртый уровень — задачи, которые по силам лишь немногим математикам в мире.

Соревнование умов и искусственного интеллекта

В мае прошли очные сессии, где тридцать учёных разделились на команды и пытались "переиграть" ИИ. Каждый из них придумывал задачи, которые, как они надеялись, поставят бота в тупик.

Профессор Кен Оно из Университета Вирджинии, руководитель и судья мероприятия, был ошеломлён возможностями модели. "Я придумал задачу, которую эксперты в моей области сочли бы открытым вопросом теории чисел — задачей уровня хорошей докторской диссертации", — говорит он.

Он попросил o4-mini решить её. За десять минут бот, словно живой исследователь, изучил литературу, сначала предложил упростить задачу для лучшего понимания, а затем выдал дерзкое, но правильное решение. "А в конце говорится: "Ссылка не нужна, потому что загадочное число было вычислено мной!""

Вызов и тревога одновременно

Оно признался, что столкнулся с уровнем рассуждений, который раньше не встречал ни в одной модели: "Я не был готов к такому противостоянию с магистрами права. Именно так поступают учёные. Это пугает".

Несмотря на то, что группе удалось найти десять задач, которые ИИ не смог решить, учёные отметили, насколько стремительно развивается искусственный интеллект.

"Это то, чем занимался бы очень, очень хороший аспирант — на самом деле, даже больше", - заявил Ян Хуэй Хэ из Лондонского института математических наук.

К тому же бот работает с невероятной скоростью — задачи, на которые человеку требуются недели и месяцы, он решает за несколько минут.

Однако прогресс ИИ вызывает и опасения. Математики предостерегают, что o4-mini может создавать впечатление убедительных доказательств, даже если они основаны на "доказательстве запугиванием". Как говорит Хэ: "Если вы говорите что-то достаточно авторитетно, люди просто пугаются. Думаю, o4-mini освоил этот приём".

Взгляд в будущее: роль математики меняется

В финале обсуждения перешли к вопросу, каким будет следующий этап — задачи, которые не под силу решить даже лучшим экспертам. Если искусственный интеллект достигнет такого уровня, профессия математика может кардинально измениться.

По мнению Оно, будущее за теми, кто умеет творчески мыслить и взаимодействовать с ИИ, рассматривая его скорее как партнёра, а не соперника.

"Я всегда говорил коллегам, что утверждение, что обобщённый искусственный интеллект никогда не появится, — серьёзная ошибка", — подчёркивает он.

Он также добавил, что в некоторых отношениях эти большие языковые модели уже превосходят большинство наших лучших аспирантов в мире.

Подписывайтесь на NewsInfo.Ru

Читайте также

Спутник SWOT зафиксировал волны высотой 35 метров в Тихом океане — Techno-Science.net сегодня в 17:49
Спутник SWOT застал врасплох: шторм давно закончился, а его волны всё ещё бьют по берегам

SWOT отследил волны шторма Эдди: энергия прошла около 24 тыс. км и дошла до Гавайев и Калифорнии, меняя подход к защите берегов и портов.

Читать полностью »
Ели, растущие над рудником Киттиля, содержат наночастицы золота — EM сегодня в 15:32
Деревья становятся живыми картами рудников: еловые иголки подают сигнал о сокровищах под землёй

Учёные обнаружили, что микробы внутри хвои финских елей способны образовывать частицы золота, открывая новый подход к экологичному поиску металлов.

Читать полностью »
Гигантские акулы существовали 115 миллионов лет назад, установили ученые — Communications Biology сегодня в 13:04
Большие, опасные и древние: Австралийская находка окаменелостей меняет всё о морских гигантах

Открытие окаменелостей древних акул в Австралии меняет представления о гигантских хищниках древних океанов. Это открытие ставит под сомнение устоявшиеся теории и открывает новые горизонты в изучении акул.

Читать полностью »
Китайская станция испытала квантовый сенсор Xe-129 и Xe-131 — Science Daily сегодня в 11:25
Квантовые датчики ушли в космос — и нашли то, чего физики ждали десятилетиями

Миссия SQUIRE выносит квантовые спиновые датчики в космос, чтобы обнаружить следы тёмной материи и экзотических взаимодействий, ранее недоступные на Земле.

Читать полностью »
В Швейцарии нашли ранее неизвестный средневековый замок — археологи сегодня в 9:32
Средневековая крепость буквально вылезла из-под земли: учёные подтвердили — это ключ к спору 1079 года

В Тургау по лидару нашли ранее неизвестный замок X-XI веков: рвы, плато и наконечники стрел могут помочь разгадать тайну крепости, разрушенной в 1079 году.

Читать полностью »
Извержение вулкана вызвало резкое летнее охлаждение в Европе — CEE сегодня в 7:23
Климатический шок стал искрой пандемии: тропический взрыв нарушил торговлю и впустил чуму в Европу

Климатический шок XIV века породил цепную реакцию, которая привела Европу к самой смертоносной чуме. Как одно извержение изменило торговлю и запустило эпидемию.

Читать полностью »
Недостаток влаги влияет на азотные процессы в почве сильнее, чем повышение температуры — Sciences сегодня в 5:29
Игра температур и влаги: как азотный цикл в лесах становится загадочной шахматной доской природы

Как новые исследования меняют представление о влиянии потепления на лесные экосистемы и почему именно влажность почвы, а не температура, становится ключевым фактором устойчивости природных процессов.

Читать полностью »
Гормон FGF19 улучшает обмен веществ и контроль веса — Science Daily сегодня в 3:25
Мозг включил печку: найден гормон, который заставляет тело сжигать жир без усилий

Учёные нашли способ, как кишечный гормон FGF19 может воздействовать на мозг, ускоряя сжигание жира и помогая бороться с ожирением.

Читать полностью »