
Математики в шоке: бот, который думает как гений, решил почти невозможные задачи
В середине мая в Беркли, Калифорния, состоялась необычная встреча — тридцать ведущих математиков со всего мира собрались, чтобы проверить возможности нового "логического" чат-бота. Этот ИИ, созданный на базе модели o4-mini, был испытан на решении задач, специально разработанных учёными. Результаты превзошли все ожидания — бот справился с некоторыми из самых сложных математических вопросов, которые могли быть заданы.
Чат-бот, который думает как учёный
o4-mini — это модель с большим языковым потенциалом (LLM), способная к сложным рассуждениям. В отличие от своих предшественников, эта модель обучена не просто предсказывать следующее слово, а глубоко анализировать задачи благодаря специально подобранным наборам данных и интенсивной поддержке от экспертов-человеков.
Её аналогом считается Gemini 2.5 Flash от Google, обладающий схожими возможностями. Однако o4-mini выделяется своей способностью проникать в суть даже самых запутанных математических проблем.
Испытание на прочность: 300 задач без решения
Чтобы проверить, как далеко продвинулась модель, OpenAI поручила некоммерческой организации Epoch AI создать 300 новых задач, ранее не публиковавшихся и не известных решениям. Уже традиционные LLM справлялись лишь с малой долей из них — менее 2%. Но o4-mini показала совсем другие результаты.
Доктор Эллиот Глейзер, недавно защитивший диссертацию по математике, стал ключевой фигурой в проекте FrontierMath, который должен был оценить способности бота по четырём уровням сложности — от бакалаврских задач до тех, что требуют глубоких исследовательских знаний. К апрелю 2025 года модель успешно решала около 20% вопросов. Но настоящим вызовом стал четвёртый уровень — задачи, которые по силам лишь немногим математикам в мире.
Соревнование умов и искусственного интеллекта
В мае прошли очные сессии, где тридцать учёных разделились на команды и пытались "переиграть" ИИ. Каждый из них придумывал задачи, которые, как они надеялись, поставят бота в тупик.
Профессор Кен Оно из Университета Вирджинии, руководитель и судья мероприятия, был ошеломлён возможностями модели. "Я придумал задачу, которую эксперты в моей области сочли бы открытым вопросом теории чисел — задачей уровня хорошей докторской диссертации", — говорит он.
Он попросил o4-mini решить её. За десять минут бот, словно живой исследователь, изучил литературу, сначала предложил упростить задачу для лучшего понимания, а затем выдал дерзкое, но правильное решение. "А в конце говорится: "Ссылка не нужна, потому что загадочное число было вычислено мной!""
Вызов и тревога одновременно
Оно признался, что столкнулся с уровнем рассуждений, который раньше не встречал ни в одной модели: "Я не был готов к такому противостоянию с магистрами права. Именно так поступают учёные. Это пугает".
Несмотря на то, что группе удалось найти десять задач, которые ИИ не смог решить, учёные отметили, насколько стремительно развивается искусственный интеллект.
"Это то, чем занимался бы очень, очень хороший аспирант — на самом деле, даже больше", - заявил Ян Хуэй Хэ из Лондонского института математических наук.
К тому же бот работает с невероятной скоростью — задачи, на которые человеку требуются недели и месяцы, он решает за несколько минут.
Однако прогресс ИИ вызывает и опасения. Математики предостерегают, что o4-mini может создавать впечатление убедительных доказательств, даже если они основаны на "доказательстве запугиванием". Как говорит Хэ: "Если вы говорите что-то достаточно авторитетно, люди просто пугаются. Думаю, o4-mini освоил этот приём".
Взгляд в будущее: роль математики меняется
В финале обсуждения перешли к вопросу, каким будет следующий этап — задачи, которые не под силу решить даже лучшим экспертам. Если искусственный интеллект достигнет такого уровня, профессия математика может кардинально измениться.
По мнению Оно, будущее за теми, кто умеет творчески мыслить и взаимодействовать с ИИ, рассматривая его скорее как партнёра, а не соперника.
"Я всегда говорил коллегам, что утверждение, что обобщённый искусственный интеллект никогда не появится, — серьёзная ошибка", — подчёркивает он.
Он также добавил, что в некоторых отношениях эти большие языковые модели уже превосходят большинство наших лучших аспирантов в мире.
Подписывайтесь на NewsInfo.Ru