Искусственный интеллект
Искусственный интеллект
Олег Белов Опубликована 11.10.2025 в 9:17

Машина начала понимать: GPT-5 Pro прошла главный тест на интеллект

GPT-5 Pro заняла первое место в тесте ARC-AGI по уровню абстрактного мышления — OpenAI

GPT-5 Pro стала новой вершиной среди крупных языковых моделей: по данным закрытого теста ARC-AGI Semi-Private, она заняла первое место по способности к абстрактному мышлению, стратегическому анализу и решению комплексных задач. Этот бенчмарк считается одной из самых авторитетных оценок уровня "обобщённого интеллекта" у нейросетей — и теперь именно GPT-5 Pro возглавляет официальный рейтинг доступных моделей.

Что такое ARC-AGI и зачем он нужен

ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence) — это тест на гибкость мышления, где от модели требуют не просто ответов по шаблону, а умения выявлять закономерности, строить гипотезы и адаптироваться к новым правилам.

В отличие от классических IQ-тестов для ИИ вроде MMLU или GSM8K, здесь проверяется не знание фактов, а способность самостоятельно находить решения. По сути, это проверка "зачаточного интеллекта" машины: сможет ли она понять новую задачу без подсказок и примеров.

"ARC-AGI измеряет не память, а мышление — способность замечать скрытые связи и использовать их для вывода", — пояснил один из авторов методики, исследователь Франсуа Шолле.

Почему успех GPT-5 Pro важен

Результаты показали, что GPT-5 Pro уверенно обходит другие модели уровня frontier-LLM, включая Claude 3, Gemini 1.5 Pro и Mistral Large. Причём OpenAI подчеркнула: речь идёт о Semi-Private-версии теста — усовершенствованной модификации, где задачи не дублируются из открытых источников, а значит, вероятность "заучивания" минимальна.

Фактически, GPT-5 Pro — первая модель, продемонстрировавшая стабильное абстрактное рассуждение на уровне, близком к человеческому, при этом сохранив вычислительную эффективность.

Сравнение с o3-preview

Показатель GPT-5 Pro o3-preview (high)
Точность на ARC-AGI-1 83-85 % 87,5 %
Стоимость вычислений Нормативная (допущена к рейтингу) В десятки раз выше (исключена из лидерборда)
Статус Публичная, подтверждённая модель Экспериментальная
Энергопотребление Оптимизировано под inference Очень высокое
Цель теста Баланс силы и эффективности Демонстрация предела возможностей

Таким образом, o3-preview остаётся лабораторным эталоном по точности, но GPT-5 Pro стала первым коммерчески пригодным решением, приблизившимся к этому уровню без колоссальных затрат.

Как OpenAI балансирует мощность и эффективность

Разработка GPT-5 Pro стала шагом к "интеллекту при разумной цене". В отличие от экспериментальных моделей, которые требуют сотен GPU-часов на одну сессию, новая версия использует адаптивную систему вычислений: сложные запросы обрабатываются на расширенном контексте, а простые — в "экономичном" режиме.

OpenAI также внедрила:

  • многоуровневое кэширование логических шагов,

  • динамическое масштабирование токенов,

  • и модельное ветвление, когда ИИ выбирает между быстрым и детализированным режимом рассуждений.

Результат — почти та же глубина анализа, что у o3-preview, но при затратах на порядок ниже.

Ошибка → Последствие → Альтернатива

  • Ошибка: гнаться за максимальной точностью без учёта стоимости.

  • Последствие: модель становится непрактичной для массового применения.

  • Альтернатива: оптимизация баланса "точность / ресурсы" — подход, реализованный в GPT-5 Pro.

А что если появится GPT-5 Ultra?

По мнению аналитиков, следующий шаг OpenAI — объединить эффективность GPT-5 Pro с вычислительной мощностью o3-preview. Это может привести к появлению модели, способной не только решать задачи ARC-AGI, но и самостоятельно объяснять свои решения — ещё один шаг к осмысленным рассуждениям.

Плюсы и минусы GPT-5 Pro

Плюсы Минусы
Лидерство на ARC-AGI Semi-Private Пока неизвестно поведение на полном ARC-AGI-2
Сбалансированная вычислительная нагрузка Некоторые задачи требуют "глубокого режима"
Улучшенная интерпретируемость ответов Не раскрываются архитектурные детали
Оптимизированная память и токенизация Доступ ограничен исследовательским партнёрам
Поддержка мультимодальности Не реализованы автономные цепочки действий

FAQ

Что делает ARC-AGI особенным?
Он оценивает не знание фактов, а способность к рассуждению и переносу опыта между разными типами задач.

Почему o3-preview не в рейтинге?
Из-за слишком высокой стоимости вычислений — по правилам, такие модели не допускаются в публичные таблицы.

Какой уровень интеллекта у GPT-5 Pro?
По оценкам исследователей, она достигает уровня "когнитивной гибкости" выше всех существующих моделей, приближаясь к человеческому паттерну рассуждений.

Когда модель станет общедоступной?
Официальных сроков нет, но OpenAI уже тестирует GPT-5 Pro в корпоративных продуктах и API-средах.

3 интересных факта

• ARC-AGI создан французским инженером Франсуа Шолле — автором библиотеки Keras.
• GPT-5 Pro впервые показала устойчивость к "ловушкам" в тестах, где предыдущие модели ошибались в 70 % случаев.
• Исследователи называют этот результат "моментом зрелости" для языковых систем: теперь они действительно начинают понимать, а не просто предсказывать.

Подписывайтесь на NewsInfo.Ru

Читайте также

Православный мессенджер Зосима выйдет в первой половине 2026 года — Агапов 06.12.2025 в 7:57
Секретный проект раскрыт: Зосима выйдет в 2026-м и обещает стать главным духовным каналом

Православный мессенджер "Зосима" готовят к публичному запуску в 2026-м: тест уже прошли тысячи пользователей, а дальше всё решит масштабирование.

Читать полностью »
Конфликт приложений может замедлять работу гаджета — IT-эксперт Муртазин 05.12.2025 в 13:34
Когда телефон живет своей жизнью: из-за этих процессов гаджет начинает тормозить

Аналитик Эльдар Муртазин объяснил NewsInfo почему телефон может перегреваться и "тормозить".

Читать полностью »
Pokemon TCG Pocket признана лучшей игрой для iPhone — App Store Awards 2025 05.12.2025 в 13:25
Игры и приложения года раскрыты: пользователи не ожидали такого расклада от Apple

Премия App Store Awards 2025 изменила расстановку сил между крупными студиями и независимыми разработчиками, показав неожиданные приоритеты индустрии.

Читать полностью »
Модели телевизоров от Tuvio, TCL и Hisense названы лучшими до 17 тысяч рублей — Палач 05.12.2025 в 13:15
Бюджетные телевизоры поражают возможностями: не думал, что за такие деньги бывает такое

Подборка трёх доступных телевизоров до 17 тысяч рублей показывает, как бюджетный сегмент постепенно перенимает функции более дорогих моделей, сохраняя привлекательную цену.

Читать полностью »
Теневые каналы в Telegram живут в среднем семь месяцев — Лаборатория Касперского 05.12.2025 в 9:36
Лаборатория Касперского раскрыла правду: почему даже крупные теневые каналы в Telegram живут недолго

Kaspersky изучила 800+ теневых Telegram-каналов: в среднем они живут около семи месяцев. Почему блокировки усилились и куда уходят крупные сообщества?

Читать полностью »
Расширения WeTab и Infinity V+ собирали данные 4 млн пользователей — KOI Security 05.12.2025 в 8:57
Осторожно, обновление: как безобидное расширение после апдейта начало похищать ваши пароли

WeTab и Infinity V+ подозревают в скрытом сборе данных через обновления. Как работала "долгая" атака и почему пострадали миллионы пользователей?

Читать полностью »
Вредоносное ПО для Android закрепляется в системе — ТАСС 05.12.2025 в 8:23
Мошенники знают ваши слабые места: почему вы добровольно установите троян под видом YouTube Pro

Под видом "18+" и "расширенных" TikTok и YouTube пользователям подсовывают трояны. Как устроена сеть сайтов и что нашли операторы.

Читать полностью »
MacBook Air M1 признали актуальным в 2025 году — iGuides 04.12.2025 в 21:42
Этот недорогой MacBook снова все обсуждают — причина удивила даже опытных пользователей

Пользователи обсуждают, насколько старый MacBook Air M1 сохраняет актуальность на фоне падения цен и долгой поддержки macOS, и какие ограничения остаются заметными.

Читать полностью »