Alibaba Group Holding Limited
Alibaba Group Holding Limited
Олег Белов Опубликована 17.09.2025 в 2:26

Alibaba выстрелила в гонке ИИ: 80B-модель работает так, будто у неё всего 3B параметров

Alibaba снизила стоимость инференса ИИ почти в 10 раз с моделью Qwen3

Alibaba громко заявила о себе в гонке больших языковых моделей, представив Qwen3-Next-80B-A3B - решение, которое объединяет масштаб (80 млрд параметров) и рекордную эффективность. Новинка удивляет тем, что при генерации текста активирует всего около 3 млрд параметров на токен. Это снижает стоимость обучения и инференса почти в 10 раз по сравнению с предыдущей Qwen3-32B, сохраняя при этом высокий уровень качества.

Ключевые особенности Qwen3-Next-80B-A3B

  • Разреженная архитектура: используется 512 экспертов, из которых задействуется только 10 и один общий. Такой Mixture-of-Experts позволяет экономно расходовать вычислительные ресурсы.

  • Комбинация технологий: гибрид Gated DeltaNet + Gated Attention обеспечивает баланс между точностью и скоростью.

  • Multi-Token Prediction: модель предсказывает сразу несколько слов вперёд и быстро их проверяет, что ускоряет генерацию текста.

  • Длинный контекст: обработка свыше 32 тыс. токенов без заметной деградации качества — одно из главных преимуществ в сравнении с конкурентами.

Сравнение с другими моделями

Модель Кол-во параметров Эффективность (активируемых параметров) Ключевое преимущество
Qwen3-32B 32 млрд все параметры Базовый уровень
Qwen3-Next-80B-A3B 80 млрд ~3 млрд Баланс цена/производительность
Qwen3-235B 235 млрд все параметры Максимальное качество
Gemini-2.5-Flash-Thinking >100 млрд (оценка) неизвестно Сильные рассуждения, но дороже

По тестам, новая модель вплотную приблизилась к качеству Qwen3-235B, а в ряде задач рассуждения специализированная версия Qwen3-Next-80B-A3B-Thinking даже превзошла Google Gemini-2.5-Flash-Thinking.

Практическая значимость

Для бизнеса и исследователей это означает:

  • возможность запускать проекты, где важен сверхдлинный контекст (анализ документов, кода, научных текстов);

  • снижение затрат на эксплуатацию больших моделей;

  • более доступный вход в использование ИИ промышленного уровня.

Плюсы и минусы

Плюсы Минусы
10-кратное снижение стоимости работы Новая архитектура ещё требует "обкатки"
Поддержка длинного контекста Пока меньше экосистемных инструментов, чем у OpenAI или Google
Быстрая генерация текста (multi-token prediction) Высокая сложность настройки
Версии под разные сценарии (Instruct, Thinking) Доступность для массового рынка пока ограничена
Приближается к качеству топовых моделей Возможно, недоступна в некоторых регионах

А что если…

Если подобные архитектуры приживутся, рынок больших моделей ждёт переход от "всегда активных гигантов" к умным разреженным системам, которые используют только нужные ресурсы. Это может резко удешевить ИИ и ускорить массовое внедрение в образование, аналитику и корпоративные сервисы.

Интересные факты

  1. Qwen3-Next-80B-A3B активирует всего 3,7% параметров на токен.

  2. Версия Instruct почти догнала 235B по качеству инструкционных задач.

  3. Модификация Thinking стала первой в истории Qwen-моделей, которая превзошла Google Gemini в тестах на рассуждение.

Подписывайтесь на NewsInfo.Ru

Читайте также

Бумагу можно переработать до шести раз — эколог Пешков сегодня в 13:35
Пакет против пластика: какой пакет в магазине на самом деле стоит выбирать

Эколог Андрей Пешков пояснил NewsInfo, почему бумажные пакеты экологичнее пластиковых.

Читать полностью »
Православный мессенджер Зосима выйдет в первой половине 2026 года — Агапов 06.12.2025 в 7:57
Секретный проект раскрыт: Зосима выйдет в 2026-м и обещает стать главным духовным каналом

Православный мессенджер "Зосима" готовят к публичному запуску в 2026-м: тест уже прошли тысячи пользователей, а дальше всё решит масштабирование.

Читать полностью »
Конфликт приложений может замедлять работу гаджета — IT-эксперт Муртазин 05.12.2025 в 13:34
Когда телефон живет своей жизнью: из-за этих процессов гаджет начинает тормозить

Аналитик Эльдар Муртазин объяснил NewsInfo почему телефон может перегреваться и "тормозить".

Читать полностью »
Pokemon TCG Pocket признана лучшей игрой для iPhone — App Store Awards 2025 05.12.2025 в 13:25
Игры и приложения года раскрыты: пользователи не ожидали такого расклада от Apple

Премия App Store Awards 2025 изменила расстановку сил между крупными студиями и независимыми разработчиками, показав неожиданные приоритеты индустрии.

Читать полностью »
Модели телевизоров от Tuvio, TCL и Hisense названы лучшими до 17 тысяч рублей — Палач 05.12.2025 в 13:15
Бюджетные телевизоры поражают возможностями: не думал, что за такие деньги бывает такое

Подборка трёх доступных телевизоров до 17 тысяч рублей показывает, как бюджетный сегмент постепенно перенимает функции более дорогих моделей, сохраняя привлекательную цену.

Читать полностью »
Теневые каналы в Telegram живут в среднем семь месяцев — Лаборатория Касперского 05.12.2025 в 9:36
Лаборатория Касперского раскрыла правду: почему даже крупные теневые каналы в Telegram живут недолго

Kaspersky изучила 800+ теневых Telegram-каналов: в среднем они живут около семи месяцев. Почему блокировки усилились и куда уходят крупные сообщества?

Читать полностью »
Расширения WeTab и Infinity V+ собирали данные 4 млн пользователей — KOI Security 05.12.2025 в 8:57
Осторожно, обновление: как безобидное расширение после апдейта начало похищать ваши пароли

WeTab и Infinity V+ подозревают в скрытом сборе данных через обновления. Как работала "долгая" атака и почему пострадали миллионы пользователей?

Читать полностью »
Вредоносное ПО для Android закрепляется в системе — ТАСС 05.12.2025 в 8:23
Мошенники знают ваши слабые места: почему вы добровольно установите троян под видом YouTube Pro

Под видом "18+" и "расширенных" TikTok и YouTube пользователям подсовывают трояны. Как устроена сеть сайтов и что нашли операторы.

Читать полностью »