Alibaba Group Holding Limited
Alibaba Group Holding Limited
Олег Белов Опубликована сегодня в 2:26

Alibaba выстрелила в гонке ИИ: 80B-модель работает так, будто у неё всего 3B параметров

Alibaba снизила стоимость инференса ИИ почти в 10 раз с моделью Qwen3

Alibaba громко заявила о себе в гонке больших языковых моделей, представив Qwen3-Next-80B-A3B - решение, которое объединяет масштаб (80 млрд параметров) и рекордную эффективность. Новинка удивляет тем, что при генерации текста активирует всего около 3 млрд параметров на токен. Это снижает стоимость обучения и инференса почти в 10 раз по сравнению с предыдущей Qwen3-32B, сохраняя при этом высокий уровень качества.

Ключевые особенности Qwen3-Next-80B-A3B

  • Разреженная архитектура: используется 512 экспертов, из которых задействуется только 10 и один общий. Такой Mixture-of-Experts позволяет экономно расходовать вычислительные ресурсы.

  • Комбинация технологий: гибрид Gated DeltaNet + Gated Attention обеспечивает баланс между точностью и скоростью.

  • Multi-Token Prediction: модель предсказывает сразу несколько слов вперёд и быстро их проверяет, что ускоряет генерацию текста.

  • Длинный контекст: обработка свыше 32 тыс. токенов без заметной деградации качества — одно из главных преимуществ в сравнении с конкурентами.

Сравнение с другими моделями

Модель Кол-во параметров Эффективность (активируемых параметров) Ключевое преимущество
Qwen3-32B 32 млрд все параметры Базовый уровень
Qwen3-Next-80B-A3B 80 млрд ~3 млрд Баланс цена/производительность
Qwen3-235B 235 млрд все параметры Максимальное качество
Gemini-2.5-Flash-Thinking >100 млрд (оценка) неизвестно Сильные рассуждения, но дороже

По тестам, новая модель вплотную приблизилась к качеству Qwen3-235B, а в ряде задач рассуждения специализированная версия Qwen3-Next-80B-A3B-Thinking даже превзошла Google Gemini-2.5-Flash-Thinking.

Практическая значимость

Для бизнеса и исследователей это означает:

  • возможность запускать проекты, где важен сверхдлинный контекст (анализ документов, кода, научных текстов);

  • снижение затрат на эксплуатацию больших моделей;

  • более доступный вход в использование ИИ промышленного уровня.

Плюсы и минусы

Плюсы Минусы
10-кратное снижение стоимости работы Новая архитектура ещё требует "обкатки"
Поддержка длинного контекста Пока меньше экосистемных инструментов, чем у OpenAI или Google
Быстрая генерация текста (multi-token prediction) Высокая сложность настройки
Версии под разные сценарии (Instruct, Thinking) Доступность для массового рынка пока ограничена
Приближается к качеству топовых моделей Возможно, недоступна в некоторых регионах

А что если…

Если подобные архитектуры приживутся, рынок больших моделей ждёт переход от "всегда активных гигантов" к умным разреженным системам, которые используют только нужные ресурсы. Это может резко удешевить ИИ и ускорить массовое внедрение в образование, аналитику и корпоративные сервисы.

Интересные факты

  1. Qwen3-Next-80B-A3B активирует всего 3,7% параметров на токен.

  2. Версия Instruct почти догнала 235B по качеству инструкционных задач.

  3. Модификация Thinking стала первой в истории Qwen-моделей, которая превзошла Google Gemini в тестах на рассуждение.

Подписывайтесь на NewsInfo.Ru

Читайте также

Mechanism представила универсальное крепление для гаджетов в самолёте вчера в 20:18

Столики можно закрыть: нашли способ играть и читать в полёте без лишних усилий

Mechanism выпустила крепление для телефонов, консолей и e-readers, которое делает перелёты комфортнее. Устройство стоит всего $19.

Читать полностью »
Японские физики экспериментально реализовали запутанное измерение трёхфотонных состояний W вчера в 19:18

Три фотона, одна магия: как учёные открыли дверь в квантовую телепортацию

Учёные из Японии впервые провели запутанное измерение состояния W. Почему это открытие так важно для будущего квантовых технологий?

Читать полностью »
NASA запретило гражданам Китая доступ к объектам, сетям и Zoom-звонкам вчера в 18:17

Китайцев отрезали даже от Zoom: как NASA пытается вернуться на Луну быстрее КНР

НАСА запретило гражданам Китая доступ к своим объектам и сетям. Почему агентство пошло на этот шаг и как это связано с лунной гонкой?

Читать полностью »
Демис Хассабис: современные ИИ как аспиранты, но ошибаются в школьной математике вчера в 17:18

PhD-интеллект — миф: глава DeepMind объяснил, чего не умеют современные ИИ

Демис Хассабис из DeepMind объяснил, почему современные чат-боты ещё далеки от AGI и что станет ключом к созданию настоящего универсального интеллекта.

Читать полностью »
Рейтинг TIOBE за сентябрь: Python сохраняет лидерство, Perl уступил Delphi 9-е место вчера в 16:18

Perl воскресает: язык, списанный в архивы, снова ворвался в топ-10 TIOBE

Сентябрьский рейтинг TIOBE показал неожиданное: Perl снова в топ-10. Почему старый язык вернулся и в чём его скрытая сила?

Читать полностью »
Программа AppleCare+ снижает цену ремонта iPhone 17 и Air до $29–99 вчера в 15:16

Ремонт iPhone теперь предсказуем: прозрачный прайс-лист снижает стресс у пользователей

Apple раскрыла цены на ремонт iPhone Air и линейки iPhone 17. Что останется доступным, а за что придётся заплатить сотни долларов?

Читать полностью »
Xiaomi Pad 8 Pro получил 2697 и 9485 баллов в тестах Geekbench вчера в 14:44

Игровой ноутбук в обличии планшета: результаты тестов Xiaomi Pad 8 Pro удивили сеть

В сети появились характеристики Xiaomi Pad 8 Pro: мощный процессор, 16 ГБ ОЗУ и аккумулятор на 10 000 мА·ч. Чем он удивит на презентации?

Читать полностью »
Microsoft ввела новые правила безопасности для приложений с генеративным ИИ вчера в 14:18

Кнопка, о которой мечтали: Microsoft Store научился запускать программы прямо из магазина

Microsoft обновила магазин приложений: новые функции AI Hub, упрощённый запуск программ и отмена взноса для разработчиков. Что изменилось?

Читать полностью »