Alibaba Group Holding Limited
Alibaba Group Holding Limited
Олег Белов Опубликована 23.10.2025 в 4:46

Облако, которое само учится распределять нагрузку: Alibaba запускает мозг для дата-центров

Новая технология Aegaeon от Alibaba Cloud позволяет запускать до семи моделей на одном GPU

Компания Alibaba Cloud представила вычислительную систему Aegaeon, способную радикально повысить эффективность использования графических ускорителей при работе с AI-моделями. Разработка уже получила статус одного из самых амбициозных инженерных решений в области облачных технологий, позволяя обслуживать в пять раз больше моделей на том же количестве GPU.

Проблема неравномерных нагрузок

Современные облачные инфраструктуры часто сталкиваются с тем, что загрузка видеокарт распределяется крайне неравномерно. Несколько популярных моделей — например, Qwen или DeepSeek - постоянно находятся в работе, тогда как сотни менее востребованных остаются в режиме простоя, при этом продолжают занимать дорогостоящие вычислительные ресурсы.

Ранее одна видеокарта могла стабильно обслуживать максимум две-три модели. Всё остальное время ускорители простаивали, создавая неэффективность и финансовые потери. Именно эту задачу решает новая система Aegaeon.

Динамическое распределение GPU в реальном времени

Ключевая инновация Aegaeon заключается в динамическом управлении ресурсами. Система анализирует загрузку серверов и в реальном времени перераспределяет GPU между моделями, включая переключение прямо во время выполнения задач. Такой подход исключает простои и обеспечивает равномерную загрузку вычислительных мощностей.

"С Aegaeon мы впервые добились баланса между скоростью отклика и эффективностью распределения GPU", — отметил инженер Alibaba Cloud Чжан Вэй.

В результате один графический процессор теперь способен одновременно обслуживать до семи AI-моделей, а время задержек при переключении задач сократилось на 97%. Это особенно важно для облачных платформ, где время отклика напрямую влияет на пользовательский опыт.

Где уже используется Aegaeon

Пилотное внедрение новой системы прошло на маркетплейсе Bailian, принадлежащем Alibaba Cloud. На этой платформе размещаются сотни моделей сторонних разработчиков, включая языковые, визуальные и мультимодальные системы. Именно такой формат и стал идеальным полигоном для Aegaeon: постоянное перераспределение нагрузки между десятками тысяч запросов делает технологию особенно востребованной.

Кроме того, компания заявляет, что Aegaeon совместим с существующими фреймворками и может масштабироваться без необходимости менять архитектуру дата-центров.

Сравнение: Aegaeon против традиционных систем

Параметр Традиционные облачные решения Aegaeon
Количество моделей на 1 GPU 2-3 до 7
Задержка при переключении 100% (базовое значение) -97%
Эффективность использования GPU ~35% до 90%
Масштабируемость Ограниченная Горизонтальная и вертикальная
Энергопотребление Высокое Снижено на 40-50%

Как работает система: пошаговый принцип

  1. Мониторинг нагрузки. Aegaeon в режиме реального времени отслеживает активность всех моделей в облаке.

  2. Анализ приоритетов. Система оценивает, какие из моделей нуждаются в непрерывном доступе к GPU, а какие могут работать в пакетном режиме.

  3. Мгновенное переключение. На основе анализа Aegaeon распределяет ресурсы GPU, используя технологию горячего контекстного переключения.

  4. Оптимизация на уровне драйвера. Алгоритм снижает задержки между задачами и предотвращает конфликт доступа к памяти GPU.

  5. Самообучение. Система корректирует собственные стратегии на основе накопленных данных, адаптируясь к изменению нагрузки.

Ошибка → Последствие → Альтернатива

  • Ошибка: закрепление каждого GPU за одной моделью.
    Последствие: простаивание вычислительных блоков при низком спросе.
    Альтернатива: динамическое распределение GPU мощностей через Aegaeon.

  • Ошибка: масштабирование инфраструктуры через закупку новых ускорителей.
    Последствие: рост расходов и зависимость от поставок Nvidia.
    Альтернатива: оптимизация загрузки существующих GPU, снижая потребность в их количестве в 4-5 раз.

  • Ошибка: использование универсальных планировщиков без приоритизации AI-задач.
    Последствие: рост задержек и снижение качества отклика.
    Альтернатива: специализированная система планирования, адаптированная под работу нейросетей.

А что если…

А что если через несколько лет компании перестанут наращивать парки GPU и вместо этого будут просто эффективнее использовать существующие ресурсы? Aegaeon может стать именно тем решением, которое изменит экономику облачных вычислений, позволяя создавать дешёвый и устойчивый AI даже при дефиците аппаратуры.

Плюсы и минусы Aegaeon

Плюсы Минусы
Сокращает потребность в GPU до 5 раз Сложная настройка на этапе внедрения
Уменьшает задержки при переключении задач Требует поддержки со стороны инфраструктуры
Увеличивает эффективность использования ресурсов Высокие требования к мониторингу и телеметрии
Масштабируется без аппаратных изменений Пока внедрена только в экосистеме Alibaba

FAQ

Как Aegaeon влияет на энергопотребление?
Система позволяет снизить энергозатраты дата-центров на 40-50%, поскольку GPU не простаивают и работают в оптимальных режимах.

Можно ли использовать Aegaeon вне Alibaba Cloud?
Технология пока доступна только в облачной экосистеме компании, но в будущем возможна коммерческая лицензия для партнёров.

Поддерживает ли Aegaeon разные фреймворки — PyTorch, TensorFlow, JAX?
Да, система совместима с основными AI-фреймворками через адаптационные слои планировщика.

Каковы реальные результаты внедрения на Bailian?
По данным Alibaba, производительность выросла в 4,8 раза, а задержки при генерации ответов уменьшились почти до нуля.

Мифы и правда

  • Миф: увеличение количества моделей на GPU обязательно снижает скорость работы.
    Правда: Aegaeon применяет контекстное переключение, исключающее потерю производительности.

  • Миф: только новые видеокарты способны эффективно работать с множеством моделей.
    Правда: система оптимизирует даже старые GPU, повышая их коэффициент загрузки.

  • Миф: подобные технологии доступны только гиперскейлерам.
    Правда: Aegaeon может стать основой для более демократичных облаков, доступных разработчикам по всему миру.

3 интересных факта

  1. Название Aegaeon отсылает к греческому титаниду, символу силы и многообразия — что отражает идею многозадачности GPU.

  2. При тестировании система обрабатывала до 60 000 AI-запросов в секунду без потери качества генерации.

  3. Разработка Aegaeon заняла менее двух лет и велась совместно с исследовательским институтом DAMO Academy.

Подписывайтесь на NewsInfo.Ru

Читайте также

Православный мессенджер Зосима выйдет в первой половине 2026 года — Агапов 06.12.2025 в 7:57
Секретный проект раскрыт: Зосима выйдет в 2026-м и обещает стать главным духовным каналом

Православный мессенджер "Зосима" готовят к публичному запуску в 2026-м: тест уже прошли тысячи пользователей, а дальше всё решит масштабирование.

Читать полностью »
Конфликт приложений может замедлять работу гаджета — IT-эксперт Муртазин 05.12.2025 в 13:34
Когда телефон живет своей жизнью: из-за этих процессов гаджет начинает тормозить

Аналитик Эльдар Муртазин объяснил NewsInfo почему телефон может перегреваться и "тормозить".

Читать полностью »
Pokemon TCG Pocket признана лучшей игрой для iPhone — App Store Awards 2025 05.12.2025 в 13:25
Игры и приложения года раскрыты: пользователи не ожидали такого расклада от Apple

Премия App Store Awards 2025 изменила расстановку сил между крупными студиями и независимыми разработчиками, показав неожиданные приоритеты индустрии.

Читать полностью »
Модели телевизоров от Tuvio, TCL и Hisense названы лучшими до 17 тысяч рублей — Палач 05.12.2025 в 13:15
Бюджетные телевизоры поражают возможностями: не думал, что за такие деньги бывает такое

Подборка трёх доступных телевизоров до 17 тысяч рублей показывает, как бюджетный сегмент постепенно перенимает функции более дорогих моделей, сохраняя привлекательную цену.

Читать полностью »
Теневые каналы в Telegram живут в среднем семь месяцев — Лаборатория Касперского 05.12.2025 в 9:36
Лаборатория Касперского раскрыла правду: почему даже крупные теневые каналы в Telegram живут недолго

Kaspersky изучила 800+ теневых Telegram-каналов: в среднем они живут около семи месяцев. Почему блокировки усилились и куда уходят крупные сообщества?

Читать полностью »
Расширения WeTab и Infinity V+ собирали данные 4 млн пользователей — KOI Security 05.12.2025 в 8:57
Осторожно, обновление: как безобидное расширение после апдейта начало похищать ваши пароли

WeTab и Infinity V+ подозревают в скрытом сборе данных через обновления. Как работала "долгая" атака и почему пострадали миллионы пользователей?

Читать полностью »
Вредоносное ПО для Android закрепляется в системе — ТАСС 05.12.2025 в 8:23
Мошенники знают ваши слабые места: почему вы добровольно установите троян под видом YouTube Pro

Под видом "18+" и "расширенных" TikTok и YouTube пользователям подсовывают трояны. Как устроена сеть сайтов и что нашли операторы.

Читать полностью »
MacBook Air M1 признали актуальным в 2025 году — iGuides 04.12.2025 в 21:42
Этот недорогой MacBook снова все обсуждают — причина удивила даже опытных пользователей

Пользователи обсуждают, насколько старый MacBook Air M1 сохраняет актуальность на фоне падения цен и долгой поддержки macOS, и какие ограничения остаются заметными.

Читать полностью »