Alibaba Group Holding Limited
Alibaba Group Holding Limited
Олег Белов Опубликована 23.10.2025 в 4:46

Облако, которое само учится распределять нагрузку: Alibaba запускает мозг для дата-центров

Новая технология Aegaeon от Alibaba Cloud позволяет запускать до семи моделей на одном GPU

Компания Alibaba Cloud представила вычислительную систему Aegaeon, способную радикально повысить эффективность использования графических ускорителей при работе с AI-моделями. Разработка уже получила статус одного из самых амбициозных инженерных решений в области облачных технологий, позволяя обслуживать в пять раз больше моделей на том же количестве GPU.

Проблема неравномерных нагрузок

Современные облачные инфраструктуры часто сталкиваются с тем, что загрузка видеокарт распределяется крайне неравномерно. Несколько популярных моделей — например, Qwen или DeepSeek - постоянно находятся в работе, тогда как сотни менее востребованных остаются в режиме простоя, при этом продолжают занимать дорогостоящие вычислительные ресурсы.

Ранее одна видеокарта могла стабильно обслуживать максимум две-три модели. Всё остальное время ускорители простаивали, создавая неэффективность и финансовые потери. Именно эту задачу решает новая система Aegaeon.

Динамическое распределение GPU в реальном времени

Ключевая инновация Aegaeon заключается в динамическом управлении ресурсами. Система анализирует загрузку серверов и в реальном времени перераспределяет GPU между моделями, включая переключение прямо во время выполнения задач. Такой подход исключает простои и обеспечивает равномерную загрузку вычислительных мощностей.

"С Aegaeon мы впервые добились баланса между скоростью отклика и эффективностью распределения GPU", — отметил инженер Alibaba Cloud Чжан Вэй.

В результате один графический процессор теперь способен одновременно обслуживать до семи AI-моделей, а время задержек при переключении задач сократилось на 97%. Это особенно важно для облачных платформ, где время отклика напрямую влияет на пользовательский опыт.

Где уже используется Aegaeon

Пилотное внедрение новой системы прошло на маркетплейсе Bailian, принадлежащем Alibaba Cloud. На этой платформе размещаются сотни моделей сторонних разработчиков, включая языковые, визуальные и мультимодальные системы. Именно такой формат и стал идеальным полигоном для Aegaeon: постоянное перераспределение нагрузки между десятками тысяч запросов делает технологию особенно востребованной.

Кроме того, компания заявляет, что Aegaeon совместим с существующими фреймворками и может масштабироваться без необходимости менять архитектуру дата-центров.

Сравнение: Aegaeon против традиционных систем

Параметр Традиционные облачные решения Aegaeon
Количество моделей на 1 GPU 2-3 до 7
Задержка при переключении 100% (базовое значение) -97%
Эффективность использования GPU ~35% до 90%
Масштабируемость Ограниченная Горизонтальная и вертикальная
Энергопотребление Высокое Снижено на 40-50%

Как работает система: пошаговый принцип

  1. Мониторинг нагрузки. Aegaeon в режиме реального времени отслеживает активность всех моделей в облаке.

  2. Анализ приоритетов. Система оценивает, какие из моделей нуждаются в непрерывном доступе к GPU, а какие могут работать в пакетном режиме.

  3. Мгновенное переключение. На основе анализа Aegaeon распределяет ресурсы GPU, используя технологию горячего контекстного переключения.

  4. Оптимизация на уровне драйвера. Алгоритм снижает задержки между задачами и предотвращает конфликт доступа к памяти GPU.

  5. Самообучение. Система корректирует собственные стратегии на основе накопленных данных, адаптируясь к изменению нагрузки.

Ошибка → Последствие → Альтернатива

  • Ошибка: закрепление каждого GPU за одной моделью.
    Последствие: простаивание вычислительных блоков при низком спросе.
    Альтернатива: динамическое распределение GPU мощностей через Aegaeon.

  • Ошибка: масштабирование инфраструктуры через закупку новых ускорителей.
    Последствие: рост расходов и зависимость от поставок Nvidia.
    Альтернатива: оптимизация загрузки существующих GPU, снижая потребность в их количестве в 4-5 раз.

  • Ошибка: использование универсальных планировщиков без приоритизации AI-задач.
    Последствие: рост задержек и снижение качества отклика.
    Альтернатива: специализированная система планирования, адаптированная под работу нейросетей.

А что если…

А что если через несколько лет компании перестанут наращивать парки GPU и вместо этого будут просто эффективнее использовать существующие ресурсы? Aegaeon может стать именно тем решением, которое изменит экономику облачных вычислений, позволяя создавать дешёвый и устойчивый AI даже при дефиците аппаратуры.

Плюсы и минусы Aegaeon

Плюсы Минусы
Сокращает потребность в GPU до 5 раз Сложная настройка на этапе внедрения
Уменьшает задержки при переключении задач Требует поддержки со стороны инфраструктуры
Увеличивает эффективность использования ресурсов Высокие требования к мониторингу и телеметрии
Масштабируется без аппаратных изменений Пока внедрена только в экосистеме Alibaba

FAQ

Как Aegaeon влияет на энергопотребление?
Система позволяет снизить энергозатраты дата-центров на 40-50%, поскольку GPU не простаивают и работают в оптимальных режимах.

Можно ли использовать Aegaeon вне Alibaba Cloud?
Технология пока доступна только в облачной экосистеме компании, но в будущем возможна коммерческая лицензия для партнёров.

Поддерживает ли Aegaeon разные фреймворки — PyTorch, TensorFlow, JAX?
Да, система совместима с основными AI-фреймворками через адаптационные слои планировщика.

Каковы реальные результаты внедрения на Bailian?
По данным Alibaba, производительность выросла в 4,8 раза, а задержки при генерации ответов уменьшились почти до нуля.

Мифы и правда

  • Миф: увеличение количества моделей на GPU обязательно снижает скорость работы.
    Правда: Aegaeon применяет контекстное переключение, исключающее потерю производительности.

  • Миф: только новые видеокарты способны эффективно работать с множеством моделей.
    Правда: система оптимизирует даже старые GPU, повышая их коэффициент загрузки.

  • Миф: подобные технологии доступны только гиперскейлерам.
    Правда: Aegaeon может стать основой для более демократичных облаков, доступных разработчикам по всему миру.

3 интересных факта

  1. Название Aegaeon отсылает к греческому титаниду, символу силы и многообразия — что отражает идею многозадачности GPU.

  2. При тестировании система обрабатывала до 60 000 AI-запросов в секунду без потери качества генерации.

  3. Разработка Aegaeon заняла менее двух лет и велась совместно с исследовательским институтом DAMO Academy.

Автор Олег Белов
Олег Белов — журналист, корреспондент Ньюсинфо

Подписывайтесь на NewsInfo.Ru

Читайте также

Память телефона забита, а фото удалять жалко: решение проще, чем кажется 02.02.2026 в 12:33

Эксперт по кибербезопасности Алексей Лукацкий рассказал NewsInfo, как освободить память телефона, не удаляя важные фото и видео.

Читать полностью »
Отключение превью возвращает автосохранение скриншотов — Моника Торрес 21.01.2026 в 9:38
Скриншоты в iOS 26 превратились в лишний квест — решение оказалось в одном переключателе

Технологии и мобильные устройства: iOS 26 обновление меняет скриншоты и добавляет настройки превью. Разбираемся, зачем Apple усложнила процесс и как вернуть мгновенное сохранение.

Читать полностью »
Пароли нужно менять каждые три месяца —IT-эксперт Дворянский 16.01.2026 в 13:31
Кажется надежным, но работает против вас: когда пароли нужно срочно менять

Эксперт по IT-безопасности Александр Дворянский рассказал NewsInfo, как часто нужно менять пароли и почему одинаковые комбинации опасны.

Читать полностью »
CES 2026 в Лас-Вегасе собрала более 4100 компаний и стартапов - РБК 12.01.2026 в 18:33
Lenovo растянула ноутбук, Samsung сложила планшет: CES 2026 собрала технологии, которые ломают привычки

На CES 2026 в Лас-Вегасе представлены потрясающие технологии: от трансформируемых экранов до домашних роботов. Убедитесь, что вы знаете все подробности!

Читать полностью »
После износа батареек их можно использовать в пульте для телевизора — эксперт 09.01.2026 в 5:09
Меньше батареек — больше сэкономленных рублей: как правильно использовать их до последней капли

Узнайте, как продлить срок службы батареек и не тратить деньги зря. Маленькая хитрость поможет вам экономить на источниках питания.

Читать полностью »
В 2025 году для России актуальны DDoS-атаки и кибершпионаж — Станислав Кузнецов 03.01.2026 в 5:23
Злоумышленники атакуют по всем фронтам: как выжить в мире киберугроз и не потерять бизнес

В 2025 году киберугрозы для российских организаций остаются актуальными, включая DDoS-атаки и программы-шифровальщики, сумма выкупа за которые может достигать 500 млн рублей.

Читать полностью »
Проблемы с производительностью Windows 11 сдерживают её популярность – TechRadar 31.12.2025 в 5:24
Ошибки после обновлений и искусственный интеллект: почему Windows 11 не может угодить пользователям

Несмотря на четыре года с момента выпуска, Windows 11 остается проблемной ОС с медлительностью, проблемами с производительностью и навязчивым ИИ.

Читать полностью »
В конце года мошенники активизируются, используя фишинг и ложные скидки, предупреждает эксперт — РИА Новости 30.12.2025 в 6:17
Искусственный интеллект в действии: как технологии помогают распознать мошенников и защитить данные

Искусственный интеллект помогает защитить пользователей от мошенников, анализируя сайты и звонки, чтобы избежать фишинга и других угроз.

Читать полностью »