Прозрачные картинки крадут ваши ключи: как GitHub Copilot стал шпионским инструментом

Уязвимость Copilot: злоумышленник может эксфильтрировать ключи через ссылки — Legit Security

Исходный инцидент показывает: даже инструменты, созданные чтобы помогать разработчикам, могут стать каналом утечки секретов, если их использовать неправильно. Исследователи из Legit Security продемонстрировали практический сценарий атаки на GitHub Copilot, при котором конфиденциальные строки из приватных репозиториев (например, ключи доступа AWS) извлекаются через хитроумную визуальную эксфильтрацию.

Краткое описание уязвимости

GitHub Copilot способен подгружать изображения, связанные с обрабатываемым контентом. Атака использует это поведение вместе с возможностью слать в pull-request скрытые HTML-комментарии вида . Злоумышленник формирует набор однопиксельных прозрачных PNG-изображений, где каждая картинка соответствует отдельному символу (букве, цифре или спецсимволу).

В теле pull-request в скрытом комментарии даётся инструкция боту: найти в репозиториях строки, содержащие, например, AWS_KEY, и вывести их не как текст, а "изобразить" последовательностью картинок. Для сопоставления символов с картинками в комментарии приводится таблица соответствий. Поскольку изображения прозрачные, мейнтейнер не увидит визуальной аномалии, а злоумышленник восстановит ключи, анализируя логи запросов к серверу изображений.

Технический обход защит (CSP и Camo)

Ограничения Content Security Policy на GitHub позволяют подгружать изображения только с серверов GitHub. Чтобы обойти это, атакующий проксирует ресурсы через сервис GitHub Camo — промежуточный узел, который ретранслирует внешние картинки и делает их доступными под доменом camo. githubusercontent.com. Через REST API GitHub attacker заранее добавляет и верифицирует пути в Camo, после чего ссылки в таблице соответствий указываются на https://camo.githubusercontent.com/<хэш_картинки>. Это позволяет скрыто загружать нужные пиксели и маскировать источник.

Таблица "Сравнение"

Сравним ключевые элементы атаки и типовую защиту.

Атака: визуальная эксфильтрация через прозрачные изображения.
Защита: строгая CSP + проверка содержимого pull-request.

Элемент	Уязвимость	Тип защиты
Источник изображений	Внешние картинки, ретранслированные через Camo	Запрет внешних ресурсов / жёсткая валидация путей
Комментарии	Скрытые HTML-комментарии в PR	Скрипты/анализатор комментариев на подозрительные инструкции
Логирование	HTTP-логи Camo показывают последовательность загрузок	Ограничение логирования, мониторинг аномалий

Советы шаг за шагом (HowTo)

Проанализируйте текущую политику CSP репозиториев и сократите разрешённые домены для изображений.
Настройте серверную проверку вставляемых в PR ссылок — блокируйте camo-прокси или требуйте подписи источника.
Внедрите сканер комментариев в CI: ищите шаблоны вроде "visualize", "image map", таблиц соответствий символ→URL.
Ограничьте права ботов: не разрешайте автоматическим ассистентам читать приватные репозитории без отдельного аудита.
Введите мониторинг аномального трафика к Camo/другим прокси: резкие серии запросов к маленьким файлам — красный флаг.

Ошибка → Последствие → Альтернатива

Ошибка: доверять автоматическому выводу Copilot без проверки. → Последствие: утечка секретов. → Альтернатива: требовать ручного подтверждения чувствительных операций и ревью.
Ошибка: разрешать произвольные внешние изображения в README/PR. → Последствие: канал для эксфильтрации. → Альтернатива: блокировать сторонние прокси и использовать белый список хостов.
Ошибка: хранить ключи в коде. → Последствие: любая автоматизация, читающая код — риск. → Альтернатива: использовать секрет-менеджеры (Vault, AWS Secrets Manager) и ротацию ключей.

"А что если…"

…бот не может читать приватные репозитории?

Если у ассистента нет прав — метод не сработает. Но атака требует, чтобы бот выполнял анализ присланного PR и имел доступ к контексту; потому главный вектор — неправильно настроенные разрешения.

…лог сервера недоступен атакующему?

Если логи Camo не публичны, восстановление возможно через компрометацию прокси или анализ запросов на стороне клиента. Поэтому мониторинг и защита прокси критичны.

Таблица "Плюсы и минусы"

Плюсы (для атакующего)	Минусы (для защищающейся стороны)
Малозаметность (прозрачные картинки)	Требуется подготовка: настройка Camo и API
Использует легитимные механизмы платформы	Риск обнаружения при аномальном трафике

FAQ (минимум 3 вопроса)

Как выбирать настройки прав для ботов?

Ограничьте доступ ботов принципом наименьших привилегий: права только на конкретный репозиторий/ветку и только на чтение тех частей, которые необходимы.

Сколько стоит внедрить защиту?

Стоимость зависит от масштаба: простые правила CSP и парсер комментариев — низкая; полноценный SIEM и анализ трафика — выше. Начните с базовой валидации и ротации секретов.

Что лучше для хранения ключей — файлы в репозитории или секрет-менеджер?

Секрет-менеджер однозначно лучше: он обеспечивает аудит, ротацию и доступ по политике — это минимизирует риск утечки.

Мифы и правда

Миф: "если ключа нет в явном тексте, значит всё в порядке". Правда: ключи могут передаваться косвенно или извлекаться из бинарных данных/логов.
Миф: "CSP решит все проблемы с внешними ресурсами". Правда: неправильная конфигурация или доверие прокси (Camo) делают CSP бесполезной.
Миф: "прозрачные изображения — безвредны". Правда: они могут служить каналом передачи данных.

Сон и психология

Утечки и инциденты сильно бьют по командам: ночные дежурства, постоянный стресс и потеря доверия. Важно планировать ротацию обязанностей, выделять время на отдых после инцидента и проводить разборы инцидентов в духе "что сломалось и как предотвратить", а не личностных обвинений.

Три интересных факта

Однопиксельные изображения уже использовались для трекинга пользователей в вебе; тут идея адаптирована для передачи данных.
GitHub Camo изначально создан для безопасности — ретрансляции картинок под контролем GitHub, но при неправильно настроенных путях он превращается в ретранслятор внешнего контента.
Визуальная эксфильтрация сложнее обнаруживается традиционными DLP-системами, которые фокусируются на текстовых паттернах.

Исторический контекст

Ранние веб-трекеры использовали tiny-images (1x1) для слежения; это предшественник техники.
Появление ассистентов кода расширило поверхность атаки: ботам дают доступ к контексту проектов.
Параллельно развивались прокси-сервисы (типа Camo) для приватности, которые при определённых условиях можно перенастроить в инструмент злоумышленника.

Подписывайтесь на NewsInfo.Ru