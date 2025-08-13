В Университете штата Пенсильвания была разработана новая технология, которая позволяет прослушивать телефонные разговоры, используя вибрации корпуса телефона от звуков динамика. Это открытие представляет собой серьезную угрозу для конфиденциальности и подчеркивает необходимость повышения осведомленности о возможных рисках.

Принцип работы: радар и искусственный интеллект

Как это работает? Когда мы разговариваем по телефону, корпус устройства вибрирует под воздействием звуковых волн, исходящих из динамика. Ученые разработали устройство, способное улавливать эти вибрации с помощью миллиметрового радарного датчика, который используется в беспилотных автомобилях и других современных технологиях. Далее данные обрабатываются алгоритмами машинного обучения, что позволяет восстановить содержание разговора.

"Когда мы разговариваем по телефону, мы обычно не замечаем вибрации корпуса, порождаемые звуками из динамика”, — пояснил ведущий автор исследования, Сурёдай Базак, аспирант компьютерных наук. "Осознавая такую возможность, мы хотим помочь людям лучше понимать потенциальные риски”, — добавил он, подчеркивая исследовательский характер работы и стремление предупредить возможные угрозы.

Серийно выпускаемый миллиметровый радарный датчик был соединен с одноплатным компьютером, что позволило создать прототип подслушивающего устройства. Для расшифровки вибраций в узнаваемую речь ученые адаптировали Whisper — открытую модель распознавания речи на основе искусственного интеллекта (ИИ).

"За последние три года произошел огромный скачок в возможностях ИИ и открытых моделях распознавания речи”, — отметил Сурёдай Базак.

Однако модели распознавания речи, такие как Whisper, изначально рассчитаны на чистую речь и повседневные сценарии. Поэтому ученым пришлось доработать Whisper для работы с "зашумленными” радарными данными.

Низкоранговая адаптация: эффективный метод

Для приспособления Whisper к расшифровке плохо различимой речи был применен метод низкоранговой адаптации, который позволяет обойтись донастройкой всего 1% параметров модели вместо ее полного переобучения. Это позволило ускорить процесс адаптации и получить удовлетворительные результаты.

Для анализа вибраций радарный датчик размещали на расстоянии до полуметра от телефона. Он улавливал малейшие колебания корпуса во время воспроизведения речи через динамик и передавал данные в адаптированную версию Whisper. В результате эксперимента удалось распознавать текст с точностью до 60%.

Улучшение точности: контекст и корректировка

Точность распознавания можно повысить, если вручную корректировать расшифровку с учетом контекста, например, подставляя вероятные слова или фразы, когда известна тема разговора. Это позволяет существенно улучшить результаты и получить более точную информацию.

"Результатом стала расшифровка разговоров с ожидаемыми ошибками — это значительный прогресс по сравнению с нашей версией 2022 года, которая выдавала лишь отдельные слова”, — поделился Махант Гоуда, соавтор и научный руководитель Сурёдая Базака.

Экспериментаторы установили, что вибрации улавливаются в радиусе до трех метров, но, конечно, с значительным ухудшением точности распознавания.

Новая технология прослушивания телефонных разговоров подчеркивает необходимость обеспечения безопасности в цифровую эпоху. Это открытие требует повышенного внимания к защите конфиденциальности личной информации и разработке новых методов защиты от подобных угроз.

Интересные факты: