Google Gemini
Google Gemini
Алексей Ларин Опубликована вчера в 22:55

ИИ теперь слышит сердцем: как голосовой ассистент Google научился понимать настроение человека

Google внедрила систему распознавания эмоций в голосовой ассистент Gemini Live

Google внедрила в голосового ассистента Gemini Live новую систему, которая позволяет ИИ понимать не только смысл сказанных слов, но и настроение собеседника. Теперь приложение анализирует тембр, ритм и интонацию голоса, чтобы подстраивать стиль общения под эмоциональное состояние пользователя.

Новый уровень взаимодействия с искусственным интеллектом

Обновлённая версия Gemini Live построена на технологии Gemini 2.5 Flash Live API и получила название "нативный звук". Эта система меняет сам подход к диалогу между человеком и машиной. Если раньше ассистент просто обрабатывал команды, то теперь он способен учитывать эмоциональные оттенки речи. Например, спокойный голос побудит ИИ отвечать в более размеренном тоне, а взволнованная интонация — быстрее и увереннее.

По словам разработчиков, новая функция призвана сделать общение с ассистентом "человечнее" — чтобы взаимодействие походило не на разговор с программой, а на диалог с живым собеседником.

Распространение и совместимость

На первом этапе технология появляется на устройствах под управлением Android, включая смартфоны и планшеты разных производителей. Владельцы флагманской серии Pixel 10 уже начали получать обновление, а вскоре оно станет доступно и другим пользователям.

О сроках релиза для iOS пока не объявлено, однако Google намекает, что поддержка платформы может появиться в ближайшие недели.

Развёртывание функции проходит поэтапно, чтобы обеспечить стабильную работу и корректное распознавание интонаций на разных языках и акцентах.

Новые возможности настройки

Помимо анализа речи, Google добавила дополнительные опции для настройки голосового вывода Gemini. Теперь пользователь может:

  1. изменять скорость речи ассистента — от медленного, почти спокойного тона до быстрого ритма.

  2. выбирать разные акценты для английского языка, что делает общение более привычным для носителей из разных регионов.

  3. настраивать все параметры в отдельном разделе меню приложения, где также доступны обновления и тестовые функции.

Эти улучшения дают больше свободы тем, кто активно использует голосовой ввод для управления устройствами или работы с ИИ-инструментами.

Ошибка → Последствие → Альтернатива

  • Ошибка: использовать ассистента в шумной среде или при плохом микрофоне.
    Последствие: система может неправильно определить интонацию или контекст фразы.
    Альтернатива: использовать наушники с шумоподавлением или внешний микрофон.

  • Ошибка: не обновлять приложение вовремя.
    Последствие: часть новых функций, включая "нативный звук", будет недоступна.
    Альтернатива: включить автоматическое обновление в Google Play.

  • Ошибка: чрезмерно повышать голос при обращении к ассистенту.
    Последствие: ИИ может воспринять речь как сигнал тревоги и изменить стиль ответа.
    Альтернатива: говорить спокойно — алгоритм лучше понимает эмоциональные нюансы.

А что если…

Если использовать Gemini Live для длительных разговоров, ИИ начнет адаптировать манеру общения под конкретного человека. Например, он может "запоминать" ритм речи, скорость и даже типичные паузы собеседника, чтобы делать ответы естественнее. Это особенно полезно для людей, использующих ассистента в работе, обучении или терапии.

FAQ

Как включить анализ тона голоса в Gemini Live?
Функция активируется автоматически после обновления приложения. Проверить можно в разделе "Настройки → Голосовые функции".

Можно ли отключить распознавание эмоций?
Да, в том же меню есть переключатель "Анализ тона", который позволяет полностью отключить эмоциональную адаптацию.

Будет ли функция работать на русском языке?
Пока основной фокус — на английском, но Google уже тестирует поддержку нескольких языков, включая русский, испанский и немецкий.

Мифы и правда

Миф: новая функция записывает и хранит эмоции пользователя.
Правда: система анализирует голос в реальном времени и не сохраняет аудиофайлы после завершения сессии.

Миф: "нативный звук" доступен только на смартфонах Pixel.
Правда: технология распространяется и на другие устройства Android, просто релиз происходит поэтапно.

Миф: ассистент теперь понимает сарказм и иронию.
Правда: он может уловить изменения интонации, но не всегда корректно интерпретирует сложные эмоциональные оттенки.

Интересные факты

• Разработка функции велась более двух лет и включала анализ 10 миллионов часов реальной речи.
• Прототип технологии впервые тестировался внутри Google Meet для улучшения качества видеозвонков.
• В будущем "нативный звук" может использоваться в системах поддержки клиентов и умных колонках.

Подписывайтесь на NewsInfo.Ru

Читайте также

Стартап 1001 AI Билала Абу-Газале привлёк $9 млн для создания ИИ-инфраструктуры Ближнего Востока сегодня в 1:26
ИИ начал управлять стройками и аэропортами: Ближний Восток строит цифровой мозг инфраструктуры

Билал Абу-Газале запускает 1001 AI — стартап, который хочет сделать инфраструктуру Ближнего Востока умной. Как ИИ поможет аэропортам, стройкам и нефтегазу работать эффективнее?

Читать полностью »
Физик Алекс Лупсаска проверил GPT-5 Pro на задаче о симметриях чёрной дыры Керра сегодня в 0:26
GPT-5 заглянул внутрь чёрной дыры — и нашёл симметрию быстрее, чем человек

Физик Алекс Лупсаска проверил GPT-5 Pro задачей о симметрии черной дыры Керра — и модель нашла решение за полчаса. Что это значит для науки и роли ИИ в теоретической физике?

Читать полностью »
Copilot в Windows 11 теперь доступен на любых компьютерах — Microsoft вчера в 23:27
Говори, что делать — и он сделает: Copilot научился видеть, слышать и кликать за тебя

Microsoft сделала ИИ-дополнения доступными для всех ПК с Windows 11. Copilot теперь умеет видеть экран, слушать голос и выполнять команды пользователя.

Читать полностью »
Reddit Answers распространяет опасные советы в медицинских сообществах вчера в 21:16
Мы бы отключили, если бы могли: медики бьют тревогу из-за советов искусственного разума

ИИ-функция Reddit Answers вызвала бурю в медицинских сообществах: модераторы предупреждают о дезинформации, но не могут её отключить. Почему это стало проблемой?

Читать полностью »
Блогер Michi NekoMichi выявил ошибку ввода текста на iPhone с iOS 16 вчера в 20:53
Apple снова облажалась: пользователи бьют тревогу из-за странного бага с клавиатурой

Блогер показал, что сбой клавиатуры в iOS — не иллюзия, а реальный баг, который искажает ввод текста даже при правильных нажатиях.

Читать полностью »
Андрей Карпати запустил школу Eureka Labs для практического обучения ИИ вчера в 19:16
ИИ по-настоящему: как бывший топ Tesla решил перевернуть подход к обучению

Андрей Карпати создаёт школу нового типа — Eureka Labs. Вместо теории и демо здесь учат собирать реальные ИИ-приложения. Что делает её уникальной?

Читать полностью »
Apptopia: темпы загрузок мобильного ChatGPT в октябре 2025 года снизятся на 8,1% вчера в 18:07
Империя ИИ замедляет шаг: ChatGPT впервые споткнулся на пути к вершине

Темпы роста ChatGPT впервые снизились: пользователи стали реже открывать приложение. Что стоит за этим трендом и как OpenAI может вернуть интерес?

Читать полностью »
FSF призвала пользователей Windows 10 перейти на GNU/Linux после завершения поддержки вчера в 17:16
Плати или уходи: что стоит за прощанием с Windows 10 и кто от этого выигрывает

Завершение поддержки Windows 10 FSF называет не угрозой, а шансом. Почему активисты уверены, что переход на GNU/Linux — путь к цифровой свободе?

Читать полностью »