Россия Мир Экономика Происшествия Все рубрики
Mobile menu button
Google Gemini
Google Gemini
© commons.wikimedia.org by Steffen Prößdorf is licensed under CC BY-SA 4.0
Главная / Технологии
Алексей Ларин Опубликована вчера в 22:55

ИИ теперь слышит сердцем: как голосовой ассистент Google научился понимать настроение человека

Google внедрила систему распознавания эмоций в голосовой ассистент Gemini Live

Google внедрила в голосового ассистента Gemini Live новую систему, которая позволяет ИИ понимать не только смысл сказанных слов, но и настроение собеседника. Теперь приложение анализирует тембр, ритм и интонацию голоса, чтобы подстраивать стиль общения под эмоциональное состояние пользователя.

Новый уровень взаимодействия с искусственным интеллектом

Обновлённая версия Gemini Live построена на технологии Gemini 2.5 Flash Live API и получила название "нативный звук". Эта система меняет сам подход к диалогу между человеком и машиной. Если раньше ассистент просто обрабатывал команды, то теперь он способен учитывать эмоциональные оттенки речи. Например, спокойный голос побудит ИИ отвечать в более размеренном тоне, а взволнованная интонация — быстрее и увереннее.

По словам разработчиков, новая функция призвана сделать общение с ассистентом "человечнее" — чтобы взаимодействие походило не на разговор с программой, а на диалог с живым собеседником.

Распространение и совместимость

На первом этапе технология появляется на устройствах под управлением Android, включая смартфоны и планшеты разных производителей. Владельцы флагманской серии Pixel 10 уже начали получать обновление, а вскоре оно станет доступно и другим пользователям.

О сроках релиза для iOS пока не объявлено, однако Google намекает, что поддержка платформы может появиться в ближайшие недели.

Развёртывание функции проходит поэтапно, чтобы обеспечить стабильную работу и корректное распознавание интонаций на разных языках и акцентах.

Новые возможности настройки

Помимо анализа речи, Google добавила дополнительные опции для настройки голосового вывода Gemini. Теперь пользователь может:

  1. изменять скорость речи ассистента — от медленного, почти спокойного тона до быстрого ритма.

  2. выбирать разные акценты для английского языка, что делает общение более привычным для носителей из разных регионов.

  3. настраивать все параметры в отдельном разделе меню приложения, где также доступны обновления и тестовые функции.

Эти улучшения дают больше свободы тем, кто активно использует голосовой ввод для управления устройствами или работы с ИИ-инструментами.

Ошибка → Последствие → Альтернатива

  • Ошибка: использовать ассистента в шумной среде или при плохом микрофоне.
    Последствие: система может неправильно определить интонацию или контекст фразы.
    Альтернатива: использовать наушники с шумоподавлением или внешний микрофон.

  • Ошибка: не обновлять приложение вовремя.
    Последствие: часть новых функций, включая "нативный звук", будет недоступна.
    Альтернатива: включить автоматическое обновление в Google Play.

  • Ошибка: чрезмерно повышать голос при обращении к ассистенту.
    Последствие: ИИ может воспринять речь как сигнал тревоги и изменить стиль ответа.
    Альтернатива: говорить спокойно — алгоритм лучше понимает эмоциональные нюансы.

А что если…

Если использовать Gemini Live для длительных разговоров, ИИ начнет адаптировать манеру общения под конкретного человека. Например, он может "запоминать" ритм речи, скорость и даже типичные паузы собеседника, чтобы делать ответы естественнее. Это особенно полезно для людей, использующих ассистента в работе, обучении или терапии.

FAQ

Как включить анализ тона голоса в Gemini Live?
Функция активируется автоматически после обновления приложения. Проверить можно в разделе "Настройки → Голосовые функции".

Можно ли отключить распознавание эмоций?
Да, в том же меню есть переключатель "Анализ тона", который позволяет полностью отключить эмоциональную адаптацию.

Будет ли функция работать на русском языке?
Пока основной фокус — на английском, но Google уже тестирует поддержку нескольких языков, включая русский, испанский и немецкий.

Мифы и правда

Миф: новая функция записывает и хранит эмоции пользователя.
Правда: система анализирует голос в реальном времени и не сохраняет аудиофайлы после завершения сессии.

Миф: "нативный звук" доступен только на смартфонах Pixel.
Правда: технология распространяется и на другие устройства Android, просто релиз происходит поэтапно.

Миф: ассистент теперь понимает сарказм и иронию.
Правда: он может уловить изменения интонации, но не всегда корректно интерпретирует сложные эмоциональные оттенки.

Интересные факты

• Разработка функции велась более двух лет и включала анализ 10 миллионов часов реальной речи.
• Прототип технологии впервые тестировался внутри Google Meet для улучшения качества видеозвонков.
• В будущем "нативный звук" может использоваться в системах поддержки клиентов и умных колонках.

Подписывайтесь на NewsInfo.Ru

Читайте также

Copilot в Windows 11 теперь доступен на любых компьютерах — Microsoft вчера в 23:27
Говори, что делать — и он сделает: Copilot научился видеть, слышать и кликать за тебя

Microsoft сделала ИИ-дополнения доступными для всех ПК с Windows 11. Copilot теперь умеет видеть экран, слушать голос и выполнять команды пользователя.

Читать полностью » Продажи iPhone 17 в США и Китае выросли на 14% по сравнению с iPhone 16 — данные Counterpoint вчера в 14:20
Старый iPhone плачет в углу: почему новый 17-й продаётся как горячие пирожки

Базовая модель iPhone 17 демонстрирует рекордные продажи в США и Китае, опережая iPhone 16 и вызывая повышенный интерес покупателей.

Читать полностью » UMass: 90% заданий из планов уроков ИИ — лишь базовое мышление вчера в 13:16
Уроки от ИИ выглядят идеально — но школьники зевают: что пошло не так с ChatGPT и Gemini

Исследователи Массачусетского университета выяснили, что ИИ не делает уроки интереснее. Почему планы, созданные чат-ботами, мешают развитию мышления и как использовать их с пользой?

Читать полностью » DeepSeek-OCR распознаёт структуру документов: заголовки, таблицы, списки — DeepSeek вчера в 12:34
ИИ, который сжимает не только файлы, но и стоимость: токенов меньше — смысла больше

DeepSeek представила открытую модель OCR, которая не просто читает текст, а понимает структуру документа. Узнайте, как она делает это быстрее и дешевле других.

Читать полностью » Сара Бонд заявила, что цену на ROG Xbox Ally X установила Asus, а не Microsoft вчера в 11:17
Дорогой, но не от Xbox: кто на самом деле поставил цену на консоль за тысячу долларов

Сара Бонд объяснила, кто установил цену в $1000 за ROG Xbox Ally X. Почему Asus взяла на себя ответственность и как консоль всё равно стала хитом продаж?

Читать полностью » iPhone Air полностью распродан в Китае за пять минут после старта продаж вчера в 10:17
iPhone, который легче воздуха: в Китае он исчез быстрее, чем открылся сайт

В Китае за пять минут раскупили самый тонкий iPhone Air. Как визит Тима Кука и ставка на eSIM сделали запуск смартфона одним из самых успешных в истории Apple?

Читать полностью » Трафик Wikipedia упал на 8% из-за ответов искусственного интеллекта в поиске вчера в 9:27
ИИ ест знания, но не оставляет крошек: Wikipedia теряет читателей из-за Google и чат-ботов

ИИ лишает Wikipedia части аудитории: поисковики всё чаще показывают готовые ответы без ссылок. Почему это угрожает самой идее открытых знаний?

Читать полностью » Google отказалась от инициативы Privacy Sandbox и пересматривает стратегию приватности вчера в 8:26
Google тихо похоронила Privacy Sandbox: что это значит для рекламы и наших данных

Google закрывает Privacy Sandbox, но не отказывается от идеи приватной рекламы. Почему проект не прижился и какие технологии компания сохранит для будущего интернета?

Читать полностью »

Новости
Дом
Проверенный способ размножения герани: как укоренить черенки за две недели
Спорт и фитнес
Оптимальный километраж для бега: рекомендации спортивных тренеров
Культура и шоу-бизнес
Мелисса Баррера и Джон Траволта снимутся в триллере Ренни Харлина "Чёрные приливы"
Дом
Учёные подтвердили связь между визуальным беспорядком и повышением уровня стресса
Спорт и фитнес
Исследование BMJ Evidence-Based Medicine показало, что йога, тай-чи и ходьба помогают при бессоннице
Наука
Компьютерное моделирование определило новый возраст бассейна Ясности на Луне — 4,25 млрд лет
Красота и здоровье
Лосось содержит больше омега-3, а тунец — больше белка
Наука
Профессор Стрингер: общий предок Homo sapiens жил на миллион лет раньше предполагаемого срока
Все рубрики О проекте Архив Авторы

Сетевое издание NewsInfo зарегистрировано Роскомнадзором 10 июня 2022 года (Эл № ФС77-83422).
Материалы сайта предназначены для лиц старше 18 лет (18+).
Учредитель - Новикова Инна Семеновна.
Главный редактор — Шестернёв Владислав Игоревич.
Контакты: +7 (499) 641-41-69, 105066, Москва, ул. Александра Лукьянова, д. 3, ООО "РИЦ Правда", info@newsinfo.ru

Counter LiveInternet