
OpenAI представила предварительную версию нового голосового движка под названием Voice Engine
Voice Engine позволяет создавать синтетические копии голосов на основе коротких аудиообразцов продолжительностью 15 секунд. Voice Engine представляет собой расширение существующего API для текста в речь, разработанного компанией.
Основанная на генеративной модели искусственного интеллекта, работа над Voice Engine продолжалась около двух лет. Эта модель уже используется в голосовых функциях и функциях чтения в чат-боте ChatGPT и голосах OpenAI для текста в речь. Отличительной чертой нового движка является его способность восстанавливать исходный голос после растяжения.
Хотя точная дата общедоступного использования Voice Engine пока не определена, OpenAI планирует тщательно контролировать его использование, чтобы предотвратить возможные злоупотребления. Потенциальные этические и правовые проблемы, включая угрозу профессии озвучивания, ставятся в центр внимания компании.
Ожидается, что Voice Engine найдет применение в медицине, образовании и других сферах, где синтетические голоса могут быть полезны для людей с нарушениями речи или инвалидностью. Кроме того, он может использоваться для создания голосовых ассистентов, озвучивания аудиокниг и других коммерческих приложений, сообщает Ferra.Ru.
Подписывайтесь на NewsInfo.Ru