OpenAI объявила о запуске нового инструмента под названием Voice Engine. Это технология клонирования голоса, которая позволяет имитировать речь любого человека после анализа 15-секундного аудиосэмпла. Компания заявляет, что Voice Engine генерирует «естественно звучащую речь» с «эмоциональными и реалистичными голосами».

Основой для этой технологии послужило уже существующее API преобразования текста в речь, которое OpenAI разрабатывает с 2022 года. Компания уже использует этот инструмент для поддержки голосов, доступных в текущей версии API преобразования текста в речь, а также для функции чтения вслух. В официальном блоге компании можно найти множество примеров, которые звучат очень близко к реальным голосам.
OpenAI считает, что Voice Engine может быть полезным инструментом для чтения, языкового перевода и помощи людям с речевыми нарушениями. В рамках пилотного проекта совместно с Браунским Университетом компания использовала Voice Engine для помощи …
Свежие комментарии