OpenAI представила инструмент, полноценно клонирующий голос: Voice Engine достаточно 15-секундного семпла

OpenAI объявила о запуске нового инструмента под названием Voice Engine. Это технология клонирования голоса, которая позволяет имитировать речь любого человека после анализа 15-секундного аудиосэмпла. Компания заявляет, что Voice Engine генерирует «естественно звучащую речь» с «эмоциональными и реалистичными голосами».

Источник: Andrew Neel / Unsplash

Основой для этой технологии послужило уже существующее API преобразования текста в речь, которое OpenAI разрабатывает с 2022 года. Компания уже использует этот инструмент для поддержки голосов, доступных в текущей версии API преобразования текста в речь, а также для функции чтения вслух. В официальном блоге компании можно найти множество примеров, которые звучат очень близко к реальным голосам.

OpenAI считает, что Voice Engine может быть полезным инструментом для чтения, языкового перевода и помощи людям с речевыми нарушениями. В рамках пилотного проекта совместно с Браунским Университетом компания использовала Voice Engine для помощи …

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

andrew neel

браунский университет

iXBT.com

Свежие комментарии

Прогресс

OpenAI представила инструмент, полноценно клонирующий голос: Voice Engine достаточно 15-секундного семпла