makowkina_nata (makowkina_nata) wrote,
makowkina_nata
makowkina_nata

Category:

Нейросеть научили копировать голос при синтезе текста в речь





Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
Оригинал взят у bamymih в Нейросеть научили копировать голос при синтезе текста в речь

Subscribe
promo makowkina_nata april 19, 2017 09:46 234
Buy for 10 tokens
Дорогой Гость! Приветствую тебя в своем журнале! Меня зовут Наталья. Живу я, пожалуй, в самом живописном регионе матушки-России - на Кавказе. Выросла я в спортивной семье, и это отразилось на выборе специальности. Я закончила Кубанский Государственный университет физической, культуры, спорта и…
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments