Компания Google обновит движок для преобразования текста в речь Speech Services на Android-устройствах, сделав звучание голосов более чистым и естественным.
https://twitter.com/AndroidDev/status/1575214686118739982
По данным разработчиков, пользователям не придется ничего делать — модернизация технологии «произойдет за кулисами». Обновление «значительно улучшит» качество сгенерированной речи, особенно в отношении четкости и естественности, добавили они.
table, th, td {
border:0px solid black;
font-family: 'Inter var',sans-serif;
font-size: 12px;
font-weight: 400;
color: #65687d;
font-style:normal;
}
Пример текущего звучания сгенерированной речи
Пример звучания сгенерированной речи после обновления
421 голос на 67 языках получит новую речевую модель и синтезатор. Текущее звучание американского английского автоматически изменится на спич, созданный с помощью «более свежих данных».
Разработчики также показали образцы обновленных голосов на других языках.
table, th, td {
border:0px solid black;
font-family: 'Inter var',sans-serif;
font-size: 12px;
font-weight: 400;
color: #65687d;
font-style:normal;
}
Португальский (Бразилия) до обновления
Португальский (Бразилия) после обновления
Испанский (США) до обновления
Испанский (США) после обновления
Компания распространит обновление для Speech Services на все 64-разрядные Android-устройства через магазин приложений Google Play в течение следующих нескольких недель.
Напомним, в сентябре OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках.
В августе стриминговый сервис Megogo задействовал ИИ для озвучивания видеоконтента.
В мае 2021 года Google представила нейросетевую модель LaMDA, которая общается как живой человек и поддерживает непринужденный диалог на разные темы.
Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!