AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

NVIDIA рассказала о своих успехах в синтезировании естественной человеческой речи силами ИИ

01.09.2021
Share on FacebookShare on Twitter

NVIDIA рассказала о своих успехах в синтезировании естественной человеческой речи силами ИИ

Этоинтересно

3D-печатный дом от японской компании Onocom способен выдержать настоящее землетрясение

3D-печатный дом от японской компании Onocom способен выдержать настоящее землетрясение

02.03.2026
Роботы Xiaomi уже начали использоваться на автомобильном заводе

Роботы Xiaomi уже начали использоваться на автомобильном заводе

02.03.2026

Искусственный интеллект сейчас позволяет воссоздавать голос виртуальных помощников в смартфонах и умных колонках, очень похожий на человеческую речь. Хотя всё ещё можно заметить различия между речью синтезированной и живой, которую мы слышим в повседневной беседе и в средствах массовой информации. Это связано с тем, что люди говорят со сложным ритмом, интонацией и тембром, которые ИИ сложно воспроизвести.

Однако благодаря работе NVIDIA различия постепенно стираются. Исследователи компании создают модели и инструменты для высококачественного управляемого синтеза речи, которые передают богатство человеческой речи без звуковых артефактов. Их последние проекты теперь демонстрируются на сессиях конференции Interspeech 2021, которая продлится до 3 сентября.

Эти модели могут помочь в создании голосовых автоматических линий обслуживания клиентов для банков и предприятий розничной торговли, оживить персонажей видеоигр или книг и обеспечить синтез речи для цифровых аватаров в реальном времени.

Креативная команда NVIDIA даже использует эту технологию для создания выразительного повествования для серии видеороликов о возможностях искусственного интеллекта. До недавнего времени эти ролики озвучивал человек. Предыдущие модели синтеза речи предлагали ограниченный контроль над темпом и высотой звука синтезированного голоса, поэтому попытки повествования искусственного интеллекта не вызывали у зрителей эмоционального отклика, который мог бы дать талантливый оратор-человек.

Ситуация изменилась за последний год, когда исследовательская группа NVIDIA по преобразованию текста в речь разработала более мощные и управляемые модели синтеза речи, такие как RAD-TTS. Обучая модель преобразования текста в речь на базе речи человека, модель RAD-TTS может преобразовать любую текстовую заметку в голос говорящего.

Ещё одна особенность модели – это преобразование голоса, когда слова одного говорящего (или даже пение) передаются голосом другого говорящего. Интерфейс RAD-TTS даёт пользователям возможность точного управления высотой, длительностью и энергией синтезированного голоса на уровне кадра. В результате, например, мужчина может зачитать текст и затем преобразовать его в женский голос.

Возможности модели ИИ выходят за рамки озвучивания. Преобразование текста в речь можно использовать в играх, для помощи людям с нарушениями голоса или помощи пользователям при переводе между языками своим собственным голосом. ИИ даже может воссоздать выступления известных певцов, сочетая не только мелодию песни, но и эмоциональное выражение вокала.

Выразительный синтез речи – это лишь один из элементов исследований NVIDIA в области разговорного ИИ. Эта область также включает обработку естественного языка, автоматическое распознавание речи, обнаружение ключевых слов, улучшение звука и многое другое.

Эти разработки были сделаны с помощью инструментария NVIDIA NeMo и являются решениями с открытым исходным кодом. Они оптимизированы для эффективной работы на GPU NVIDIA и доступны для использования исследователям и разработчикам.

Источник: NVIDIA

Другие новости

3D-печатный дом от японской компании Onocom способен выдержать настоящее землетрясение

3D-печатный дом от японской компании Onocom способен выдержать настоящее землетрясение

02.03.2026
Роботы Xiaomi уже начали использоваться на автомобильном заводе

Роботы Xiaomi уже начали использоваться на автомобильном заводе

02.03.2026
Редкий компактный флагман с топовой камерой и АКБ на 7000 мАч. Инсайдер раскрыл характеристики OnePlus 15T до анонса

Редкий компактный флагман с топовой камерой и АКБ на 7000 мАч. Инсайдер раскрыл характеристики OnePlus 15T до анонса

02.03.2026
Subaru рассказала, почему новый Subaru Outback превратился из универсала во внедорожник

Subaru рассказала, почему новый Subaru Outback превратился из универсала во внедорожник

02.03.2026
В России модернизировали легендарный белорусский трактор Belarus 82.1 — он стал гибридом

В России модернизировали легендарный белорусский трактор Belarus 82.1 — он стал гибридом

02.03.2026
Самый дешевый Nissan сильно изменился. Рассекречен обновленный Nissan Versa — звук Bose в подголовниках и простой 1,6-литровый мотор

Самый дешевый Nissan сильно изменился. Рассекречен обновленный Nissan Versa — звук Bose в подголовниках и простой 1,6-литровый мотор

02.03.2026
Next Post
Как небольшой горный зверек предупреждает ученых о глобальном потеплении климата

Как небольшой горный зверек предупреждает ученых о глобальном потеплении климата

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Глава McDonald’s попытался съесть собственный бургер на камеру, и это превратилось в мем

    Глава McDonald’s попытался съесть собственный бургер на камеру, и это превратилось в мем

    0 shares
    Share 0 Tweet 0
  • Илон Маск представил нейросеть Grok 4.2 со сверхбыстрым обучением

    0 shares
    Share 0 Tweet 0
  • Теперь вы сможете открыть счет в ПУМБ за 5 минут онлайн. Обслуживание карты бесплатно

    64 shares
    Share 26 Tweet 16
  • iFixit раскрыли истинную красоту титановой рамы iPhone 15 Pro

    1 shares
    Share 0 Tweet 0
  • Польська студія Thing Trunk підняла ціну на свою гру Book of Demons у Steam для Росії з 549 до 6666 рублів

    2 shares
    Share 1 Tweet 1

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Motorola Edge 70 Fusion получил более тонкий защищенный корпус, батарею на 5200 мА-ч и чип Snapdragon 7s Gen 3

Motorola Edge 70 Fusion получил более тонкий защищенный корпус, батарею на 5200 мА-ч и чип Snapdragon 7s Gen 3

02.03.2026
3D-печатный дом от японской компании Onocom способен выдержать настоящее землетрясение

3D-печатный дом от японской компании Onocom способен выдержать настоящее землетрясение

02.03.2026
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить