AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

NVIDIA рассказала о своих успехах в синтезировании естественной человеческой речи силами ИИ

01.09.2021
Share on FacebookShare on Twitter

NVIDIA рассказала о своих успехах в синтезировании естественной человеческой речи силами ИИ

Этоинтересно

Volvo переизобрела ремень безопасности: он сам подстроится под пассажира

Volvo переизобрела ремень безопасности: он сам подстроится под пассажира

07.03.2026
Обзор Laysara: Summit Kingdom — смелый градостроительный симулятор

Обзор Laysara: Summit Kingdom — смелый градостроительный симулятор

07.03.2026

Искусственный интеллект сейчас позволяет воссоздавать голос виртуальных помощников в смартфонах и умных колонках, очень похожий на человеческую речь. Хотя всё ещё можно заметить различия между речью синтезированной и живой, которую мы слышим в повседневной беседе и в средствах массовой информации. Это связано с тем, что люди говорят со сложным ритмом, интонацией и тембром, которые ИИ сложно воспроизвести.

Однако благодаря работе NVIDIA различия постепенно стираются. Исследователи компании создают модели и инструменты для высококачественного управляемого синтеза речи, которые передают богатство человеческой речи без звуковых артефактов. Их последние проекты теперь демонстрируются на сессиях конференции Interspeech 2021, которая продлится до 3 сентября.

Эти модели могут помочь в создании голосовых автоматических линий обслуживания клиентов для банков и предприятий розничной торговли, оживить персонажей видеоигр или книг и обеспечить синтез речи для цифровых аватаров в реальном времени.

Креативная команда NVIDIA даже использует эту технологию для создания выразительного повествования для серии видеороликов о возможностях искусственного интеллекта. До недавнего времени эти ролики озвучивал человек. Предыдущие модели синтеза речи предлагали ограниченный контроль над темпом и высотой звука синтезированного голоса, поэтому попытки повествования искусственного интеллекта не вызывали у зрителей эмоционального отклика, который мог бы дать талантливый оратор-человек.

Ситуация изменилась за последний год, когда исследовательская группа NVIDIA по преобразованию текста в речь разработала более мощные и управляемые модели синтеза речи, такие как RAD-TTS. Обучая модель преобразования текста в речь на базе речи человека, модель RAD-TTS может преобразовать любую текстовую заметку в голос говорящего.

Ещё одна особенность модели – это преобразование голоса, когда слова одного говорящего (или даже пение) передаются голосом другого говорящего. Интерфейс RAD-TTS даёт пользователям возможность точного управления высотой, длительностью и энергией синтезированного голоса на уровне кадра. В результате, например, мужчина может зачитать текст и затем преобразовать его в женский голос.

Возможности модели ИИ выходят за рамки озвучивания. Преобразование текста в речь можно использовать в играх, для помощи людям с нарушениями голоса или помощи пользователям при переводе между языками своим собственным голосом. ИИ даже может воссоздать выступления известных певцов, сочетая не только мелодию песни, но и эмоциональное выражение вокала.

Выразительный синтез речи – это лишь один из элементов исследований NVIDIA в области разговорного ИИ. Эта область также включает обработку естественного языка, автоматическое распознавание речи, обнаружение ключевых слов, улучшение звука и многое другое.

Эти разработки были сделаны с помощью инструментария NVIDIA NeMo и являются решениями с открытым исходным кодом. Они оптимизированы для эффективной работы на GPU NVIDIA и доступны для использования исследователям и разработчикам.

Источник: NVIDIA

Другие новости

Volvo переизобрела ремень безопасности: он сам подстроится под пассажира

Volvo переизобрела ремень безопасности: он сам подстроится под пассажира

07.03.2026
Обзор Laysara: Summit Kingdom — смелый градостроительный симулятор

Обзор Laysara: Summit Kingdom — смелый градостроительный симулятор

07.03.2026
Выгорание OLED-панели за 2 года: что случилось с монитором после 6500 часов работы

Выгорание OLED-панели за 2 года: что случилось с монитором после 6500 часов работы

07.03.2026
Представлена мощнейшая настольная зарядная станция Anker Prime 250W Smart Desktop Charger Pro+ — с поддержкой технологий Xiaomi HyperCharge и Huawei SuperCharge

Представлена мощнейшая настольная зарядная станция Anker Prime 250W Smart Desktop Charger Pro+ — с поддержкой технологий Xiaomi HyperCharge и Huawei SuperCharge

07.03.2026
Новый сериал от создателей “Тьмы”: HBO экранизирует темные сказки немецкого психиатра 1845 года

Новый сериал от создателей “Тьмы”: HBO экранизирует темные сказки немецкого психиатра 1845 года

06.03.2026
GeForce RTX 5060 Ti за 1350 долларов: представлен внешний графический модуль Khadas Mind Graphics 2

GeForce RTX 5060 Ti за 1350 долларов: представлен внешний графический модуль Khadas Mind Graphics 2

06.03.2026
Next Post
Как небольшой горный зверек предупреждает ученых о глобальном потеплении климата

Как небольшой горный зверек предупреждает ученых о глобальном потеплении климата

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Как выглядит «Титаник» сегодня? Ученые хотят возобновить его изучение

    Как выглядит «Титаник» сегодня? Ученые хотят возобновить его изучение

    2 shares
    Share 1 Tweet 1
  • Яркий спорткар на 717 лошадей с огромным багажником: обзор универсала BMW M5 Touring

    1 shares
    Share 0 Tweet 0
  • Первый взгляд на Toyota Land Cruiser 300: «это как 200, только новее»

    19 shares
    Share 8 Tweet 5
  • Ориентировочные европейские цены на грядущие настольные CPU Intel Core 12-го поколения (Alder Lake-S)

    2 shares
    Share 1 Tweet 1
  • Почему сбитый режим сна портит наше здоровье и как его восстановить

    1 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Volvo переизобрела ремень безопасности: он сам подстроится под пассажира

Volvo переизобрела ремень безопасности: он сам подстроится под пассажира

07.03.2026
Обзор Laysara: Summit Kingdom — смелый градостроительный симулятор

Обзор Laysara: Summit Kingdom — смелый градостроительный симулятор

07.03.2026
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить