AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

OpenAI представила Voice Engine, модель генерации голоса по образцу — оказывается, ее уже слышали массовые пользователи

30.03.2024
Share on FacebookShare on Twitter

OpenAI представила результаты работы Voice Engine, инструмента для реалистичного синтеза голоса на основе 15-секундного образца и текста, которая разрабатывалась около двух лет. Но публичного доступа к нему нет — из-за очевидных опасений компании относительно безопасности.

Этоинтересно

Meta “засветила” очки Ray-Ban Display с проекционным экраном и управлением голосом

Meta “засветила” очки Ray-Ban Display с проекционным экраном и управлением голосом

16.09.2025
Shell разработала жидкость, которая ускоряет зарядку электромобилей до 10 минут

Shell разработала жидкость, которая ускоряет зарядку электромобилей до 10 минут

16.09.2025

«Мы надеемся начать диалог об ответственном применении синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям. На основе этих разговоров и результатов этих небольших тестов мы примем более обоснованное решение о том, стоит ли и как развертывать эту технологию в масштабе», — говорится в блоге OpenAI.

Модель генеративного искусственного интеллекта, которая работает с Voice Engine, некоторое время скрывалась на виду. Она лежит в основе голоса и возможности читать вслух у ChatGPT, а также предварительно настроенных голосов, доступных в API преобразования текста в язык OpenAI. Spotify также использует его с начала сентября, чтобы дублировать подкасты на разных языках.

Компания видит несколько путей применения технологии: оказание помощи тем, кто по каким-то причинам не может читать, перевод, предоставление голосовых услуг удаленным сообществам, поддержка людей с нарушениями голоса и помощь при его восстановлении. Примеры применения с семплами на нескольких языках также представлены в блоге.

Сайт TechCrunch спросил представителя компании Джеффа Харриса, на каких материалах обучали Voice Engine. Он ответил, что модель Voice Engine была обучена на смеси лицензированных и общедоступных данных. Детали обучения моделей искусственного интеллекта могут представлять как конкурентное преимущество, так и источник юридических проблем, поэтому отсутствие подробностей не удивляет. Voice Engine использует данные пользователя крайне осторожно:

«Мы берем небольшой образец аудио и текста и создаем реалистичную речь, которая соответствует оригинальному оратору, — говорит Харрис. — Используемое аудио удаляется после завершения запроса».

По данным сайта, цена будущей услуги будет «кусаться». OpenAI удалила цену использования Voice Engine из маркетинговых материалов, но в документах, которые просмотрел TechCrunch, указана стоимость $15 за один миллион символов, или ~162 500 слов на английском. Это немного больше, чем роман «Оливер Твист» Диккенса. Это означает примерно 18 часов аудио, то есть цена несколько ниже $1 в час.

Курс Job Interview Crash Course від Enlgish4IT. Отримайте 6 шаблонів відповідей на співбесіді, які ви зможете використовувати для структурування своїх відповідей. Отримайте знижку 10% за промокодом ITCENG. Приєднатися

Стоимость меньше, чем у одного из самых популярных конкурентов, ElevenLabs, — $11 за 100 000 символов в месяц. Интересно, что вариант с качеством HD стоит вдвое дороже, но, что представитель OpenAI сказал TechCrunch, что нет разницы между голосами HD и не HD — это можно понимать как угодно. Также Voice Engine не предлагает элементов управления тоном, высотой или другими характеристиками голоса.

Стоимость работы актера озвучивания на сервисе ZipRecruiter колеблются от $12 до $79 в час — это намного дороже, чем у Voice Engine. Актеры с агентами получат гораздо более высокую плату. Также возникает и проблема дипфейков. Поэтому компания пока движется очень осторожно, как с приведенными примерами использования.

Функция Personal Voice в iOS 17 — техноблогер Маркес Браунли показал ИИ-клонирование голоса в действии. Результат впечатляет и пугает одновременно

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!

Другие новости

Meta “засветила” очки Ray-Ban Display с проекционным экраном и управлением голосом

Meta “засветила” очки Ray-Ban Display с проекционным экраном и управлением голосом

16.09.2025
Shell разработала жидкость, которая ускоряет зарядку электромобилей до 10 минут

Shell разработала жидкость, которая ускоряет зарядку электромобилей до 10 минут

16.09.2025
Достойный противник Xiaomi 17 и Snapdragon 8 Elite Gen 5, который обещает «революцию в качестве изображения». Oppo Find X9 Pro с Dimensity 9500 показал возможности до анонса

Достойный противник Xiaomi 17 и Snapdragon 8 Elite Gen 5, который обещает «революцию в качестве изображения». Oppo Find X9 Pro с Dimensity 9500 показал возможности до анонса

16.09.2025
Тест-драйв Nissan X-Trail N-Track: оптимизация способностей

Тест-драйв Nissan X-Trail N-Track: оптимизация способностей

16.09.2025
Раскрыты характеристики камеры Xiaomi 17 Pro

Раскрыты характеристики камеры Xiaomi 17 Pro

16.09.2025

ITC ищет фриланс-автора новостей и статей на криптовалютную тематику

16.09.2025
Next Post
AMD совершит очередной «квантовый скачок»? Производительность ядра Zen 5 может быть более чем на 40% выше, чем у Zen 4

AMD совершит очередной «квантовый скачок»? Производительность ядра Zen 5 может быть более чем на 40% выше, чем у Zen 4

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Младший в созвездии. Тест-драйв нового Subaru XV

    Младший в созвездии. Тест-драйв нового Subaru XV

    21 shares
    Share 8 Tweet 5
  • Тонкий, автономный и с отличными камерами: первый взгляд на HONOR Magic V5

    1 shares
    Share 0 Tweet 0
  • Звезда документального фильма Netflix “Аферист из Tinder” арестован в Грузии

    0 shares
    Share 0 Tweet 0
  • Minecraft Live 2025 пройдет в конце сентября – покажут “Медный век”

    0 shares
    Share 0 Tweet 0
  • Представлена Xiaomi Smart Camera C500: домашняя камера с разрешением 3,5К, ИК-подсветкой и вращением на 360 градусов

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Прогноз цены BTC: как незаметно заработать $5 млрд?

Прогноз цены BTC: как незаметно заработать $5 млрд?

16.09.2025
Meta “засветила” очки Ray-Ban Display с проекционным экраном и управлением голосом

Meta “засветила” очки Ray-Ban Display с проекционным экраном и управлением голосом

16.09.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить