NetEase Youdao has open-sourced EmotiVoice, a modern and powerful text-to-speech engine. This advancement allows for more natural and expressive speech synthesis, benefiting a wide range of applications.

Легче сразу спросить 💭

AI снижает операционные расходы на 20–40% 📊 за 6 месяцев. А что бы вы сделали с этими деньгами?

Опишите задачу — обсудим, как это можно реализовать у вас.

ИИ автоматизирует 70% рутинных задач 🤖 за 3 месяца. Какие процессы в вашем бизнесе скинуть роботу?
Персонализированные AI-кампании увеличивают клиентскую базу на 30% 📈. Как это работает?
AI-аналитика сокращает ошибки в прогнозах на 50% 📉. Расскажите подробнее!

Ура! NetEase Youdao делится своей последней разработкой — EmotiVoice, мощным и современным движком текст в речь. Теперь голосовые интерфейсы будут еще более эмоциональными и естественными. Отличная новость для разработчиков и пользователей! #NetEaseYoudao #EmotiVoice

 NetEase Youdao has open-sourced EmotiVoice, a modern and powerful text-to-speech engine. This advancement allows for more natural and expressive speech synthesis, benefiting a wide range of applications.

NetEase Youdao представляет открытый и мощный движок текст в речь — EmotiVoice

NetEase Youdao анонсировала официальный релиз открытого движка текст в речь (TTS) под названием «Yi Mo Sheng». Он доступен на платформе GitHub. Веб-интерфейсы и скрипты позволяют генерировать результаты пакетами, что делает его идеальным для приложений, требующих эмоционального синтеза тембров.

Youdao создала этот движок текст в речь. В настоящее время он содержит более 2000 тембров и поддерживает как китайский, так и английский языки. Он также обладает уникальной функцией синтеза эмоций, которая может создавать чувства радости, восторга, грусти или гнева, а также множество выразительных голосов.

EmotiVoice — это один из ведущих открытых движков текст в речь. Он обладает более 2000 уникальными голосами и может общаться на английском и китайском языках. Самая заметная функция — это эмоциональный синтез, который позволяет генерировать речь с широким спектром эмоций, включая радость, энтузиазм, грусть, ярость и другие.

Доступен удобный веб-интерфейс. Результаты могут быть сгенерированы пакетами через скриптовый интерфейс. Для тестирования EmotiVoice можно использовать Docker-образы. Для этого требуется компьютер с графическим процессором NVidia. Если у вас его еще нет, установите набор инструментов NVidia Container Toolkit на Linux или Windows WSL2.

В текущей системе подсказки управляют тем, как пользователь чувствует себя или действует. Они игнорируют гендер в пользу акцента на тональности, темпе, интенсивности и страсти. Стилевой/тембральный контроллер, подобный оригинальному закрытому дизайну, можно легко добавить.

Если вам нужны рекомендации по управлению ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей об ИИ, подписывайтесь на наш Telegram-канал t.me/itinairu.

Посмотрите на практический пример решения на основе ИИ: бот для продаж от itinai.ru/aisales, созданный для автоматизации общения с клиентами круглосуточно и управления взаимодействием на всех этапах пути клиента.

Изучите, как искусственный интеллект может улучшить ваши продажи и общение с клиентами. Познакомьтесь с нашими решениями на сайте itinai.ru

Полезные ссылки:

Новости в сфере искусственного интеллекта