Очень удобно! Теперь создание клонов голоса стало простым и бесплатным благодаря новому инструменту OpenVoice. Интересно, как он справляется с различными акцентами и тонами голоса? Обещает быть увлекательным!
Этот инновационный инструмент, разработанный в результате сотрудничества Массачусетского технологического института (MIT), Университета Цинхуа и канадской стартап-компании MyShell, позволяет пользователям клонировать голоса с высочайшей точностью и управлением.
В отличие от других закрытых алгоритмов и программного обеспечения, требующих значительных средств на разработку, OpenVoice выделяется своими почти мгновенными возможностями клонирования и детальными параметрами управления.
Этот инструмент позволяет пользователям настраивать различные аспекты голоса, включая тон, эмоциональность, акцент, ритм и интонацию, используя всего лишь небольшой аудиофрагмент. Такой уровень управления обычно не встречается в существующих платформах для клонирования голоса.
Выпуск OpenVoice сопровождался исследовательской статьей, в которой детально описывается его разработка.
Инструмент доступен на веб-приложении MyShell и платформе HuggingFace, обеспечивая широкий доступ.
Создание OpenVoice включало в себя две различные модели ИИ: модель текст-в-речь и конвертер тонов.
Эти модели были обучены на разнообразных аудиопримерах и языках, что позволило им уловить тонкости речи и эмоций человека. В результате OpenVoice способен воспроизводить голос пользователя и изменять его эмоциональное выражение.