Всем привет! Сегодня хочу поделиться с вами своим опытом создания реалистичного голоса через нейросети. Недавно мне потребовалась озвучка для видеопрезентации, и я решил попробовать этот интересный инструмент.
Я подобрал несколько сервисов, которые позволяют бесплатно генерировать голос онлайн без регистрации. Все они просты в использовании, даже для новичка, и имеют минимальное количество настроек. При этом качество синтезируемой речи очень близко к человеческому.
В этой статье я расскажу о своих находках, поделюсь ссылками на сервисы и дам короткие пошаговые инструкции. Я также опишу отличительные особенности бесплатных тарифов и добавлю аудио файлы с результатами генерации голоса, чтобы вы могли оценить качество звучания.
Apihost
Сайт: https://apihost.ru/voice
Описание бесплатной версии:
- неограниченное количество попыток для синтеза голоса;
- можно вводить до 1000 символов;
- 4 языка, включая русский;
- 17 дикторов.
Прослушать результат тестирования:
Порядок работы:
- Перед генерацией голоса выберите язык, диктора, тон, высоту и формат итогового файла.
- Потом добавьте текст. Если нейросеть неправильно поставит ударение, это можно откорректировать добавив знак «+» перед нужной гласной.
- Нажмите кнопку «Озвучить». Сервис тут же создаст голос, который можно скачать.
Если результат не устраивает, попробуйте поменять параметры и повторить генерацию. Еще кроме первоначальных настроек также можно менять скорость и длину паузы.
Zvukogram
Сайт: https://zvukogram.com/speech/
Описание бесплатной версии:
- можно озвучить 2000 символов премиум голосом, либо 10000 символов обычными голосами;
- 42 языка;
- 80 дикторов;
- можно создавать диалоги.
Прослушать результат тестирования:
без диалога
с диалогом
Порядок действий:
Задайте нужные параметры, введите текст и нажмите кнопку «Озвучить текст».
После обработки чуть ниже появится блок в котором можно прослушать, скачать или поделится итоговым аудиофайлом.
Сервис также умеет создавать диалоги. Для добавления диктора кликните по значку с изображением головы на панели инструментов. После этого появится дополнительная строка с настройками нового диктора. Как и для первого действующего лица укажите язык и другие параметры. Затем выделите текст второго собеседника и нажмите кнопку «Обернуть».
Сервис добавит свою разметку к тексту. После этого можно запускать процесс создания диалога.
Robivox
Сайт: https://robivox.ru/
Описание бесплатной версии:
- без регистрации доступна озвучка 100 символов;
- после регистрации дарят 5 бонусных рублей;
- 143 языка;
- 11 дикторов на русском языке.
Прослушать результат тестирования:
Порядок действий:
У сервиса максимально простой интерфейс. Перед синтезом речи достаточно выбрать язык, голос диктора и скорость. При необходимости можно добавить ударение и паузу с помощью соответствующих кнопок на панели инструментов.
Robivox поддерживает два формата файла: mp3 и wav. Результат можно прослушать и скачать на ваше устройство.
Ttsfree
Сайт: https://ttsfree.com/text-to-speech/ru
Описание бесплатной версии:
- без регистрации доступно 500 символов за одни раз и 50 конвертаций в день;
- после регистрации доступно 2000 символов за один раз, 100 конвертаций в день и 500000 символов в месяц;
- В режиме «TTS1» — 57 языков, в «TTS2» — 140 языков.
- В режиме «TTS1» — 5 русскоязычный дикторов, в «TTS2» — 2 диктора на русском.
Прослушать результат тестирования:
Порядок действий:
- Введите текст для озвучки.
- Выберите режим, язык и диктора. Также вы можете отрегулировать высоту и скорость голоса.
- Нажмите кнопку «Преобразовать сейчас».
- После генерации вы можете прослушать и скачать аудиофайл.
Недостатком этого сервиса является избыточное количество рекламы, которая может запутать пользователей в элементах интерфейса.
Elevenlabs
Сайт: https://elevenlabs.io/
Описание бесплатной версии:
- без регистрации можно вводить до 333 символов текста за один раз, после — 2500;
- после регистрации всего доступно 10000 символов в месяц или примерно 10 минут аудио;
- 29 языков;
- более 20 дикторов.
Прослушать результат тестирования:
Порядок действий:
- Выберите язык на главном экране сервиса.
- Добавьте текст для синтеза речи.
- Нажмите значок «Play» и прослушайте результат генерации.
- Итоговый mp3 файл можно скачать с помощью кнопки в нижнем правом углу.
После регистрации интерфейс Elevenlabs меняется и добавляется больше настроек. Но основной порядок действий аналогичен большинству сервисов из обзора.
***
Как видите, сделать голос нейросетью совсем не сложно и доступно каждому. Бесплатные сервисы вполне могут подойти для этих целей. А, если вам потребуется больше возможностей, вы всегда сможете перейти на платный тариф.
Какой сервис вам больше всего понравился? Делитесь своими впечатлениями в комментариях!
И, если вы знаете другие сервисы, соответствующие критериям, описанным в начале статьи (бесплатные, без регистрации, с поддержкой русского языка), добавляйте их в комментарии. Буду рад узнать о них!