Полезные инструменты для работы и творчества.
Оглавление
- ElevenLabs
- Steosvoice
- Microsoft Edge Read Aloud
- Voicemaker
- NaturalReader
- Yandex SpeechKit
- Apihost
- OpenVoice
- HierSpeech++
- Robivox
Оглавление
- ElevenLabs
- Steosvoice
- Microsoft Edge Read Aloud
- Voicemaker
- NaturalReader
- Yandex SpeechKit
- Apihost
- OpenVoice
- HierSpeech++
- Robivox
ElevenLabs
Самый популярный нейросетевой сервис для дубляжа видео, в котором есть и функция озвучки текста. Всего в пару кликов можно сгенерировать аудиоверсию на 40 различных языках, включая русский. Есть десятки различных голосов, передающих интонацию и эмоции, и возможность клонировать свой собственный. Также предусмотрены настройки речи и выбор нейросетевой модели, которая лучше подходит для определённых целей.
В бесплатной версии длина одной генерации не может быть больше 5 000 символов, а ежемесячно выделяется 10 000 символов. Для увеличения лимитов нужна подписка от 5 долларов в месяц.
Перейти на сайт →
Steosvoice
Специализированный сервис озвучки на основе нейросетевых моделей, который работает через телеграм-бота. Steosvoice предлагает высококачественный синтез речи более чем 400 голосами, среди которых есть озвучка от профессиональных актёров, персонажей мультфильмов и игр, например Геральта из Ривии. В настройках можно указать скорость и высоту голоса, формат файла.
Бесплатно доступна генерация 5 000 символов текста в день. Ограничение одного фрагмента — не более 250 символов. Платные тарифы, увеличивающие лимиты и допускающие коммерческое использование, начинаются от 200 рублей в месяц.
Перейти на сайт →
Microsoft Edge Read Aloud
Преобразование текста в речь на базе фирменной технологии Microsoft из их же браузера. Без каких-либо ограничений на длительность или объём сервис можно использовать на платформе Hugging Face. Доступно, правда, всего два варианта голоса: мужской и женский.
Зато сервис Microsoft Edge Read Aloud полностью бесплатный, не нужна даже регистрация.
Перейти на сайт →
Voicemaker
Эта нейросеть позволяет озвучивать тексты на 120 языках мира. База голосов просто огромная — их несколько сотен, причём как говорящих на одном языке, так и мультиязычных. Настройки позволяют добавлять паузы, менять громкость и скорость, придавать определённую интонацию. Результат можно скачать в форматах MP3, WAV, OGG, AAC или OPUS.
В бесплатной версии есть ограничение на объём текста — не более 250 символов, что не много. Результат можно использовать только для персональных нужд, но вставка на YouTube разрешена с указанием в описании. Платные тарифы от 5 долларов в месяц снимают ограничения.
Перейти на сайт →
NaturalReader
Продвинутый нейросетевой синтезатор речи с поддержкой свыше 50 популярных языков мира, включая русский. Озвучивать текст можно десятком разных голосов, которые различаются акцентом, эмоциями, возрастом и полом диктора. Есть мобильное приложение, в котором с помощью NaturalReader получится даже зачитывать книги, показывая страницы через камеру.
Бесплатно можно озвучивать текст, применяя сервис как плеер. Для скачивания аудиофайлов нужна подписка от 5 долларов в месяц.
Перейти на сайт →
Yandex SpeechKit
Неплохой инструмент для синтеза речи от «Яндекса», работающий на нейросетевых моделях компании. Yandex SpeechKit умеет озвучивать тексты на русском, казахском, узбекском, английском, немецком и иврите. На выбор доступно 11 голосов, среди которых мужские и женские. Настройки позволяют изменять скорость произношения, а также указывать стиль: нейтральный, дружелюбный, шёпот.
Ограничение бесплатной версии заключается в лимите на объём текста — не более 500 символов за один раз.
Перейти на сайт →
Apihost
Простой сервис с несколькими нейросетевыми моделями, который позволяет получать аудиоверсии текстов на более чем 30 языках. Доступных голосов — десятки, и звучат они довольно живо. Можно менять тон с нейтрального на дружеский или раздражённый, подстраивать высоту голоса, корректировать скорость речи и продолжительность пауз.
Бесплатный аккаунт предполагает преобразование не более 1 000 символов за одну генерацию.
Перейти на сайт →
OpenVoice
Простая нейросеть, с помощью которой можно клонировать голос по референсу в виде аудиофайла и озвучить им любой текст. Правда, только на английском. Из настроек доступен выбор интонации: дружелюбный голос, печальный, радостный, раздражённый, испуганный.
Сервис бесплатен, но имеет ограничение в 200 символов на одну операцию.
Перейти на сайт →
HierSpeech++
Ещё одна простая нейросеть, которая обучена на LibriTTS и пока что поддерживает только английский язык озвучки. Сервис использует референс голоса, который можно загрузить в виде аудиофайла или записать через микрофон. Можно применить HierSpeech++ и для русского, но результат будет как если бы текст читал иностранец. Возможно, пригодится для определённых ситуаций, когда нужен голос с сильным акцентом.
Нейросеть бесплатна, ограничение на объём текста составляет 200 символов.
Перейти на сайт →
Robivox
Неплохой сервис с более чем сотней поддерживаемых языков, который поможет озвучить текст десятью различными голосами. Настроек немного: можно добавить паузы и поставить ударение, а также выбрать формат загружаемого аудиофайла.
В бесплатной версии доступна обработка текстов объёмом не более 100 символов, поэтому Robivox годится лишь для коротких реплик.
Перейти на сайт →
Крутые нейросети для других задач 🧠🪄🤖 Как писать и дорабатывать код с нейросетью Codeium Как пользоваться Krea AI — сервисом для генерации картинок и видео Как пользоваться нейросетью Flux.1 AI, которая бесплатно генерирует картинки с текстом 8 нейросетей для создания музыки Надуть, расплавить и раздавить: обзор нейросети Pika 1.5 для генерации смешных видео Обложка: midjourney / Лайфхакер