Платформа Nemesys Labs Text-to-Speech бесплатный сервис синтеза речи на основе ИИ, который преобразует письменный текст в естественно звучащую речь через простой HTTP API. Разработанный для быстрой интеграции, он поддерживает несколько голосов и языков, позволяя разработчикам генерировать аудио по требованию с одним запросом. Платформа подчеркивает простоту использования, быстрые результаты и широкий охват языка для таких приложений, как подкасты, голосовые помощники, электронное обучение и инструменты доступности.
Как использовать Nemesys Labs Text-to-Speech
- Подготовьте свой запроспредоставьте текст, который вы хотите конвертировать, и необязательно выберите голос.
- Отправить запрос POST конечная точка API:
https://api.nemesyslabs.com/api/v1/text-to-speechс телом Джона. - Получить аудиоAPI возвращает аудиофайл MP3, содержащий устный текст. Затем вы можете сохранить или транслировать аудио в своем приложении.
Пример запроса
curl --location 'https://api.nemesyslabs.com/api/v1/text-to-speech'
--header 'Content-Type: application/json'
--header 'Authorization: Bearer ••••••'
--data '{
"text": "Welcome to Nemesys Labs, we try our best to democratize state-of-the-art speech synthesis like this one, have fun!",
"voiceId": "Alice"
}'
Ответ: 200 с аудиофайлом MP3.
Голоса и языки
- Поддерживает более 21 языка с несколькими голосами, в том числе: Ева, Рафаэль, Мэттью, Алиса, Алекс, Майкл, Джек и другие.
Конечные точки и параметры
- Конечная точка:
POST /api/v1/text-to-speech - Требуется:
text(до 50 000 символов, в зависимости от плана) - Необязательно:
voiceId(перенаправлено с «Alice») - Ответ: аудиофайл MP3
Голосовые опции
- Доступны голоса: Ева, Рафаэль, Мэттью, Элис, Алекс, Майкл, Джек, Ава, Кармен, Эмили, Елена, Эмма и другие.
Случаи использования
- Повествование подкаста, озвучивание, функции доступности, повествование электронного обучения, динамическое генерирование контента и многое другое.
Вопросы безопасности и использования
- Убедитесь, что у вас есть соответствующие права на преобразование текста и соблюдение применимых законов и условий платформы.
Основные характеристики
- Быстрый доступ к HTTP API с одним запросом POST
- Поддержка более 21 языка и нескольких голосов
- Высококачественный, естественно звучащий синтез речи
- Простой JSON-запрос полезной нагрузки
- MP3 аудио выход готов к интеграции
- Минимальная настройка без карты, необходимой для базового использования