Cloud Polly позволяет превращать любой текст в очень реалистичную речь, позволяя создавать различный мультимедийный контент, такой как аудиокниги, подкасты, голосовое содержимое и говорящие приложения, а также создавать совершенно новые категории продуктов с поддержкой речи. Служба преобразования текста в речь (TTS) Cloud Polly использует передовые технологии глубокого обучения ведущих поставщиков облачных услуг, таких как Amazon Web Services , Microsoft Azure , Google Cloud Platform и IBM Cloud, для синтеза естественной речи человека. Используя более 630 различных реалистичных голосов на более чем 70 языках, вы можете создавать приложения с поддержкой речи, которые работают в разных странах.
В дополнение к голосам Standard TTS, Cloud Polly предлагает голоса нейронного преобразования текста в речь (NTTS), которые обеспечивают улучшенное качество речи благодаря новому подходу к машинному обучению. Большая часть технологии Neural TTS Cloud Polly также поддерживает уникальные стили речи, зависящие от поставщика облачных услуг, которые позволяют вам лучше согласовывать стиль выступления докладчика с приложением: Пример: стиль чтения диктора, адаптированный к вариантам использования повествования новостей, и Разговорный стиль простого разговора, который идеально подходит для двустороннего общения, например для приложений телефонии.
Наслаждайтесь удобным использованием тегов SSMLдля добавления различных голосовых эффектов, таких как регулировка высоты тона, громкости, скорости, акцента, звуковых сигналов для слов или фраз и многих других. Полный список можно найти в демо, выбрав соответствующие голоса.
На этом скрипте вы можете построить свой SaaS , бизнес по предоставлению услуг преобразования текста в речь и взимать плату за пользование.
Особенности Cloud Polly:
- Поддержка более 70+ языков
- Поддержка более 630+ различных голосов и акцентов
- Поддержка всех сервисов преобразования текста в речь Amazon
- Поддержка всех служб преобразования текста в речь Microsoft Azure
- Поддержка всех служб преобразования текста в речь Google
- Поддержка всех служб преобразования текста в речь IBM
- Естественно звучащие голоса ( Neural TTS )
- Голоса Google WaveNet
- Различные комбинации голосовых эффектов для стандартных голосов
- Различные комбинации голосовых эффектов для нейронных голосов
- Поддержка MP3, OGG и WAV форматы аудио выход
- Хранить и распространять речь
- Синтез текста в режиме, близком к реальному времени
- Настройка и управление речевым выводом
- Оптимизируйте потоковое аудио
- Отрегулируйте стили речи (для нейронных голосов)
- Регулировка скорости речи, высоты тона и громкости
- Регулировка акцента речи
- Правильно произносите цифры / даты / слова / сокращения
- Добавить эффект замены работы / фразы
- Отключение звука / звуковой сигнал любой части текста / предложения
- Синтезируйте большой текст прямо в корзину Amazon S3
- Удобно делиться результатами синтеза или скачивать
- Полностью отзывчивый интерфейс
- Создать план ежемесячной подписки легко
- Легко создавайте различные предоплаченные планы
- Создавайте промокоды для предоплаченных планов
- Платежные шлюзы PayPal и Stripe
- Внимательно следите за доходами
- Внимательно следите за предполагаемыми расходами на облачные услуги TTS
- Платформа SaaS
- Разработано с использованием PHP 7.4.x и Laravel 8.4.x
- Подробная и полная документация