Безплатен интеллектуален интелект Текст към реч
20+ модели с отворен източник, 107+ гласове, 32+ езици. Няма нужда от акаунт.
Всичко, от което се нуждаеш от гласов интеллект
30+ инструменти, захранвани от отворени модели на AI
20+ AI Гласови модели
Най-обширната колекция от отворени модели TTS в една платформа
Kokoro Free
Кокоро е 82 милиона параметър текст-то-шпик модел, който удари много над теглото си клас. Въпреки малкия си размер, той произвежда забележително естествена и изразителна реч. Кокоро поддържа множество езици, включително английски, японски, китайски и корейски с различни изразителни гласове. Тя работи невероятно бързо — генериране на аудио почти 100x по-бързо от реално време на GPU.
Най-добро за: Висококачествени ТТС с минимална латенция, струйни приложения
Опитай безплатно
Piper Free
Piper е лесен текст-то-спеех двигател, разработен от Rhaspy, който използва VITS и ларинкс архитектури. Той работи изцяло на CPU, което го прави идеален за ръбови устройства, домашна автоматизация и приложения, изискващи офлайн ТТС. С над 100 гласове през 30+ езици, Piper осигурява естествено-звучна реч при скорости в реално време дори и на Raspberry Pi 4.
Най-добро за: Бързи прегледи, достъпност и вградени приложения
Опитай безплатно
VITS Free
VITS (Вariacional Inference with adversarial learning for end-to-end Text-to-Speak) е паралелен край-то-край метод TTS, който генерира по-естествен звук от текущите двуетапни модели. Той приема вариационен извод, увеличен с нормализиращи потоци и процес на свръхречно обучение, достигайки значително подобряване на естествеността.
Най-добро за: Общо предназначение за текстопис с естествена прозодия
Опитай безплатно
MeloTTS Free
MeloTTS by MyShell.ai е многоязична TTS библиотека за подкрепа на английски (американски, британски, индийски, австралийски), испански, френски, китайски, японски и корейски. Тя е изключително бързо, обработване на текст с почти реално време само на процесора. MeloTTS е предназначен за използване на производство и поддържа както процесор и GPU инференция.
Най-добро за: Производствени приложения, нуждаещи се от бързо, многоезично ТТС
Опитай безплатно
Bark Standard
Трансформаторен текст-то-аудио модел, който генерира реалистичен реч, музика и звукови ефекти.
Разработчик: Suno · Лиценз: MIT
Опитай.
Bark Small Standard
По-светла версия на Bark с по-бързо изчисляване и по-ниска употреба на паметта.
Разработчик: Suno · Лиценз: MIT
Опитай.
CosyVoice 2 Standard
Алибаба е скалален ТТС с естествена човешка паритетност и почти нула латентност.
Разработчик: Alibaba (Tongyi Lab) · Лиценз: Apache 2.0
Опитай.
Dia TTS Standard
Модел за генериране на многоговорители, който създава естествени разговори между говорителите.
Разработчик: Nari Labs · Лиценз: Apache 2.0
Опитай.
Parler TTS Standard
Опиши гласа, който искаш на естествен език и Parler генерира съвпадаща реч.
Разработчик: Hugging Face · Лиценз: Apache 2.0
Опитай.
GLM-TTS Standard
Постига най-ниската степен на грешки на характер сред моделите на отворения източник TTS.
Разработчик: Zhipu AI · Лиценз: GLM-4 License
Опитай.
IndexTTS-2 Standard
Zero-shot TTS с фино-зрели емоции контрол и висока експресивност.
Разработчик: Index Team · Лиценз: Bilibili Model License
Опитай.
Spark TTS Standard
Гласово клониране TTS с контролируема емоция и стил на говорене чрез подсказки.
Разработчик: SparkAudio · Лиценз: CC BY-NC-SA 4.0
Опитай.
GPT-SoVITS Standard
Малко гласово клониране TTS, което репликира всеки глас от само 5 секунди звук.
Разработчик: RVC-Boss · Лиценз: MIT
Опитай.
Orpheus Standard
Човешко ниво емоционален TTS модел обучен на 100K часа данни за говора.
Разработчик: Canopy Labs · Лиценз: Llama 3.2 Community
Опитай.
Qwen3 TTS Standard
Многоязичният ТТС на Алибаба с гласово клониране, подредени гласове и гласов дизайн от текста.
Разработчик: Alibaba (Qwen) · Лиценз: Apache 2.0
Опитай.
CosyVoice 2
Алибаба е скалален ТТС с естествена човешка паритетност и почти нула латентност.
Езици: en, zh, ja, ko, fr, de, it, es
Клониран глас
GLM-TTS
Постига най-ниската степен на грешки на характер сред моделите на отворения източник TTS.
Езици: en, zh
Клониран глас
IndexTTS-2
Zero-shot TTS с фино-зрели емоции контрол и висока експресивност.
Езици: en, zh
Клониран глас
Spark TTS
Гласово клониране TTS с контролируема емоция и стил на говорене чрез подсказки.
Езици: en, zh
Клониран глас
GPT-SoVITS
Малко гласово клониране TTS, което репликира всеки глас от само 5 секунди звук.
Езици: en, zh, ja, ko
Клониран глас
Chatterbox
Съвременно клониране на глас с контрол на емоциите от Resemble AI.
Езици: en
Клониран глас
Tortoise TTS
Мулти-гласовен текст-то-спеец фокусиран върху качеството с автоматична регресивна архитектура.
Езици: en
Клониран глас
OpenVoice
Мигновено клониране на гласа с гранулиран контрол върху стила, емоциите и акцента.
Езици: en, zh, ja, ko, fr, de, es, it
Клониран глас
Qwen3 TTS
Многоязичният ТТС на Алибаба с гласово клониране, подредени гласове и гласов дизайн от текста.
Езици: en, zh, ja, ko, de, fr, ru, pt, es, it
Клониран гласРазработчик- първи API
Компатибилен с OpenAI REST API. Един крайна точка, 22+ модели. Ускоряване на подкрепата за приложения в реално време.
- Формат, съвместим с OpenAI
- Ускоряване на TTS за приложения в реално време
- Пакетна обработка за големи работни места
- Уведомления за Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Просто, прозрачно ценообразуване
Започнете свободен, скалирайте, докато растете.
Безплатен
15 кредита
- Kokoro, Piper, VITS, MeloTTS
- 500 ограничаване на знака
- 3 ген/час (без сметка)
Стартиране
500 кредита/месечни кредити
- Всички 22+ модели
- 100 000 chars на поколение
- Гласово клониране
Професионален
2000 кредита в месец
- Всичко в Стартър
- API достъп
- Приоритетна обработка
Бизнес
10 000 кредита в месец
- Всичко в профсъюза.
- Масов API
- Приоритетна редица
Често задавани въпроси
Започни да използваш AI глас днес
Присъединете се към създателите, разработчиците и предприятията, използващи TTS.ai