Free AIGenericName Мәтінді сөйлеугеName
31+ ашық кодты модельдер, 231+ дауыстар, 34+ Тілдерді қолдау. Тіркелгі қажет емес.
Дыбыс көмегімен басқару үшін қажет барлық нәрсеName
30+ құрал ашық-көздерінде жасанды интеллект моделдеріне негізделген
31+ AI дауыс үлгілері
Бір платформадағы ашық кодты TTS модельдерінің ең толық жинағыName
Kokoro Free
Kokoro - 82 миллион параметрлі мәтіннен сөйлеуге көшіру моделі, ол өз салмағының класынан әлдеқайда жоғары. Шағын өлшеміне қарамастан, ол өте табиғи және өрнекті сөйлеуді шығарады. Kokoro ағылшын, жапон, қытай және корей сияқты бірнеше тілдерді қолдайды, әртүрлі өрнекті дауыстарды шығарады. Ол өте жылдам жұмыс істейді - графикалық процессордағы шын уақыттағыдан 100 есе жылдам.
Келесіге ең қолайлы: Жоғары сапалы, минималды кешіктірумен TTS, ағындық қолданбаларName
Тегін сынау
Piper Free
Piper - Rhasspy жасаған, VITS және larynx архитектураларын қолданатын жеңіл мәтін- дыбыс аудару тетігі. Ол тек процессорда жұмыс істейді, сондықтан Edge құрылғылары, үй автоматтандыруы және офлайн TTS қажет қолданбалар үшін өте қолайлы. 30- дан астам тілдегі 100- ден астам дауысымен Piper Raspberry Pi 4- те де шынайы дыбыстарды шын уақыт режимінде жеткізеді.
Келесіге ең қолайлы: Жедел нобайлау, қолжетімділік және ендірілген қолданбаларName
Тегін сынау
VITS Free
VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - бұл қазіргі екі сатылы үлгілерге қарағанда табиғи дауысты шығаратын параллельді, аясынан аяғына дейінгі TTS әдісі. Ол табиғилықты едәуір жақсарту үшін, нормаластыру ағымдары мен қарсыласу оқыту процесімен толықтырылған вариациялық инференцияны қолданады.
Келесіге ең қолайлы: Табиғи интонациямен жалпы мақсаттағы мәтін- дыбыс үндестігіName
Тегін сынау
MeloTTS Free
MyShell. ai- ның MeloTTS - ағылшын (американдық, британдық, үнді, австралиялық), испан, француз, қытай, жапон және корей тілдерін қолдайтын көп тілді TTS жиыны. Бұл өте жылдам, тек процессормен мәтіндерді шын уақытпен өңдей алады. MeloTTS өндірістік мақсатта қолданылады және процессор мен графикалық процессордың да мәліметтерін пайдаланады.
Келесіге ең қолайлы: Жедел, көп тілді TTS қажет ететін өндірістік қолданбаларName
Тегін сынау
OuteTTS Free
OuteTTS мәтінді сөйлеуге айналдыру мүмкіндіктерімен ірі тіл модельдерін кеңейтеді, бірақ бастапқы архитектурасын сақтайды. Ол llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM және тіпті Transformers. js арқылы браузердің тұжырымдарын қолдайды. JSON түрінде сақталған дыбыс шығарушы профилі арқылы дауысты клондау мүмкіндігі бар.
Келесіге ең қолайлы: Edge-ті іске қосу, браузерге негізделген TTS, ресурстары аз орталар
Тегін сынау
Pocket TTS Free
Pocket TTS Kyutai (Moshi- ның жасаушылары) жасаған, салмағы 100М параметрлік, компактті мәтіннен сөйлеуге көшіру үлгісі. Процессордың қуатын тиімді пайдаланады, бір аудио үлгісінен дыбыстарды клондауды қолдайды, табиғи дыбыстарды шығарады. Үлгінің кішігірім өлшемі оны ресурстары аз орталарда қолдануға өте қолайлы етеді.
Келесіге ең қолайлы: Жеңіл орналастыру, тек процессорды пайдаланатын орталар, тез дауысты клондауName
Тегін сынау
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Келесіге ең қолайлы: Fast lightweight TTS, edge deployment, low-latency applications
Тегін сынау
Bark Standard
Трансформаторға негізделген мәтіннен дыбыс шығару моделі, реалистік сөйлеу, музыка және дыбыс эффекттерін шығарады.
Жасаушы: Suno · Лицензия: MIT
Сынап көру
Bark Small Standard
Bark- тің жеңіл нұсқасы, тезірек есептеу және аз жады жұмсау. Name
Жасаушы: Suno · Лицензия: MIT
Сынап көру
CosyVoice 2 Standard
Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.
Жасаушы: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Сынап көру
Dia TTS Standard
Диалогтық жүйелер - диалогтық диалогты құру үшін қолданылатын бағдарламалық жасақтама.
Жасаушы: Nari Labs · Лицензия: Apache 2.0
Сынап көру
Parler TTS Standard
Сіз тілегіңізді табиғи тілде сипаттап, Parler сәйкесті дыбыстарды құрастырады.
Жасаушы: Hugging Face · Лицензия: Apache 2.0
Сынап көру
GLM-TTS Standard
Ашық кодты ТДС үлгілерінің ішіндегі ең төменгі таңба қателігіне қол жеткізеді.
Жасаушы: Zhipu AI · Лицензия: GLM-4 License
Сынап көру
IndexTTS-2 Standard
Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.
Жасаушы: Index Team · Лицензия: Bilibili Model License
Сынап көру
Spark TTS Standard
Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.
Жасаушы: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Сынап көру
GPT-SoVITS Standard
Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.
Жасаушы: RVC-Boss · Лицензия: MIT
Сынап көру
Orpheus Standard
100-ден астам ғылыми еңбектің, оның ішінде 10 монографияның авторы.
Жасаушы: Canopy Labs · Лицензия: Llama 3.2 Community
Сынап көру
Qwen3 TTS Standard
Alibaba-ның көп тілдік TTS дыбыс клондауымен, алдын-ала орнатылған дауыстармен, мәтіннен дыбыс дизайнымен.
Жасаушы: Alibaba (Qwen) · Лицензия: Apache 2.0
Сынап көру
Chatterbox Turbo Standard
200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.
Жасаушы: Resemble AI · Лицензия: MIT
Сынап көру
Dia 2 Standard
1-ші сыныпта оқып жүргенде-ақ, ақындық, публицистикалық, публицистикалық-публицистикалық шығармалар жазды.
Жасаушы: Nari Labs · Лицензия: Apache 2.0
Сынап көру
VoxCPM Standard
Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.
Жасаушы: OpenBMB · Лицензия: Apache 2.0
Сынап көру
TADA Standard
2000 жылы 25 қыркүйекте 500-ден астам нұсқасы шығарылған, оның ішінде 200-ден астам нұсқасы 2000 жылы 12 қыркүйекте шығарылды.
Жасаушы: Hume AI · Лицензия: MIT
Сынап көру
VibeVoice Standard
Подкасттар мен аудиокітаптар сияқты ұзақ форматтағы мульти-сөйлеуші мазмұны үшін Microsoft моделі.
Жасаушы: Microsoft · Лицензия: MIT
Сынап көру
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Жасаушы: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Сынап көру
CosyVoice 2
Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.
Тілдер: en, zh, ja, ko, fr, de, it, es
Дыбысты көшіру
GLM-TTS
Ашық кодты ТДС үлгілерінің ішіндегі ең төменгі таңба қателігіне қол жеткізеді.
Тілдер: en, zh
Дыбысты көшіру
IndexTTS-2
Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.
Тілдер: en, zh
Дыбысты көшіру
Spark TTS
Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.
Тілдер: en, zh
Дыбысты көшіру
GPT-SoVITS
Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.
Тілдер: en, zh, ja, ko
Дыбысты көшіру
Chatterbox
Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.
Тілдер: en
Дыбысты көшіру
Tortoise TTS
Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.
Тілдер: en
Дыбысты көшіру
OpenVoice
Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.
Тілдер: en, zh, ja, ko, fr, de, es, it
Дыбысты көшіру
Qwen3 TTS
Alibaba-ның көп тілдік TTS дыбыс клондауымен, алдын-ала орнатылған дауыстармен, мәтіннен дыбыс дизайнымен.
Тілдер: en, zh, ja, ko, de, fr, ru, pt, es, it
Дыбысты көшіру
Chatterbox Turbo
200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.
Тілдер: en
Дыбысты көшіру
VoxCPM
Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.
Тілдер: en, zh
Дыбысты көшіру
OuteTTS
LLM-ге негізделген, CPU, GPU немесе браузер арқылы llama.cpp және Transformers.js арқылы жұмыс істейтін TTS.
Тілдер: en
Дыбысты көшіру
Pocket TTS
Kyutai- ның жеңіл 100М параметрлік моделі, бір үлгіден дауысты клондау.
Тілдер: en, fr
Дыбысты көшіру
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Тілдер: en, zh, ja, ko, de, es, fr, it, ru
Дыбысты көшіру
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Тілдер: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Дыбысты көшіру
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Тілдер: en, zh
Дыбысты көшіруЖасаушылар үшін API
OpenAI-ге үйлесімді REST API. Бір консоль, 22+ үлгісі. Реал уақыт қолданбаларын тасымалдауды қолдау.
- OpenAI үйлесімді пішімі
- TTS-ті тікелей қолданбалар үшін тасымалдау
- Үлкен тапсырмаларды дестелеу
- Webhook құлақтандырулары
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Қарапайым, түсінікті бағалау
Еркін бастаңыз. Өсе келе масштабтаңыз.
Про
2000 кредит/ ай
- Бастауыштағы барлығы
- API қатынау
- Артықшылықты өңдеу
Жиі қойылатын сұрақтар
Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.
AI Voice-ті бүгін қолдана бастаңыз
TTS.ai-ді қолданатын құрушылар, әзірлеуші және бизнес өкілдерімен бірлесіп жұмыс істеу