Free AIGenericName Мәтінді сөйлеугеName
33+ ашық кодты модельдер, 273+ дауыстар, 33+ Тілдерді қолдау. Тіркелгі қажет емес.
Дыбыс көмегімен басқару үшін қажет барлық нәрсеName
30+ құрал ашық-көздерінде жасанды интеллект моделдеріне негізделген
33+ AI дауыс үлгілері
Бір платформадағы ашық кодты TTS модельдерінің ең толық жинағыName
Kokoro Бос
Kokoro - 82 миллион параметрлі мәтіннен сөйлеуге көшіру моделі, ол өз салмағының класынан әлдеқайда жоғары. Шағын өлшеміне қарамастан, ол өте табиғи және өрнекті сөйлеуді шығарады. Kokoro ағылшын, жапон, қытай және корей сияқты бірнеше тілдерді қолдайды, әртүрлі өрнекті дауыстарды шығарады. Ол өте жылдам жұмыс істейді - графикалық процессордағы шын уақыттағыдан 100 есе жылдам.
Келесіге ең қолайлы: Жоғары сапалы, минималды кешіктірумен TTS, ағындық қолданбаларName
Тегін сынау
Piper Бос
Piper - Rhasspy жасаған, VITS және larynx архитектураларын қолданатын жеңіл мәтін- дыбыс аудару тетігі. Ол тек процессорда жұмыс істейді, сондықтан Edge құрылғылары, үй автоматтандыруы және офлайн TTS қажет қолданбалар үшін өте қолайлы. 30- дан астам тілдегі 100- ден астам дауысымен Piper Raspberry Pi 4- те де шынайы дыбыстарды шын уақыт режимінде жеткізеді.
Келесіге ең қолайлы: Жедел нобайлау, қолжетімділік және ендірілген қолданбаларName
Тегін сынау
VITS Бос
VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - бұл қазіргі екі сатылы үлгілерге қарағанда табиғи дауысты шығаратын параллельді, аясынан аяғына дейінгі TTS әдісі. Ол табиғилықты едәуір жақсарту үшін, нормаластыру ағымдары мен қарсыласу оқыту процесімен толықтырылған вариациялық инференцияны қолданады.
Келесіге ең қолайлы: Табиғи интонациямен жалпы мақсаттағы мәтін- дыбыс үндестігіName
Тегін сынау
MeloTTS Бос
MyShell. ai- ның MeloTTS - ағылшын (американдық, британдық, үнді, австралиялық), испан, француз, қытай, жапон және корей тілдерін қолдайтын көп тілді TTS жиыны. Бұл өте жылдам, тек процессормен мәтіндерді шын уақытпен өңдей алады. MeloTTS өндірістік мақсатта қолданылады және процессор мен графикалық процессордың да мәліметтерін пайдаланады.
Келесіге ең қолайлы: Жедел, көп тілді TTS қажет ететін өндірістік қолданбаларName
Тегін сынау
Kani TTS 2 Бос
NineNineSix- тің Kani- TTS- 2 - NVIDIA NanoCodec- тің Liquid AI LFM2 негізінде жасалған өте жеңіл 400М параметрлі модель. Ол тек 3 ГБ VRAM- да жұмыс істейді және A100 (RTF 0. 2) құрылғысында ~2 секундта ~10 секунд сөйлем шығарады. Қазіргі ашық нұсқасы тек ағылшын тіліндегі `kani- tts- 2- en` тексеру нүктесін ұсынады және дыбыс клондау үшін қажет дыбыс ендіру тоқпағы жоқ - клондау үшін Chatterbox / IndexTTS2 / F5- TTS, ал ағылшын тілінде емес болса Kokoro / MeloTTS қолданыңыз.
Келесіге ең қолайлы: VRAM аз құрылғыларда ағылшын тілін тез құру, жылдам алдын- ала қарау
Тегін сынау
OuteTTS Бос
OuteTTS мәтінді сөйлеуге айналдыру мүмкіндіктерімен ірі тіл модельдерін кеңейтеді, бірақ бастапқы архитектурасын сақтайды. Ол llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM және тіпті Transformers. js арқылы браузердің тұжырымдарын қолдайды. JSON түрінде сақталған дыбыс шығарушы профилі арқылы дауысты клондау мүмкіндігі бар.
Келесіге ең қолайлы: Edge-ті іске қосу, браузерге негізделген TTS, ресурстары аз орталар
Тегін сынау
Pocket TTS Бос
Pocket TTS Kyutai (Moshi- ның жасаушылары) жасаған, салмағы 100М параметрлік, компактті мәтіннен сөйлеуге көшіру үлгісі. Процессордың қуатын тиімді пайдаланады, бір аудио үлгісінен дыбыстарды клондауды қолдайды, табиғи дыбыстарды шығарады. Үлгінің кішігірім өлшемі оны ресурстары аз орталарда қолдануға өте қолайлы етеді.
Келесіге ең қолайлы: Жеңіл орналастыру, тек процессорды пайдаланатын орталар, тез дауысты клондауName
Тегін сынау
Kitten TTS Бос
Kitten TTS by KittenML - бұл ONNX негізінде жасалған өте жеңіл мәтін- дыбыс синтезі моделі. 15М- ден 80М- ге дейінгі параметрлерімен (дискіде 25- 80 МБ), ол графикалық процессорды қажет етпей, жоғары сапалы дыбыс синтезін CPU- дан орындайды. 8 ішкі дыбысы, дыбыс жылдамдығын баптау, сан, валюта және бірліктер үшін ішкі мәтін өңдеуі бар. Ең жақын орналасу және төменгі артта қалу қолданбаларына өте ыңғайлы.
Келесіге ең қолайлы: Жедел, жеңіл, шеттік орналастыру, төменгі артта қалу қолданбаларыName
Тегін сынау
Ming-Omni TTS Бос
InclusionAI- ның Ming- omni- tts- 0. 5B дегені BailingMM тығыз арнасына негізделген, Patch- by- Patch ауа- қатынасы сәйкесті аудио декодері бар компактті омни- модалды сөйлеу моделі. 44. 1 кГц шығыс (CD сапасына жақын), 3+ секундтық сілтемеден нульдік- клондау дыбысын қолдайды, JSON инструкциялары арқылы эмоционалды / диалект / BGM басқаруын қамтиды. Қытайлық ережелер бойынша мықты тұрақтылығы — 0. 83% WER.
Келесіге ең қолайлы: High-fidelity екі тілде баяндау, эмоция-контрольді дауыс әрекеті, қытайлық аудиокітап мазмұны
Тегін сынау
MOSS-TTS Nano Бос
MOSS- TTS- Nano- 100M - MOSS- TTS отбасының OpenMOSS- тің компактті 100М- параметрлі нұсқасы, кешіктіру- трансформатор архитектурасын қолданады. 8B үлгісінің сапасын ~80x қысқартылған салмағы мен сұраныс бойынша VRAM- ның күрт төмендеуі үшін айырбастайды, бұл оны тегін деңгейлі және жоғары өткізгіштікті орналастыруға жарамсыз етеді. 20 тілге бірдей жету мүмкіндігі.
Келесіге ең қолайлы: Тегін деңгейлі TTS, көп көлемді шығару, аз кешіктіруі бар интерактивті қолдану
Тегін сынау
Bark Әдетті
Трансформаторға негізделген мәтіннен дыбыс шығару моделі, реалистік сөйлеу, музыка және дыбыс эффекттерін шығарады.
Жасаушы: Suno · Лицензия: MIT
Сынап көру
Bark Small Әдетті
Bark- тің жеңіл нұсқасы, тезірек есептеу және аз жады жұмсау. Name
Жасаушы: Suno · Лицензия: MIT
Сынап көру
CosyVoice 2 Әдетті
Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.
Жасаушы: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Сынап көру
Dia TTS Әдетті
Диалогтық жүйелер - диалогтық диалогты құру үшін қолданылатын бағдарламалық жасақтама.
Жасаушы: Nari Labs · Лицензия: Apache 2.0
Сынап көру
Parler TTS Әдетті
Сіз тілегіңізді табиғи тілде сипаттап, Parler сәйкесті дыбыстарды құрастырады.
Жасаушы: Hugging Face · Лицензия: Apache 2.0
Сынап көру
IndexTTS-2 Әдетті
Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.
Жасаушы: Index Team · Лицензия: Bilibili Model License
Сынап көру
Spark TTS Әдетті
Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.
Жасаушы: SparkAudio · Лицензия: CC BY-NC-SA 4.0
Сынап көру
GPT-SoVITS Әдетті
Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.
Жасаушы: RVC-Boss · Лицензия: MIT
Сынап көру
Orpheus Әдетті
100-ден астам ғылыми еңбектің, оның ішінде 10 монографияның авторы.
Жасаушы: Canopy Labs · Лицензия: Llama 3.2 Community
Сынап көру
Qwen3 TTS Әдетті
Alibaba-ның көп тілді TTS-і алдын-ала орнатылған дауыспен және мәтіннен дыбыс дизайнымен.
Жасаушы: Alibaba (Qwen) · Лицензия: Apache 2.0
Сынап көру
VieNeu-TTS-v2 Әдетті
Вьетнам және ағылшын тілдерін кодты ауыстырып, 7 алдын- ала орнатылған дыбыспен және дыбыстарды клондаусыз. Тек процессор қажет, графикалық процессор қажет емес. Name
Жасаушы: Phạm Nguyễn Ngọc Bảo · Лицензия: Apache 2.0
Сынап көру
Chatterbox Turbo Әдетті
200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.
Жасаушы: Resemble AI · Лицензия: MIT
Сынап көру
VoxCPM Әдетті
Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.
Жасаушы: OpenBMB · Лицензия: Apache 2.0
Сынап көру
VibeVoice Әдетті
Подкасттар мен аудиокітаптар сияқты ұзақ форматтағы мульти-сөйлеуші мазмұны үшін Microsoft моделі.
Жасаушы: Microsoft · Лицензия: MIT
Сынап көру
CosyVoice3 Әдетті
Би-стриминг, эмоцияларды басқару және дауысты клондау арқылы келесі буын көп тілді TTS.
Жасаушы: Alibaba (FunAudioLLM) · Лицензия: Apache 2.0
Сынап көру
NAMAA Saudi TTS Әдетті
Бірінші ашық Сауд Арабиясының дыбыс аудару жүйесі. Сауд Арабиясының өз диалектісі, Chatterbox- сапалы дыбыстарды клондау. Name
Жасаушы: NAMAA Space · Лицензия: MIT
Сынап көру
Darwin TTS Әдетті
Qwen3-1.7B тіл моделінен алынған FFN салмағы бар Qwen3-TTS-тің кросс-модалды нұсқасы көп тілдік клондауды жеңілдету үшін қолданылады.
Жасаушы: FINAL-Bench · Лицензия: Apache 2.0
Сынап көру
MOSS-TTSD Әдетті
Multi-speaker dialogue continuation model — 5-ке дейінгі спикерлермен және 60 минуттық біртұтас аудиомен подкаст-стиліндегі әңгімелерді құру.
Жасаушы: OpenMOSS · Лицензия: Apache 2.0
Сынап көру
CosyVoice 2
Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.
Тілдер: en, zh, ja, ko, fr, de, it, es
Дыбысты көшіру
IndexTTS-2
Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.
Тілдер: en, zh
Дыбысты көшіру
Spark TTS
Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.
Тілдер: en, zh
Дыбысты көшіру
GPT-SoVITS
Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.
Тілдер: en, zh, ja, ko
Дыбысты көшіру
Chatterbox
Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.
Тілдер: en
Дыбысты көшіру
Tortoise TTS
Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.
Тілдер: en
Дыбысты көшіру
OpenVoice
Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.
Тілдер: en, zh, ja, ko, fr, es
Дыбысты көшіру
VieNeu-TTS-v2
Вьетнам және ағылшын тілдерін кодты ауыстырып, 7 алдын- ала орнатылған дыбыспен және дыбыстарды клондаусыз. Тек процессор қажет, графикалық процессор қажет емес. Name
Тілдер: vi, en
Дыбысты көшіру
Chatterbox Turbo
200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.
Тілдер: en
Дыбысты көшіру
VoxCPM
Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.
Тілдер: en, zh
Дыбысты көшіру
OuteTTS
LLM-ге негізделген, CPU, GPU немесе браузер арқылы llama.cpp және Transformers.js арқылы жұмыс істейтін TTS.
Тілдер: en
Дыбысты көшіру
Pocket TTS
Kyutai- ның жеңіл 100М параметрлік моделі, бір үлгіден дауысты клондау.
Тілдер: en, fr
Дыбысты көшіру
CosyVoice3
Би-стриминг, эмоцияларды басқару және дауысты клондау арқылы келесі буын көп тілді TTS.
Тілдер: en, zh, ja, ko, de, es, fr, it, ru
Дыбысты көшіру
NAMAA Saudi TTS
Бірінші ашық Сауд Арабиясының дыбыс аудару жүйесі. Сауд Арабиясының өз диалектісі, Chatterbox- сапалы дыбыстарды клондау. Name
Тілдер: ar
Дыбысты көшіру
Darwin TTS
Qwen3-1.7B тіл моделінен алынған FFN салмағы бар Qwen3-TTS-тің кросс-модалды нұсқасы көп тілдік клондауды жеңілдету үшін қолданылады.
Тілдер: en, ko, ja, zh
Дыбысты көшіру
MOSS-TTSD
Multi-speaker dialogue continuation model — 5-ке дейінгі спикерлермен және 60 минуттық біртұтас аудиомен подкаст-стиліндегі әңгімелерді құру.
Тілдер: en, zh
Дыбысты көшіру
Ming-Omni TTS
1950 жылы 14 қаңтарда Алматы қаласында туған.1994 жылы 14 қаңтарда Алматы қаласында қайтыс болды.
Тілдер: en, zh
Дыбысты көшіру
MOSS-TTS Nano
100-ден астам ғылыми еңбектің, оның ішінде 8 монографияның, 100-ден астам оқу құралының авторы.
Тілдер: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Дыбысты көшіруЖасаушылар үшін API
OpenAI-ге үйлесімді REST API. Бір консоль, 22+ үлгісі. Реал уақыт қолданбаларын тасымалдауды қолдау.
- OpenAI үйлесімді пішімі
- TTS-ті тікелей қолданбалар үшін тасымалдау
- Үлкен тапсырмаларды дестелеу
- Webhook құлақтандырулары
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Қарапайым, түсінікті бағалау
Еркін бастаңыз. Өсе келе масштабтаңыз.
Бос
15, 000 таңба + 5, 000/ күн
- 7 еркін үлгі, оның ішінде Kokoro
- Бір буында 5000 таңба
- API қатынасы қосылған
Про
2000 кредит/ ай
- Бастауыштағы барлығы
- API қатынау
- Артықшылықты өңдеу
Жиі қойылатын сұрақтар
Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.
AI Voice-ті бүгін қолдана бастаңыз
TTS.ai-ді қолданатын құрушылар, әзірлеуші және бизнес өкілдерімен бірлесіп жұмыс істеу