Free AI Teks-ka-waca
33+ open-source model, 273+ swara, 33+ basa. Ora dibutuhake akun.
Everything You Need for Voice AI
30+ piranti sing didhukung dening model AI sumber terbuka
33+ Model Suara AI
Koleksi paling komprehensif saka model TTS sumber terbuka ing siji platform
Kokoro Bebas
Kokoro nyaéta model teks-ka-wacana kalayan parameter 82 juta anu ngaleuwihan kelas beuratna. Sanaos ukuranana leutik, éta ngahasilkeun wacana anu alami sareng ekspresif. Kokoro ngadukung sababaraha basa kalebet basa Inggris, Jepang, Cina, sareng Korea kalayan rupa-rupa sora ekspresif. Éta ngajalankeun gancang pisan - ngahasilkeun audio sakitar 100x langkung gancang tibatan waktos nyata dina GPU.
Paling apik kanggo: TTS kualitas dhuwur karo latensi minimal, aplikasi streaming
Coba gratis
Piper Bebas
Piper nyaéta mesin téks-ka-wacana anu ringan anu dikembangkeun ku Rhasspy anu ngagunakeun arsitektur VITS sareng larynx. Éta dijalankeun sacara lengkep dina CPU, janten sampurna pikeun alat edge, home automation, sareng aplikasi anu meryogikeun TTS offline. Ku langkung ti 100 sora ngalangkungan 30+ basa, Piper nyayogikeun wacana anu sorana alami dina kecepatan waktos nyata bahkan dina Raspberry Pi 4.
Paling apik kanggo: Pratélan cepet, aksesibilitas, lan aplikasi sing dilebokake
Coba gratis
VITS Bebas
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) nyaéta metode TTS paralel end-to-end anu ngahasilkeun sora anu langkung alami tibatan modél dua-tahap ayeuna. Éta ngadopsi variational inference ditambahkeun ku aliran normalisasi sareng prosés pelatihan lawan, ngahasilkeun paningkatan alamiah anu signifikan.
Paling apik kanggo: Teks-ka-ucapan tujuan umum karo prosodi alami
Coba gratis
MeloTTS Bebas
MeloTTS ku MyShell.ai nyaéta pustaka TTS multibasa anu ngadukung basa Inggris (Amerika, Inggris, India, Australia), Spanyol, Perancis, Cina, Jepang, jeung Korea. Éta gancang pisan, ngaolah téks dina laju waktos nyata dina CPU sorangan. MeloTTS dirancang pikeun panggunaan produksi sareng ngadukung CPU sareng GPU inference.
Paling apik kanggo: Produksi aplikasi kang butuh TTS cepet, multibasa
Coba gratis
Kani TTS 2 Bebas
Kani-TTS-2 ku NineNineSix mangrupikeun model parameter 400M ultra-lébar anu diwangun dina backbone LiquidAI LFM2 kalayan Nvidia NanoCodec. Éta dijalankeun dina ngan 3GB VRAM sareng ngahontal 10 detik percakapan dina ~2 detik (RTF 0.2). Ngadukung kloning sora zero-shot ngalangkungan embeddings speaker.
Paling apik kanggo: Generasi cepet, lingkungan sumber daya endhek, pratinjau cepet
Coba gratis
OuteTTS Bebas
OuteTTS ngalegaan model basa anu gedé kalayan kamampuan teks-ka-wacana sakumaha ngajaga arsitektur aslina. Éta ngadukung sababaraha backends kaasup llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, sarta malah inference browser via Transformers.js. Fitur kloning sora zero-shot ngaliwatan profil panyatur disimpen salaku JSON.
Paling apik kanggo: Pemasangan Edge, TTS adhedhasar browser, lingkungan sumber daya endhek
Coba gratis
Pocket TTS Bebas
Pocket TTS ku Kyutai (panyekel Moshi) nyaéta model teks-ka-wacana parameter 100M anu kompak anu ngaleuwihan beuratna. Ieu dijalankeun kalayan efisien dina CPU, ngadukung kloning sora zero-shot ti sampel audio tunggal, sarta ngahasilkeun wacana anu sorana alami. Ukuran model anu alit ngajantenkeunana sampurna pikeun pamasangan tepi sareng lingkungan sumber daya anu handap.
Paling apik kanggo: Panyebaran sing gampang, lingkungan CPU-saben, kloning swara sing cepet
Coba gratis
Kitten TTS Bebas
Kitten TTS ku KittenML nyaéta model teks-ka-wacana ultra-légér anu diwangun dina ONNX. Ku variasi ti 15M dugi ka 80M parameter (25-80 MB dina disk), éta nyayogikeun sintésis sora kualitas luhur dina CPU tanpa peryogi GPU. Fitur 8 sora anu aya, laju basa anu tiasa disaluyukeun, sareng pre-proses teks anu aya pikeun angka, mata uang, sareng unit. Ideal pikeun aplikasi panyebaran tepi sareng latensi rendah.
Paling apik kanggo: TTS cekak lan gampang, aplikasi sing ora akeh latensi
Coba gratis
Ming-Omni TTS Bebas
Ming-omni-tts-0.5B ku inclusionAI nyaéta model pidato omni-modal kompak anu diwangun dina tulang tonggong anu padat BailingMM kalayan dekoder audio anu cocog sareng Patch-by-Patch. Ngahasilkeun output 44.1kHz (deukeut kualitas CD), ngadukung kloning sora zero-shot tina rujukan 3+ detik, sareng kalebet kontrol emosi / dialek / BGM anu terintegrasi ngalangkungan instruksi JSON.
Paling apik kanggo: Basa Cina, basa resmi Republik Rakyat Cina, basa resmi Republik Rakyat Cina
Coba gratis
MOSS-TTS Nano Bebas
MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.
Paling apik kanggo: Free-tier TTS, high-volume production, low-latency interactive use
Coba gratis
Bark Standar
Model teks-ka-audio dumasar kana transformator anu ngahasilkeun basa, musik, sareng efek sora anu realistis.
Pangembang: Suno · Lisensi: MIT
Coba
Bark Small Standar
Versi anyar iki luwih cepet, luwih efisien, lan luwih murah.
Pangembang: Suno · Lisensi: MIT
Coba
CosyVoice 2 Standar
Sacara umum, alam semesta diklasifikasikeun kana alam semesta statis, alam semesta dinamis, sarta alam semesta dinamis-statis.
Pangembang: Alibaba (Tongyi Lab) · Lisensi: Apache 2.0
Coba
Dia TTS Standar
Multi-speaker dialog generasi model nu ngahasilkeun percakapan alami antara speaker.
Pangembang: Nari Labs · Lisensi: Apache 2.0
Coba
Parler TTS Standar
Ngajelaskeun sora anu anjeun pikahoyong dina basa alami sarta Parler bakal ngahasilkeun basa anu cocog.
Pangembang: Hugging Face · Lisensi: Apache 2.0
Coba
IndexTTS-2 Standar
Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma
Pangembang: Index Team · Lisensi: Bilibili Model License
Coba
Spark TTS Standar
Telepon sélulér dipaké pikeun komunikasi, komunikasi interpersonal, sareng komunikasi interpersonal.
Pangembang: SparkAudio · Lisensi: CC BY-NC-SA 4.0
Coba
GPT-SoVITS Standar
Sacara umum, spésiés-spésiés ieu diklasifikasikeun kana 5 subspesies, anu masing-masing diklasifikasikeun kana 5 subspesies.
Pangembang: RVC-Boss · Lisensi: MIT
Coba
Orpheus Standar
100.000 taun kapungkur, spésiés-spésiés dinosaurus diklasifikasikeun dumasar kana data fosil.
Pangembang: Canopy Labs · Lisensi: Llama 3.2 Community
Coba
Qwen3 TTS Standar
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Pangembang: Alibaba (Qwen) · Lisensi: Apache 2.0
Coba
VieNeu-TTS-v2 Standar
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
Pangembang: Phạm Nguyễn Ngọc Bảo · Lisensi: Apache 2.0
Coba
Chatterbox Turbo Standar
2000 - 2001 - Dilaksanakeun pameran seni rupa, seni rupa, seni rupa, seni rupa, seni rupa, seni rupa.
Pangembang: Resemble AI · Lisensi: MIT
Coba
VoxCPM Standar
Nokia 4310 dipirantèni kodhak 1.3 MP lan fitur LED flash,.
Pangembang: OpenBMB · Lisensi: Apache 2.0
Coba
VibeVoice Standar
Microsoft model kanggo konten multi-speaker bentuk panjang kaya podcasts lan audiobooks.
Pangembang: Microsoft · Lisensi: MIT
Coba
CosyVoice3 Standar
TTS generasi salajengna multi-basa kalayan bi-streaming, kontrol emosi, sarta kloning sora zero-shot.
Pangembang: Alibaba (FunAudioLLM) · Lisensi: Apache 2.0
Coba
NAMAA Saudi TTS Standar
TTS Arab Saudi kapisan. Dialek asli Saudi kalawan kloning sora kualitas Chatterbox.
Pangembang: NAMAA Space · Lisensi: MIT
Coba
Darwin TTS Standar
Qwen3-TTS, versi cross-modal Qwen3-TTS, nganggo FFN, dicampuran saka Qwen3-1.7B, kanggo kloning multi-basa.
Pangembang: FINAL-Bench · Lisensi: Apache 2.0
Coba
MOSS-TTSD Standar
Diantarana, 100 menit anu diwangun ku 500 kecap, 100 menit anu diwangun ku 500 kecap, sarta 100 menit anu diwangun ku 500 kecap.
Pangembang: OpenMOSS · Lisensi: Apache 2.0
Coba
CosyVoice 2
Sacara umum, alam semesta diklasifikasikeun kana alam semesta statis, alam semesta dinamis, sarta alam semesta dinamis-statis.
Basa: en, zh, ja, ko, fr, de, it, es
Клон голоса
IndexTTS-2
Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma
Basa: en, zh
Клон голоса
Spark TTS
Telepon sélulér dipaké pikeun komunikasi, komunikasi interpersonal, sareng komunikasi interpersonal.
Basa: en, zh
Клон голоса
GPT-SoVITS
Sacara umum, spésiés-spésiés ieu diklasifikasikeun kana 5 subspesies, anu masing-masing diklasifikasikeun kana 5 subspesies.
Basa: en, zh, ja, ko
Клон голоса
Chatterbox
Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma
Basa: en
Клон голоса
Tortoise TTS
Sacara umum, téks-ka-wacana multi-vokal fokus kana kualitas sareng arsitektur autoregressif.
Basa: en
Клон голоса
OpenVoice
Sacara umum, basa Inggris diklasifikasikaké dumasar kana basa, dialek, lan gaya basa.
Basa: en, zh, ja, ko, fr, es
Клон голоса
VieNeu-TTS-v2
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
Basa: vi, en
Клон голоса
Chatterbox Turbo
2000 - 2001 - Dilaksanakeun pameran seni rupa, seni rupa, seni rupa, seni rupa, seni rupa, seni rupa.
Basa: en
Клон голоса
OuteTTS
LLM-basa TTS sing dioperasikake ing CPU, GPU, utawa browser liwat llama.cpp lan Transformers.js.
Basa: en
Клон голоса
Pocket TTS
100M parameter model lightweight dening Kyutai karo kloning swara saka siji sampel.
Basa: en, fr
Клон голоса
CosyVoice3
TTS generasi salajengna multi-basa kalayan bi-streaming, kontrol emosi, sarta kloning sora zero-shot.
Basa: en, zh, ja, ko, de, es, fr, it, ru
Клон голоса
NAMAA Saudi TTS
TTS Arab Saudi kapisan. Dialek asli Saudi kalawan kloning sora kualitas Chatterbox.
Basa: ar
Клон голоса
Darwin TTS
Qwen3-TTS, versi cross-modal Qwen3-TTS, nganggo FFN, dicampuran saka Qwen3-1.7B, kanggo kloning multi-basa.
Basa: en, ko, ja, zh
Клон голоса
MOSS-TTSD
Diantarana, 100 menit anu diwangun ku 500 kecap, 100 menit anu diwangun ku 500 kecap, sarta 100 menit anu diwangun ku 500 kecap.
Basa: en, zh
Клон голоса
Ming-Omni TTS
Compact 0.5B omni-modal speech model from inclusionAI with high-fidelity 44.1kHz output and zero-shot voice cloning.
Basa: en, zh
Клон голоса
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.
Basa: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Клон голосаDeveloper-First API
REST API kompatibel OpenAI. hiji titik akhir, 22+ model. dukungan streaming pikeun aplikasi real-time.
- Bentuk sing cocog karo OpenAI
- Streaming TTS kanggo aplikasi wektu nyata
- Pemrosesan batch untuk pekerjaan besar
- Panggilan Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Sederhana, transparan Pricing
Miwiti kanthi gratis. Skala nalika sampeyan tuwuh.
Bebas
15,000 karakter + 5,000/dina
- 7 model gratis kalebu Kokoro
- 5,000 karakter saben generasi
- API akses kalebu
Pemula
500 kredit/wulan
- Seluruh 22+ model
- 100,000 karakter saben generasi
- Kloning Suara
Pro
2,000 kredit/wulan
- Segalanya dalam Starter
- Akses API
- Priority processing
Takon-takon sing sering diajukake
Apa sing bisa kita ningkatake? Pangarep-arepmu mbantu kita ngrampungake masalah.
Mulai Menggunakan AI Suara Hari Ini
Gabung karo para pembuat, pengembang, lan bisnis sing nggunakake TTS.ai