AI bebas Teks ke Tutur
31+ model sumber terbuka, 231+ suara-suara, 34+ Bahasa. Tiada akaun diperlukan.
Semua yang anda perlukan untuk AI Suara
30+ alat dikuasakan oleh model AI sumber terbuka
31+ Model Suara AI
Koleksi paling komprehensif model TTS sumber terbuka dalam satu platform
Kokoro Free
Kokoro adalah model teks-ke-tutur 82 juta parameter yang mencecah lebih daripada kelas beratnya. Walaupun saiznya kecil, ia menghasilkan pertuturan yang luar biasa semulajadi dan ekspresif. Kokoro menyokong pelbagai bahasa termasuk bahasa Inggeris, Jepun, Cina, dan Korea dengan pelbagai suara ekspresif. Ia berjalan sangat pantas — menghasilkan audio hampir 100x lebih pantas daripada masa nyata pada GPU.
Terbaik untuk: TTS berkualiti tinggi dengan latensi minimum, aplikasi strim
Cuba percuma
Piper Free
Piper adalah enjin teks-ke-tutur ringan yang dikembangkan oleh Rhasspy yang menggunakan VITS dan larynx. Ia berjalan sepenuhnya pada CPU, menjadikannya sesuai untuk peranti tepi, automasi rumah, dan aplikasi yang memerlukan TTS luar talian. Dengan lebih 100 suara melebihi 30+ bahasa, Piper memberikan pertuturan bunyi-semulajadi pada kelajuan masa nyata bahkan pada Raspberry Pi 4.
Terbaik untuk: Pralihat pantas, kebolehcapaian, dan aplikasi terbenam
Cuba percuma
VITS Free
VITS (Kesimpulan Variasi dengan pembelajaran lawan untuk Teks-ke-Tutur hujung-ke-hujung) adalah kaedah TTS hujung-ke-hujung sejajar yang menghasilkan audio berbunyi lebih semulajadi daripada model dua-tahap semasa. Ia mengamalkan kesimpulan variasi yang dipertingkatkan dengan aliran normalisasi dan proses latihan lawan, mencapai peningkatan yang ketara dalam kebolehan semulajadi.
Terbaik untuk: Teks-ke-tutur tujuan umum dengan prosodi semulajadi
Cuba percuma
MeloTTS Free
MeloTTS oleh MyShell.ai adalah pustaka TTS berbilang bahasa yang menyokong Bahasa Inggeris (Amerika, British, India, Australia), Sepanyol, Perancis, Cina, Jepun, dan Korea. Ia sangat pantas, pemprosesan teks pada kelajuan hampir masa nyata pada CPU sahaja. MeloTTS direka untuk penggunaan pengeluaran dan menyokong kedua-dua CPU dan GPU inferensi.
Terbaik untuk: Aplikasi pengeluaran memerlukan TTS pantas, berbilang bahasa
Cuba percuma
OuteTTS Free
OuteTTS memperluaskan model bahasa besar dengan keupayaan teks-ke-tutur sambil memelihara arsitektur asal. Ia menyokong banyak backend termasuk llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, dan bahkan inferensi pelayar melalui Transformers.js. Ciri-ciri kloning suara sifar-tembak melalui profil pembicara disimpan sebagai JSON.
Terbaik untuk: Pelaksanaan tepi, TTS berasaskan pelayar, persekitaran sumber rendah
Cuba percuma
Pocket TTS Free
Pocket TTS oleh Kyutai (pencipta Moshi) adalah model teks-ke-tutur parameter 100M yang kompak yang menekan lebih berat daripada beratnya. Ia berjalan dengan berkesan pada CPU, menyokong klon suara sifar-tembak dari sampel audio tunggal, dan menghasilkan pertuturan berbunyi semulajadi. Saiz model kecil menjadikannya sesuai untuk pelaksanaan tepi dan persekitaran sumber rendah.
Terbaik untuk: Pelaksanaan ringan, persekitaran CPU-hanya, klon suara pantas
Cuba percuma
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Terbaik untuk: Fast lightweight TTS, edge deployment, low-latency applications
Cuba percuma
Bark Standard
Model teks-ke-audio berasaskan Transformer yang menghasilkan ucapan, muzik, dan kesan bunyi yang realistik.
Pemaju: Suno · Lesen: MIT
Cubalah.
Bark Small Standard
Versi ringan Bark dengan inferensi lebih pantas dan penggunaan memori yang lebih rendah.
Pemaju: Suno · Lesen: MIT
Cubalah.
CosyVoice 2 Standard
Alibaba's boleh skala streaming TTS dengan manusia-parit semula jadi dan latensi hampir-sifar.
Pemaju: Alibaba (Tongyi Lab) · Lesen: Apache 2.0
Cubalah.
Dia TTS Standard
Model penjanaan dialog multi-pembesar yang mencipta perbualan semulajadi antara pembesar.
Pemaju: Nari Labs · Lesen: Apache 2.0
Cubalah.
Parler TTS Standard
Huraikan suara yang anda mahu dalam bahasa semulajadi dan Parler akan menghasilkan ucapan yang sepadan.
Pemaju: Hugging Face · Lesen: Apache 2.0
Cubalah.
GLM-TTS Standard
Mencapai kadar ralat aksara terendah di antara model TTS sumber terbuka.
Pemaju: Zhipu AI · Lesen: GLM-4 License
Cubalah.
IndexTTS-2 Standard
Zero-shot TTS dengan kawalan emosi halus-grained dan ekspresi tinggi.
Pemaju: Index Team · Lesen: Bilibili Model License
Cubalah.
Spark TTS Standard
Klon suara TTS dengan emosi yang boleh dikawal dan gaya bercakap melalui prompt.
Pemaju: SparkAudio · Lesen: CC BY-NC-SA 4.0
Cubalah.
GPT-SoVITS Standard
Klon suara TTS yang meniru suara mana-mana dari hanya 5 saat audio.
Pemaju: RVC-Boss · Lesen: MIT
Cubalah.
Orpheus Standard
Model TTS emosi tahap manusia dilatih pada 100K jam data ucapan.
Pemaju: Canopy Labs · Lesen: Llama 3.2 Community
Cubalah.
Qwen3 TTS Standard
TTS multibahasa Alibaba dengan klon suara, suara praset, dan reka bentuk suara dari teks.
Pemaju: Alibaba (Qwen) · Lesen: Apache 2.0
Cubalah.
Chatterbox Turbo Standard
Chatterbox yang lebih pantas dengan latensi sub-200ms dan tag paralinguistik untuk ketawa, batuk, dan lebih.
Pemaju: Resemble AI · Lesen: MIT
Cubalah.
Dia 2 Standard
TTS perbualan streaming-pertama dengan dialog multi-pendengar dan petunjuk paralinguistik.
Pemaju: Nari Labs · Lesen: Apache 2.0
Cubalah.
VoxCPM Standard
TTS bebas tokenizer menghasilkan audio 44.1kHz dengan konsistensi perenggan kontekstual.
Pemaju: OpenBMB · Lesen: Apache 2.0
Cubalah.
TADA Standard
TTS halusinasi sifar dengan teks-akustik dua hala, 5x lebih cepat daripada TTS LLM setanding.
Pemaju: Hume AI · Lesen: MIT
Cubalah.
VibeVoice Standard
Model Microsoft untuk kandungan berbilang pembesar suara berbentuk panjang seperti podcast dan buku audio.
Pemaju: Microsoft · Lesen: MIT
Cubalah.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Pemaju: Alibaba (FunAudioLLM) · Lesen: Apache 2.0
Cubalah.
CosyVoice 2
Alibaba's boleh skala streaming TTS dengan manusia-parit semula jadi dan latensi hampir-sifar.
Bahasa: en, zh, ja, ko, fr, de, it, es
Klon Suara
GLM-TTS
Mencapai kadar ralat aksara terendah di antara model TTS sumber terbuka.
Bahasa: en, zh
Klon Suara
IndexTTS-2
Zero-shot TTS dengan kawalan emosi halus-grained dan ekspresi tinggi.
Bahasa: en, zh
Klon Suara
Spark TTS
Klon suara TTS dengan emosi yang boleh dikawal dan gaya bercakap melalui prompt.
Bahasa: en, zh
Klon Suara
GPT-SoVITS
Klon suara TTS yang meniru suara mana-mana dari hanya 5 saat audio.
Bahasa: en, zh, ja, ko
Klon Suara
Tortoise TTS
Teks-ke-tutur berbilang suara berfokus pada kualiti dengan arsitektur autoregressif.
Bahasa: en
Klon Suara
OpenVoice
Klon suara seketika dengan kawalan granular terhadap gaya, emosi, dan loghat.
Bahasa: en, zh, ja, ko, fr, de, es, it
Klon Suara
Qwen3 TTS
TTS multibahasa Alibaba dengan klon suara, suara praset, dan reka bentuk suara dari teks.
Bahasa: en, zh, ja, ko, de, fr, ru, pt, es, it
Klon Suara
Chatterbox Turbo
Chatterbox yang lebih pantas dengan latensi sub-200ms dan tag paralinguistik untuk ketawa, batuk, dan lebih.
Bahasa: en
Klon Suara
VoxCPM
TTS bebas tokenizer menghasilkan audio 44.1kHz dengan konsistensi perenggan kontekstual.
Bahasa: en, zh
Klon Suara
OuteTTS
TTS berasaskan LLM yang berjalan pada CPU, GPU, atau pelayar melalui llama.cpp dan Transformers.js.
Bahasa: en
Klon Suara
Pocket TTS
Model parameter ringan 100M oleh Kyutai dengan kloning suara dari satu sampel.
Bahasa: en, fr
Klon Suara
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Bahasa: en, zh, ja, ko, de, es, fr, it, ru
Klon Suara
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Bahasa: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klon Suara
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Bahasa: en, zh
Klon SuaraAPI Pemaju-Pertama
API REST serasi OpenAI. Satu titik akhir, 22+ model. Sokongan strim untuk aplikasi masa nyata.
- Format serasi OpenAI
- Strim TTS untuk aplikasi masa nyata
- Pemprosesan serbuan untuk kerja besar
- Pemberitahuan Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Harga yang Mudah, Lutsinar
Mulakan secara percuma.
Pro
2,000 kredit/bulan
- Semua dalam Pelancar
- Capaian API
- Pemprosesan keutamaan
Perniagaan
10,000 kredit/bulan
- Semuanya dalam Pro
- API Bulk
- Baris gilir keutamaan
Soalan Lazim
Apa yang boleh kami perbaiki?
Mula Guna Suara AI Hari Ini
Sertai pencipta, pembangun, dan perniagaan menggunakan TTS.ai