Free AI Teks ke Tutur
20+ model sumber terbuka, 107+ suara-suara, 32+ Bahasa. Tiada akaun diperlukan.
Semua yang anda perlukan untuk AI Suara
30+ alat dikuasakan oleh model AI sumber terbuka
20+ Model Suara AI
Koleksi paling komprehensif model TTS sumber terbuka dalam satu platform
Kokoro Free
Kokoro adalah model teks-ke-tutur 82 juta parameter yang melampaui kelas beratnya. Walaupun saiznya kecil, ia menghasilkan pertuturan yang luar biasa semulajadi dan ekspresif. Kokoro menyokong banyak bahasa termasuk bahasa Inggeris, Jepun, Cina, dan Korea dengan pelbagai suara ekspresif. Ia berjalan sangat pantas — menghasilkan audio hampir 100x lebih pantas daripada masa nyata pada GPU.
Terbaik untuk: TTS kualiti tinggi dengan latensi minimum, aplikasi strim
Cuba percuma
Piper Free
Piper adalah enjin teks-ke-tutur ringan yang dikembangkan oleh Rhasspy yang menggunakan VITS dan larynx. Ia berjalan sepenuhnya pada CPU, menjadikannya sesuai untuk peranti tepi, automasi rumah, dan aplikasi yang memerlukan TTS luar talian. Dengan lebih 100 suara melebihi 30+ bahasa, Piper memberikan pertuturan bunyi-semulajadi pada kelajuan masa nyata bahkan pada Raspberry Pi 4.
Terbaik untuk: Pralihat pantas, kebolehcapaian, dan aplikasi terbenam
Cuba percuma
VITS Free
VITS (Kesimpulan Variasi dengan pembelajaran lawan untuk Teks-ke-Tutur hujung-ke-hujung) adalah kaedah TTS hujung-ke-hujung sejajar yang menghasilkan audio berbunyi lebih semulajadi daripada model dua-tahap semasa. Ia mengamalkan kesimpulan variasi yang dipertingkatkan dengan aliran normalisasi dan proses latihan lawan, mencapai peningkatan yang ketara dalam semulajadi.
Terbaik untuk: Teks-ke-tutur tujuan umum dengan prosodi semulajadi
Cuba percuma
MeloTTS Free
MeloTTS oleh MyShell.ai adalah pustaka TTS berbilang bahasa yang menyokong Bahasa Inggeris (Amerika, British, India, Australia), Sepanyol, Perancis, Cina, Jepun, dan Korea. Ia sangat pantas, memproses teks pada kelajuan hampir masa nyata pada CPU sahaja. MeloTTS direka untuk penggunaan pengeluaran dan menyokong kedua-dua kesimpulan CPU dan GPU.
Terbaik untuk: Aplikasi pengeluaran memerlukan TTS pantas, berbilang bahasa
Cuba percuma
Bark Standard
Model teks-ke-audio berasaskan Transformer yang menghasilkan ucapan, muzik, dan kesan bunyi yang realistik.
Pemaju: Suno · Lesen: MIT
Cubalah.
Bark Small Standard
Versi ringan Bark dengan inferensi lebih pantas dan penggunaan memori yang lebih rendah.
Pemaju: Suno · Lesen: MIT
Cubalah.
CosyVoice 2 Standard
Alibaba's skalable streaming TTS dengan manusia-parit semula jadi dan latensi hampir-sifar.
Pemaju: Alibaba (Tongyi Lab) · Lesen: Apache 2.0
Cubalah.
Dia TTS Standard
Model penjanaan dialog pembicara-berbilang yang mencipta perbualan semulajadi antara pembicara.
Pemaju: Nari Labs · Lesen: Apache 2.0
Cubalah.
Parler TTS Standard
Huraikan suara yang anda mahu dalam bahasa semulajadi dan Parler akan menghasilkan ucapan yang sepadan.
Pemaju: Hugging Face · Lesen: Apache 2.0
Cubalah.
GLM-TTS Standard
Mencapai kadar ralat aksara terendah di antara model TTS sumber terbuka.
Pemaju: Zhipu AI · Lesen: GLM-4 License
Cubalah.
IndexTTS-2 Standard
Zero-shot TTS dengan kawalan emosi halus-grained dan ekspresi tinggi.
Pemaju: Index Team · Lesen: Bilibili Model License
Cubalah.
Spark TTS Standard
Klon suara TTS dengan emosi yang boleh dikawal dan gaya bercakap melalui prompt.
Pemaju: SparkAudio · Lesen: CC BY-NC-SA 4.0
Cubalah.
GPT-SoVITS Standard
Klon suara TTS yang meniru suara mana-mana dari hanya 5 saat audio.
Pemaju: RVC-Boss · Lesen: MIT
Cubalah.
Orpheus Standard
Model TTS emosi tahap manusia dilatih pada 100K jam data ucapan.
Pemaju: Canopy Labs · Lesen: Llama 3.2 Community
Cubalah.
Qwen3 TTS Standard
TTS multibahasa Alibaba dengan klon suara, suara praset, dan reka bentuk suara dari teks.
Pemaju: Alibaba (Qwen) · Lesen: Apache 2.0
Cubalah.
CosyVoice 2
Alibaba's skalable streaming TTS dengan manusia-parit semula jadi dan latensi hampir-sifar.
Bahasa: en, zh, ja, ko, fr, de, it, es
Klon Suara
GLM-TTS
Mencapai kadar ralat aksara terendah di antara model TTS sumber terbuka.
Bahasa: en, zh
Klon Suara
IndexTTS-2
Zero-shot TTS dengan kawalan emosi halus-grained dan ekspresi tinggi.
Bahasa: en, zh
Klon Suara
Spark TTS
Klon suara TTS dengan emosi yang boleh dikawal dan gaya bercakap melalui prompt.
Bahasa: en, zh
Klon Suara
GPT-SoVITS
Klon suara TTS yang meniru suara mana-mana dari hanya 5 saat audio.
Bahasa: en, zh, ja, ko
Klon Suara
Tortoise TTS
Teks-ke-tutur berbilang suara berfokus pada kualiti dengan arsitektur autoregressif.
Bahasa: en
Klon Suara
OpenVoice
Klon suara seketika dengan kawalan granular terhadap gaya, emosi, dan loghat.
Bahasa: en, zh, ja, ko, fr, de, es, it
Klon Suara
Qwen3 TTS
TTS multibahasa Alibaba dengan klon suara, suara praset, dan reka bentuk suara dari teks.
Bahasa: en, zh, ja, ko, de, fr, ru, pt, es, it
Klon SuaraAPI Pemaju-Pertama
API REST serasi OpenAI. Satu titik akhir, 22+ model. Sokongan strim untuk aplikasi masa nyata.
- Format serasi OpenAI
- Strim TTS untuk aplikasi masa nyata
- Pemprosesan serbuan untuk kerja besar
- Pemberitahuan Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Harga yang Mudah, Lutsinar
Mulakan secara percuma.
Pro
2,000 kredit/bulan
- Semua dalam Pelancar
- Capaian API
- Pemprosesan keutamaan
Perniagaan
10,000 kredit/bulan
- Semuanya dalam Pro
- API Bulk
- Baris gilir keutamaan
Soalan Lazim
Mula Guna Suara AI Hari Ini
Sertai pencipta, pembangun, dan perniagaan menggunakan TTS.ai