Gratis AI Teks ke Pidato
20+ model open-source, 107+ Suara-suara, 32+ Tak ada rekening yang diperlukan.
Segala Sesuatu yang Anda Butuhkan untuk Suara AI
30+ tools powered by open-source AI modeles
20+ Model Suara AI
Koleksi paling komprehensif model TTS open-source dalam satu platform
Kokoro Free
Kokoro adalah model parameter 82 juta teks-ke-peech yang memukul dengan baik di atas kelas berat badannya meskipun ukurannya kecil, ia menghasilkan pidato yang sangat alami dan ekspresif. Kokoro mendukung berbagai bahasa termasuk bahasa Inggris, Jepang, Cina, dan Korea dengan berbagai suara ekspresif. ia berlari sangat cepat menghasilkan audio hampir 100x lebih cepat daripada GPU.
Terbaik untuk: TTS berkualitas tinggi dengan aplikasi minimal latensi, streaming
Coba Bebas
Piper Free
Piper adalah mesin text-to-speech ringan yang dikembangkan oleh Rhassypy yang menggunakan VITS dan laringx arsitektur. mesin ini bekerja sepenuhnya pada CPU, membuatnya ideal untuk perangkat tepi, otomasi rumah, dan aplikasi yang membutuhkan TTS offline. dengan lebih dari 100 suara melintasi 30 bahasa+, Piper memberikan pidato yang terdengar alami pada kecepatan nyata bahkan pada sebuah Raspberry Pi 4.
Terbaik untuk: Pratilik cepat, aksesibilitas, dan aplikasi tertanam
Coba Bebas
VITS Free
VITS (Inferensi Variational dengan adversaria belajar untuk end-to-end Text-to-Speech) adalah metode akhir-ke-end TTS yang menghasilkan audio terdengar lebih alami daripada model dua tahap saat ini. Ia mengadopsi inferensi variasi yang ditambah dengan aliran normal dan proses pelatihan adversaria, mencapai peningkatan yang signifikan dalam naturalnessness.
Terbaik untuk: Umum tujuan teks-to-peech dengan prosody alami
Coba Bebas
MeloTTS Free
MeloTTS oleh MyShell.ai adalah perpustakaan TTS multibahasa yang mendukung bahasa Inggris (Amerika, Inggris, India, Australia), Spanyol, Prancis, Cina, Jepang, dan Korea. Ini sangat cepat, memproses teks pada hampir kecepatan real-time pada CPU saja. MeloTTS dirancang untuk produksi dan mendukung baik CPU maupun GPUference.
Terbaik untuk: Aplikasi produksi membutuhkan TTS multibahasa yang cepat
Coba Bebas
Bark Standard
Model teks berbasis Transformer-to-audio yang menghasilkan pidato, musik, dan efek suara yang realistis.
Pengembang: Suno · Lisensi: MIT
Cobalah
Bark Small Standard
Lighter versi Bark dengan inferensi yang lebih cepat dan penggunaan memori yang lebih rendah.
Pengembang: Suno · Lisensi: MIT
Cobalah
CosyVoice 2 Standard
TTS bersisik Aliba dengan sifat alami manusia dan latensi dekat nol.
Pengembang: Alibaba (Tongyi Lab) · Lisensi: Apache 2.0
Cobalah
Dia TTS Standard
Model dialog multi pembicara yang menciptakan percakapan alami antara pembicara.
Pengembang: Nari Labs · Lisensi: Apache 2.0
Cobalah
Parler TTS Standard
Gambarkan suara yang Anda inginkan dalam bahasa alami dan Parler menghasilkan pidato yang cocok.
Pengembang: Hugging Face · Lisensi: Apache 2.0
Cobalah
GLM-TTS Standard
Mencapai tingkat kesalahan karakter terendah di antara model TTS open-source.
Pengembang: Zhipu AI · Lisensi: GLM-4 License
Cobalah
IndexTTS-2 Standard
Nol-shot TTS dengan kontrol emosi halus dan ekspresif tinggi.
Pengembang: Index Team · Lisensi: Bilibili Model License
Cobalah
Spark TTS Standard
Suara kloning TTS dengan emosi terkendali dan berbicara gaya melalui prompt.
Pengembang: SparkAudio · Lisensi: CC BY-NC-SA 4.0
Cobalah
GPT-SoVITS Standard
Beberapa kali kloning suara TTS yang mereplikasi suara hanya dari 5 detik audio.
Pengembang: RVC-Boss · Lisensi: MIT
Cobalah
Orpheus Standard
Model TTS emosional tingkat manusia dilatih pada 100K jam dari data pidato.
Pengembang: Canopy Labs · Lisensi: Llama 3.2 Community
Cobalah
Qwen3 TTS Standard
TTS multibahasa Aliba dengan kloning suara, prasetel suara, dan desain suara dari teks.
Pengembang: Alibaba (Qwen) · Lisensi: Apache 2.0
Cobalah
CosyVoice 2
TTS bersisik Aliba dengan sifat alami manusia dan latensi dekat nol.
Bahasa: en, zh, ja, ko, fr, de, it, es
Suara Kloning
GLM-TTS
Mencapai tingkat kesalahan karakter terendah di antara model TTS open-source.
Bahasa: en, zh
Suara Kloning
IndexTTS-2
Nol-shot TTS dengan kontrol emosi halus dan ekspresif tinggi.
Bahasa: en, zh
Suara Kloning
Spark TTS
Suara kloning TTS dengan emosi terkendali dan berbicara gaya melalui prompt.
Bahasa: en, zh
Suara Kloning
GPT-SoVITS
Beberapa kali kloning suara TTS yang mereplikasi suara hanya dari 5 detik audio.
Bahasa: en, zh, ja, ko
Suara Kloning
Chatterbox
State-of-the-art zero-shot voice kloning dengan kontrol emosi dari Resemble AI.
Bahasa: en
Suara Kloning
Tortoise TTS
Speech teks multi-voice difokuskan pada kualitas dengan arsitektur autoregresif.
Bahasa: en
Suara Kloning
OpenVoice
Kloning suara instan dengan kontrol granular atas gaya, emosi, dan aksen.
Bahasa: en, zh, ja, ko, fr, de, es, it
Suara Kloning
Qwen3 TTS
TTS multibahasa Aliba dengan kloning suara, prasetel suara, dan desain suara dari teks.
Bahasa: en, zh, ja, ko, de, fr, ru, pt, es, it
Suara KloningAPI Pengembang-Pertama
API REST OpenAI yang kompatibel. Satu titik akhir, 22+ model. Streaming dukungan untuk aplikasi real-time.
- Format kompatibel OpenAI
- Streaming TTS untuk aplikasi real-time
- Pemrosesan Batch untuk pekerjaan besar
- Pemberitahuan Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Sederhana, Harga Transparan
Mulai bebas, skala saat Anda tumbuh.
Bebas
15 kredit
- Kokoro, Piper, VITS, MeloTTS
- Batas karakter 500
- 3 gen/jam (tidak ada akun)
Pro
2.000 kredit/bulan
- Segala sesuatu di Starter
- Akses API
- Pemrosesan prioritas
Pertanyaan yang Sering Diajukan
Mulai Menggunakan Suara AI Dewasa Ini
Gabungkan pembuat, pengembang, dan bisnis menggunakan TTS.ai