Free AI Teks-ka-waca

33+ open-source model, 273+ swara, 33+ basa. Ora dibutuhake akun.

18K+
pembuat
71K+
generasi
33+
Model AI
273+
suara
0/500 aksara · 5000 kanggo saben generasi → Bebas
Love TTS.ai? Nyathet kanca-kancamu!

33+ Model Suara AI

Koleksi paling komprehensif saka model TTS sumber terbuka ing siji platform

KokoroKokoro Bebas

Kokoro nyaéta model teks-ka-wacana kalayan parameter 82 juta anu ngaleuwihan kelas beuratna. Sanaos ukuranana leutik, éta ngahasilkeun wacana anu alami sareng ekspresif. Kokoro ngadukung sababaraha basa kalebet basa Inggris, Jepang, Cina, sareng Korea kalayan rupa-rupa sora ekspresif. Éta ngajalankeun gancang pisan - ngahasilkeun audio sakitar 100x langkung gancang tibatan waktos nyata dina GPU.

Paling apik kanggo: TTS kualitas dhuwur karo latensi minimal, aplikasi streaming

Coba gratis

PiperPiper Bebas

Piper nyaéta mesin téks-ka-wacana anu ringan anu dikembangkeun ku Rhasspy anu ngagunakeun arsitektur VITS sareng larynx. Éta dijalankeun sacara lengkep dina CPU, janten sampurna pikeun alat edge, home automation, sareng aplikasi anu meryogikeun TTS offline. Ku langkung ti 100 sora ngalangkungan 30+ basa, Piper nyayogikeun wacana anu sorana alami dina kecepatan waktos nyata bahkan dina Raspberry Pi 4.

Paling apik kanggo: Pratélan cepet, aksesibilitas, lan aplikasi sing dilebokake

Coba gratis

VITSVITS Bebas

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) nyaéta metode TTS paralel end-to-end anu ngahasilkeun sora anu langkung alami tibatan modél dua-tahap ayeuna. Éta ngadopsi variational inference ditambahkeun ku aliran normalisasi sareng prosés pelatihan lawan, ngahasilkeun paningkatan alamiah anu signifikan.

Paling apik kanggo: Teks-ka-ucapan tujuan umum karo prosodi alami

Coba gratis

MeloTTSMeloTTS Bebas

MeloTTS ku MyShell.ai nyaéta pustaka TTS multibasa anu ngadukung basa Inggris (Amerika, Inggris, India, Australia), Spanyol, Perancis, Cina, Jepang, jeung Korea. Éta gancang pisan, ngaolah téks dina laju waktos nyata dina CPU sorangan. MeloTTS dirancang pikeun panggunaan produksi sareng ngadukung CPU sareng GPU inference.

Paling apik kanggo: Produksi aplikasi kang butuh TTS cepet, multibasa

Coba gratis

Kani TTS 2Kani TTS 2 Bebas

Kani-TTS-2 ku NineNineSix mangrupikeun model parameter 400M ultra-lébar anu diwangun dina backbone LiquidAI LFM2 kalayan Nvidia NanoCodec. Éta dijalankeun dina ngan 3GB VRAM sareng ngahontal 10 detik percakapan dina ~2 detik (RTF 0.2). Ngadukung kloning sora zero-shot ngalangkungan embeddings speaker.

Paling apik kanggo: Generasi cepet, lingkungan sumber daya endhek, pratinjau cepet

Coba gratis

OuteTTSOuteTTS Bebas

OuteTTS ngalegaan model basa anu gedé kalayan kamampuan teks-ka-wacana sakumaha ngajaga arsitektur aslina. Éta ngadukung sababaraha backends kaasup llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, sarta malah inference browser via Transformers.js. Fitur kloning sora zero-shot ngaliwatan profil panyatur disimpen salaku JSON.

Paling apik kanggo: Pemasangan Edge, TTS adhedhasar browser, lingkungan sumber daya endhek

Coba gratis

Pocket TTSPocket TTS Bebas

Pocket TTS ku Kyutai (panyekel Moshi) nyaéta model teks-ka-wacana parameter 100M anu kompak anu ngaleuwihan beuratna. Ieu dijalankeun kalayan efisien dina CPU, ngadukung kloning sora zero-shot ti sampel audio tunggal, sarta ngahasilkeun wacana anu sorana alami. Ukuran model anu alit ngajantenkeunana sampurna pikeun pamasangan tepi sareng lingkungan sumber daya anu handap.

Paling apik kanggo: Panyebaran sing gampang, lingkungan CPU-saben, kloning swara sing cepet

Coba gratis

Kitten TTSKitten TTS Bebas

Kitten TTS ku KittenML nyaéta model teks-ka-wacana ultra-légér anu diwangun dina ONNX. Ku variasi ti 15M dugi ka 80M parameter (25-80 MB dina disk), éta nyayogikeun sintésis sora kualitas luhur dina CPU tanpa peryogi GPU. Fitur 8 sora anu aya, laju basa anu tiasa disaluyukeun, sareng pre-proses teks anu aya pikeun angka, mata uang, sareng unit. Ideal pikeun aplikasi panyebaran tepi sareng latensi rendah.

Paling apik kanggo: TTS cekak lan gampang, aplikasi sing ora akeh latensi

Coba gratis

Ming-Omni TTSMing-Omni TTS Bebas

Ming-omni-tts-0.5B ku inclusionAI nyaéta model pidato omni-modal kompak anu diwangun dina tulang tonggong anu padat BailingMM kalayan dekoder audio anu cocog sareng Patch-by-Patch. Ngahasilkeun output 44.1kHz (deukeut kualitas CD), ngadukung kloning sora zero-shot tina rujukan 3+ detik, sareng kalebet kontrol emosi / dialek / BGM anu terintegrasi ngalangkungan instruksi JSON.

Paling apik kanggo: Basa Cina, basa resmi Republik Rakyat Cina, basa resmi Republik Rakyat Cina

Coba gratis

MOSS-TTS NanoMOSS-TTS Nano Bebas

MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.

Paling apik kanggo: Free-tier TTS, high-volume production, low-latency interactive use

Coba gratis

BarkBark Standar

Model teks-ka-audio dumasar kana transformator anu ngahasilkeun basa, musik, sareng efek sora anu realistis.

Pangembang: Suno · Lisensi: MIT

Coba

Bark SmallBark Small Standar

Versi anyar iki luwih cepet, luwih efisien, lan luwih murah.

Pangembang: Suno · Lisensi: MIT

Coba

CosyVoice 2CosyVoice 2 Standar

Sacara umum, alam semesta diklasifikasikeun kana alam semesta statis, alam semesta dinamis, sarta alam semesta dinamis-statis.

Pangembang: Alibaba (Tongyi Lab) · Lisensi: Apache 2.0

Coba

Dia TTSDia TTS Standar

Multi-speaker dialog generasi model nu ngahasilkeun percakapan alami antara speaker.

Pangembang: Nari Labs · Lisensi: Apache 2.0

Coba

Parler TTSParler TTS Standar

Ngajelaskeun sora anu anjeun pikahoyong dina basa alami sarta Parler bakal ngahasilkeun basa anu cocog.

Pangembang: Hugging Face · Lisensi: Apache 2.0

Coba

IndexTTS-2IndexTTS-2 Standar

Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma

Pangembang: Index Team · Lisensi: Bilibili Model License

Coba

Spark TTSSpark TTS Standar

Telepon sélulér dipaké pikeun komunikasi, komunikasi interpersonal, sareng komunikasi interpersonal.

Pangembang: SparkAudio · Lisensi: CC BY-NC-SA 4.0

Coba

GPT-SoVITSGPT-SoVITS Standar

Sacara umum, spésiés-spésiés ieu diklasifikasikeun kana 5 subspesies, anu masing-masing diklasifikasikeun kana 5 subspesies.

Pangembang: RVC-Boss · Lisensi: MIT

Coba

OrpheusOrpheus Standar

100.000 taun kapungkur, spésiés-spésiés dinosaurus diklasifikasikeun dumasar kana data fosil.

Pangembang: Canopy Labs · Lisensi: Llama 3.2 Community

Coba

Qwen3 TTSQwen3 TTS Standar

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Pangembang: Alibaba (Qwen) · Lisensi: Apache 2.0

Coba

VieNeu-TTS-v2VieNeu-TTS-v2 Standar

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

Pangembang: Phạm Nguyễn Ngọc Bảo · Lisensi: Apache 2.0

Coba

Chatterbox TurboChatterbox Turbo Standar

2000 - 2001 - Dilaksanakeun pameran seni rupa, seni rupa, seni rupa, seni rupa, seni rupa, seni rupa.

Pangembang: Resemble AI · Lisensi: MIT

Coba

VoxCPMVoxCPM Standar

Nokia 4310 dipirantèni kodhak 1.3 MP lan fitur LED flash,.

Pangembang: OpenBMB · Lisensi: Apache 2.0

Coba

VibeVoiceVibeVoice Standar

Microsoft model kanggo konten multi-speaker bentuk panjang kaya podcasts lan audiobooks.

Pangembang: Microsoft · Lisensi: MIT

Coba

CosyVoice3CosyVoice3 Standar

TTS generasi salajengna multi-basa kalayan bi-streaming, kontrol emosi, sarta kloning sora zero-shot.

Pangembang: Alibaba (FunAudioLLM) · Lisensi: Apache 2.0

Coba

NAMAA Saudi TTSNAMAA Saudi TTS Standar

TTS Arab Saudi kapisan. Dialek asli Saudi kalawan kloning sora kualitas Chatterbox.

Pangembang: NAMAA Space · Lisensi: MIT

Coba

Darwin TTSDarwin TTS Standar

Qwen3-TTS, versi cross-modal Qwen3-TTS, nganggo FFN, dicampuran saka Qwen3-1.7B, kanggo kloning multi-basa.

Pangembang: FINAL-Bench · Lisensi: Apache 2.0

Coba

MOSS-TTSDMOSS-TTSD Standar

Diantarana, 100 menit anu diwangun ku 500 kecap, 100 menit anu diwangun ku 500 kecap, sarta 100 menit anu diwangun ku 500 kecap.

Pangembang: OpenMOSS · Lisensi: Apache 2.0

Coba

ChatterboxChatterbox Premium

Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma

Kualitas:

Coba

Tortoise TTSTortoise TTS Premium

Sacara umum, téks-ka-wacana multi-vokal fokus kana kualitas sareng arsitektur autoregressif.

Kualitas:

Coba

StyleTTS 2StyleTTS 2 Premium

Sacara historis, basa Sunda diwangun ku basa lisan, basa tulisan, jeung basa lisan.

Kualitas:

Coba

OpenVoiceOpenVoice Premium

Sacara umum, basa Inggris diklasifikasikaké dumasar kana basa, dialek, lan gaya basa.

Kualitas:

Coba

Sesame CSMSesame CSM Premium

Sacara umum, komunikasi interpersonal ngawengku komunikasi verbal, non-verbal, sareng interpersonal.

Kualitas:

Coba

CosyVoice 2CosyVoice 2

Sacara umum, alam semesta diklasifikasikeun kana alam semesta statis, alam semesta dinamis, sarta alam semesta dinamis-statis.

Basa: en, zh, ja, ko, fr, de, it, es

Клон голоса

IndexTTS-2IndexTTS-2

Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma

Basa: en, zh

Клон голоса

Spark TTSSpark TTS

Telepon sélulér dipaké pikeun komunikasi, komunikasi interpersonal, sareng komunikasi interpersonal.

Basa: en, zh

Клон голоса

GPT-SoVITSGPT-SoVITS

Sacara umum, spésiés-spésiés ieu diklasifikasikeun kana 5 subspesies, anu masing-masing diklasifikasikeun kana 5 subspesies.

Basa: en, zh, ja, ko

Клон голоса

ChatterboxChatterbox

Sacara umum, algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma algoritma

Basa: en

Клон голоса

Tortoise TTSTortoise TTS

Sacara umum, téks-ka-wacana multi-vokal fokus kana kualitas sareng arsitektur autoregressif.

Basa: en

Клон голоса

OpenVoiceOpenVoice

Sacara umum, basa Inggris diklasifikasikaké dumasar kana basa, dialek, lan gaya basa.

Basa: en, zh, ja, ko, fr, es

Клон голоса

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

Basa: vi, en

Клон голоса

Chatterbox TurboChatterbox Turbo

2000 - 2001 - Dilaksanakeun pameran seni rupa, seni rupa, seni rupa, seni rupa, seni rupa, seni rupa.

Basa: en

Клон голоса

VoxCPMVoxCPM

Nokia 4310 dipirantèni kodhak 1.3 MP lan fitur LED flash,.

Basa: en, zh

Клон голоса

OuteTTSOuteTTS

LLM-basa TTS sing dioperasikake ing CPU, GPU, utawa browser liwat llama.cpp lan Transformers.js.

Basa: en

Клон голоса

Pocket TTSPocket TTS

100M parameter model lightweight dening Kyutai karo kloning swara saka siji sampel.

Basa: en, fr

Клон голоса

CosyVoice3CosyVoice3

TTS generasi salajengna multi-basa kalayan bi-streaming, kontrol emosi, sarta kloning sora zero-shot.

Basa: en, zh, ja, ko, de, es, fr, it, ru

Клон голоса

NAMAA Saudi TTSNAMAA Saudi TTS

TTS Arab Saudi kapisan. Dialek asli Saudi kalawan kloning sora kualitas Chatterbox.

Basa: ar

Клон голоса

Darwin TTSDarwin TTS

Qwen3-TTS, versi cross-modal Qwen3-TTS, nganggo FFN, dicampuran saka Qwen3-1.7B, kanggo kloning multi-basa.

Basa: en, ko, ja, zh

Клон голоса

MOSS-TTSDMOSS-TTSD

Diantarana, 100 menit anu diwangun ku 500 kecap, 100 menit anu diwangun ku 500 kecap, sarta 100 menit anu diwangun ku 500 kecap.

Basa: en, zh

Клон голоса

Ming-Omni TTSMing-Omni TTS

Compact 0.5B omni-modal speech model from inclusionAI with high-fidelity 44.1kHz output and zero-shot voice cloning.

Basa: en, zh

Клон голоса

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

Basa: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Клон голоса

Developer-First API

REST API kompatibel OpenAI. hiji titik akhir, 22+ model. dukungan streaming pikeun aplikasi real-time.

  • Bentuk sing cocog karo OpenAI
  • Streaming TTS kanggo aplikasi wektu nyata
  • Pemrosesan batch untuk pekerjaan besar
  • Panggilan Webhook
Lihat Dokumen API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Sederhana, transparan Pricing

Miwiti kanthi gratis. Skala nalika sampeyan tuwuh.

Bebas

$0

15,000 karakter + 5,000/dina

  • 7 model gratis kalebu Kokoro
  • 5,000 karakter saben generasi
  • API akses kalebu
Gabung Free

Pemula

$9/ms

500 kredit/wulan

  • Seluruh 22+ model
  • 100,000 karakter saben generasi
  • Kloning Suara
Miwiti
Paling populer

Pro

$29/ms

2,000 kredit/wulan

  • Segalanya dalam Starter
  • Akses API
  • Priority processing
Njupuk Pro

Bisnis

$99/ms

10,000 kredit/wulan

  • Segalanya ing Pro
  • Bulk API
  • Jalur prioritas
Get Business

Lihat kabeh rencana kalebu paket karakter →

Takon-takon sing sering diajukake

TTS.ai nyaéta platform sora AI anu pangkomprehensifna, nawiskeun 22+ model teks-ka-wacana, kloning sora, wacana-ka-wacana, sarta alat audio. Sadaya modelna sumber terbuka tanpa dikustomisasi ku vendor.

Ya! TTS.ai nawiskeun teks-ka-wacana gratis sareng Kokoro, Piper, VITS, sareng MeloTTS. Henteu aya akun anu diperyogikeun. Daftarkeun pikeun kéngingkeun karakter gratis 15,000 sareng aksés kana sadaya model. Rencana anu dibayar mimiti $ 9 / bulan.

Pikeun laju, gunakeun Kokoro atawa Piper. Pikeun kualitas, coba CosyVoice 2 atawa StyleTTS 2. Pikeun kloning sora, gunakeun Chatterbox atawa GPT-SoVITS. Pikeun dialog, gunakeun Dia TTS. Coba sababaraha model dina teks anu sami pikeun ngabandingkeun.

Ya. OpenAI-kompatibel REST API pikeun TTS, STT, kloning sora, lan alat audio. Dilebetkeun dina saben rencana kalebet gratis, kalayan watesan laju anu skala ku tingkat (Free: 10 req / min, Lite: 20, Starter: 30, Pro: 60, Business: 300). Tinjauan dokumen di tts.ai/api /.

Kualitas sora béda-béda gumantung kana modelna. Model premium kayaning CosyVoice 2, StyleTTS 2, jeung Chatterbox ngahasilkeun sora kualitas manusa kalayan intonasi sarta emosi alami. Model bébas kayaning Kokoro nawiskeun kualitas anu saé pikeun kaseueuran kasus panggunaan.

TTS.ai ngadukung 30+ basa di sakuliah pustaka modelna. Basa Inggris boga dukungan model anu pangleutikna, tapi model kayaning CosyVoice 2 ngawengku basa Cina, Jepang, jeung Korea; GPT-SoVITS ngawengku basa Cina, Jepang, Korea, jeung Inggris; sarta MeloTTS ngawengku basa Inggris, Spanyol, Perancis, Cina, Jepang, jeung Korea.

Ya. Sadaya pamrosésan lumangsung dina pelayan GPU kami anu didedikasikan. Kami henteu nyimpen input teks anjeun atanapi audio anu dihasilkeun saatos dikirimkeun. Sampel sora anu diunggah pikeun kloning ngan dianggo pikeun sesi ayeuna sareng henteu disimpen. Kami henteu pernah babagi data anjeun sareng pihak katilu atanapi nganggo éta pikeun ngalatih model.

Ya. Sadaya audio anu dihasilkeun dina TTS.ai nyaéta milik anjeun pikeun panggunaan komersial, kalebet pikeun video YouTube, podcast, buku audio, aplikasi, iklan, sareng produk. Model kami mangrupikeun sumber terbuka dina lisénsi permisif (MIT, Apache 2.0). Teu aya royalti atanapi atribusi anu diperyogikeun.

TTS.ai ngahasilkeun audio dina format WAV sacara piawai pikeun kualitas maksimum. Anjeun tiasa ngarobih kana MP3, FLAC, OGG, atanapi M4A nganggo alat Konverter Audio gratis kami. API ngadukung ngajelaskeun format output anu anjeun pikahoyong langsung dina pamundut.

Unggah sampel audio pondok (saeutikna 5 detik) tina sora anu anjeun hoyong klon, teras ketik téks naon waé pikeun ngahasilkeun basa dina sora éta. Model saperti Chatterbox, GPT-SoVITS, jeung CosyVoice 2 ngadukung kloning sora. Suara anu dikloning ngamangpaatkeun nada, aksen, jeung gaya basa.

Model bébas (Kokoro, Piper, VITS, MeloTTS) henteu meryogikeun akun sareng biaya kredit nol. Model standar (2 kredit / 1K karakter) kalebet Bark, CosyVoice 2, F5-TTS, sareng Dia. Model premium (4 kredit / 1K karakter) kalebet OpenVoice, Chatterbox, StyleTTS 2, sareng Tortoise. Model anu dibayar biasana nawiskeun kualitas anu langkung luhur, langkung seueur sora, sareng fitur tambahan sapertos kloning sora.

Ya. API ngadukung pamrosésan batches pikeun ngarobah volume badag teks kana basa. Kirimkeun sababaraha panyungsi sarta meunangkeun hasilna sacara asynchronous ngagunakeun UUID padamelan. Rencana bisnis ($99/mo) sarta luhur ngawengku aksés prioritas baris pikeun pamrosésan batches anu langkung gancang. Ideal pikeun produksi buku audio, isi kursus, jeung proyek voiceover skala ageung.
4.1/5 (42)

Apa sing bisa kita ningkatake? Pangarep-arepmu mbantu kita ngrampungake masalah.

Mulai Menggunakan AI Suara Hari Ini

Gabung karo para pembuat, pengembang, lan bisnis sing nggunakake TTS.ai