Free AI Text to SpeechGenericName
33+ open-source modèl, 273+ vwa, 33+ Pa gen kont mande.
Tout sa ou bezwen pou Voice AI
30+ zouti sipòte pa modèl AI open-source
33+ Modèl Vokal AI
Koleksyon ki pi konplè nan modèl TTS open-source nan yon sèl platfòm
Kokoro Gratis
Kokoro se yon 82 milyon paramèt tèks-a-parole modèl ki punches byen pi wo pase klas pwa li. Pandan ke gwosè li ti, li pwodwi pale remarkabman natirèl ak ekspresif. Kokoro sipòte plizyè lang ki gen ladan angle, Japonè, Chinwa, ak Koreyen ak yon varyete de vwa ekspresif. Li kouri incredibly vit — jenere son prèske 100x pi vit pase tan reyèl sou yon GPU.
Pi bon pou: TTS bon jan kalite segondè ak latency minimòm, aplikasyon streaming
Eseye gratis
Piper Gratis
Piper se yon motè tèks-a-parole limyè devlope pa Rhasspy ki itilize VITS ak larynx achitekti. Li kouri konplètman sou CPU, ki fè li ideyal pou aparèy edge, automatisation kay, ak aplikasyon ki mande TTS offline. Avèk plis pase 100 vwa nan plis pase 30 lang, Piper bay pale son natirèl nan vitès tan reyèl menm sou yon Raspberry Pi 4.
Pi bon pou: Previews rapid, accessibility, and embedded applications
Eseye gratis
VITS Gratis
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) se yon metòd TTS paralèl bout-a-bòd ki kreye yon son ki pi natirèl pase modèl aktyèl ki baze sou de etap. Li adopte inférence variational ki ogmante ak koule normalisation ak yon pwosesis antrenman adversarial, rive jwenn yon amelyorasyon siyifikatif nan natiralizasyon.
Pi bon pou: Text-to-speech pou rezon jeneral ak prozodi natirèlName
Eseye gratis
MeloTTS Gratis
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Pi bon pou: Aplikasyon pwodiksyon ki bezwen TTS rapid, multilenguage
Eseye gratis
Kani TTS 2 Gratis
Kani-TTS-2 by NineNineSix se yon modèl paramèt 400M ultra-lightweight bati sou LiquidAI LFM2 backbone ak Nvidia NanoCodec. Li kouri nan jis 3GB VRAM ak reyalize 10 segonn nan pale nan ~ 2 segonn (RTF 0.2).
Pi bon pou: Pwodiksyon rapid, environnements ba- resous, aperçu rapid
Eseye gratis
OuteTTS Gratis
OuteTTS pwolonje gwo modèl lang ak kapasite tèks-a-parole pandan l ap kenbe achitekti orijinal la. Li sipòte backends multiple ki gen ladan llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ak menm infèrans navigatè via Transformers.js. Features zero-shot voice cloning through speaker profiles saved as JSON.
Pi bon pou: Edge deployment, TTS ki baze sou navigatè, environnements ki ba-resous
Eseye gratis
Pocket TTS Gratis
Pocket TTS pa Kyutai (kreyatè Moshi) se yon modèl tèks-a-parole 100M paramèt ki koube byen pi wo pase pwa li. Li kouri efikasman sou CPU, sipòte klonaj vwa zero-shot soti nan yon sèl echantiyon son, epi pwodwi pale natirèl-son. Ti gwosè modèl la fè li ideyal pou deployment edge ak anviwònman ki ba-resous.
Pi bon pou: Deployman limyè, environnements CPU-only, klonaj vwa rapid
Eseye gratis
Kitten TTS Gratis
Kitten TTS by KittenML se yon modèl tèks-a-parole ultra-lèjyè ki bati sou ONNX. Avèk varyasyon de 15M a 80M paramèt (25-80 MB sou disk), li bay sintezis vwa bon jan kalite segondè sou CPU san li pa mande yon GPU. Karakteristik 8 vwa enkòpore, vitès pale ajoutab, ak pre-pwosesyon tèks enkòpore pou nimewo, lajan, ak unite. Idèyal pou deployman edge ak aplikasyon ki gen ti latens.
Pi bon pou: TTS limyè vit, deployman edge, aplikasyon ki gen ti latens
Eseye gratis
Ming-Omni TTS Gratis
Ming-omni-tts-0.5B pa inclusionAI se yon modèl pale omni-modal konpayon bati sou baz dense BailingMM ak yon dekodè odyo Patch-pa-Patch ki matche ak flè. Li bay 44.1kHz (nan kalite CD), sipòte klonaj vwa zewo-shot soti nan yon rekòmandasyon 3 + dezyèm, epi li gen ladan kontwòl efè / dyalèk / BGM ki enkòpore via enstriksyon JSON. Excellent stabilité - 0.83% WER sou rekòmandasyon Chinwa.
Pi bon pou: Narratif bilingual High-fidélité, efè vwa kontwole pa efè, kontni liv son Chinwa
Eseye gratis
MOSS-TTS Nano Gratis
MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.
Pi bon pou: Free-tier TTS, high-volume production, low-latency interactive use
Eseye gratis
Bark Estansèl
Modèl tèks-nan-son ki baze sou transformateur ki jenere pale, mizik, ak efè son realist.
Pwogramè: Suno · Lisans: MIT
Tcheke li
Bark Small Estansèl
Versiyon ki pi limyè nan Bark ak inférence pi vit ak itilize nan memwa ki pi ba.
Pwogramè: Suno · Lisans: MIT
Tcheke li
CosyVoice 2 Estansèl
Alibaba's scalable streaming TTS ak natiralizasyon parite imen ak latency prèske zewo.
Pwogramè: Alibaba (Tongyi Lab) · Lisans: Apache 2.0
Tcheke li
Dia TTS Estansèl
Modèl jenerasyon dyalòg multi-pale ki kreye konvèsasyon natirèl ant pale yo.
Pwogramè: Nari Labs · Lisans: Apache 2.0
Tcheke li
Parler TTS Estansèl
Descrivez la voix que vous voulez dans la langue naturelle et Parler génère la parole correspondante.
Pwogramè: Hugging Face · Lisans: Apache 2.0
Tcheke li
IndexTTS-2 Estansèl
Zero-shot TTS ak kontwòl emosyon fine-grained ak ekspresyon segondè.
Pwogramè: Index Team · Lisans: Bilibili Model License
Tcheke li
Spark TTS Estansèl
Voye klonaj TTS ak emosyon kontwole ak style pale via pwompts.
Pwogramè: SparkAudio · Lisans: CC BY-NC-SA 4.0
Tcheke li
GPT-SoVITS Estansèl
Few-shot klonaj vwa TTS ki replike nenpòt vwa soti nan jis 5 segonn nan son.
Pwogramè: RVC-Boss · Lisans: MIT
Tcheke li
Orpheus Estansèl
100,000 èdtan nan done pale yo te itilize pou fòme yon modèl TTS emosyonèl nivo imen.
Pwogramè: Canopy Labs · Lisans: Llama 3.2 Community
Tcheke li
Qwen3 TTS Estansèl
Alibaba's multilingual TTS ak klonaj vwa, preset vwa, ak konsepsyon vwa soti nan tèks.
Pwogramè: Alibaba (Qwen) · Lisans: Apache 2.0
Tcheke li
VieNeu-TTS-v2 Estansèl
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
Pwogramè: Phạm Nguyễn Ngọc Bảo · Lisans: Apache 2.0
Tcheke li
Chatterbox Turbo Estansèl
Chatterbox pi vit ak sub-200ms latency ak tags paralinguistik pou ri, touse, ak plis ankò.
Pwogramè: Resemble AI · Lisans: MIT
Tcheke li
VoxCPM Estansèl
Tokenizer-gratis TTS ki pwodwi 44.1kHz odyo ak konstan paragraf kontexte-konsyan.
Pwogramè: OpenBMB · Lisans: Apache 2.0
Tcheke li
VibeVoice Estansèl
Microsoft modèl pou fòm long multi-pale kontni tankou podcasts ak audiobooks.
Pwogramè: Microsoft · Lisans: MIT
Tcheke li
CosyVoice3 Estansèl
TTS multi-lang jenerasyon kap vini an ak bi-streaming, kontwòl efè, ak klonaj vwa zero-shot.
Pwogramè: Alibaba (FunAudioLLM) · Lisans: Apache 2.0
Tcheke li
NAMAA Saudi TTS Estansèl
Premye TTS Arabi Saoudit louvri. Dialekt natif natal Arabi Saoudit ak klonaj vwa kalite Chatterbox.
Pwogramè: NAMAA Space · Lisans: MIT
Tcheke li
Darwin TTS Estansèl
Qwen3-TTS varyasyon cross-modal ak FFN pwa melanje soti nan Qwen3-1.7B modèl lang pou klonaj multilenguage pi byen.
Pwogramè: FINAL-Bench · Lisans: Apache 2.0
Tcheke li
MOSS-TTSD Estansèl
Modèl pou kontinye yon dyalòg ak anpil paleur — kreye konvèsasyon style podcast ak jiska 5 paleur ak 60 minit odyo koherent.
Pwogramè: OpenMOSS · Lisans: Apache 2.0
Tcheke li
CosyVoice 2
Alibaba's scalable streaming TTS ak natiralizasyon parite imen ak latency prèske zewo.
Lang: en, zh, ja, ko, fr, de, it, es
Klone Voy
IndexTTS-2
Zero-shot TTS ak kontwòl emosyon fine-grained ak ekspresyon segondè.
Lang: en, zh
Klone Voy
GPT-SoVITS
Few-shot klonaj vwa TTS ki replike nenpòt vwa soti nan jis 5 segonn nan son.
Lang: en, zh, ja, ko
Klone Voy
Chatterbox
Pwogram sa a gen ladan tou yon sistèm klonaj vwa ak kontwòl emosyonèl ki rele Resemble AI.
Lang: en
Klone Voy
OpenVoice
Instant klonaj vwa ak kontwòl granulaire sou style, emosyon, ak aksan.
Lang: en, zh, ja, ko, fr, es
Klone Voy
VieNeu-TTS-v2
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
Lang: vi, en
Klone Voy
Chatterbox Turbo
Chatterbox pi vit ak sub-200ms latency ak tags paralinguistik pou ri, touse, ak plis ankò.
Lang: en
Klone Voy
VoxCPM
Tokenizer-gratis TTS ki pwodwi 44.1kHz odyo ak konstan paragraf kontexte-konsyan.
Lang: en, zh
Klone Voy
OuteTTS
LLM-ki baze sou TTS ki kouri sou CPU, GPU, oswa navigatè via llama.cpp ak Transformers.js.
Lang: en
Klone Voy
Pocket TTS
100M modèl paramèt limyè pa Kyutai ak klonaj vwa soti nan yon sèl echantiyon.
Lang: en, fr
Klone Voy
CosyVoice3
TTS multi-lang jenerasyon kap vini an ak bi-streaming, kontwòl efè, ak klonaj vwa zero-shot.
Lang: en, zh, ja, ko, de, es, fr, it, ru
Klone Voy
NAMAA Saudi TTS
Premye TTS Arabi Saoudit louvri. Dialekt natif natal Arabi Saoudit ak klonaj vwa kalite Chatterbox.
Lang: ar
Klone Voy
Darwin TTS
Qwen3-TTS varyasyon cross-modal ak FFN pwa melanje soti nan Qwen3-1.7B modèl lang pou klonaj multilenguage pi byen.
Lang: en, ko, ja, zh
Klone Voy
MOSS-TTSD
Modèl pou kontinye yon dyalòg ak anpil paleur — kreye konvèsasyon style podcast ak jiska 5 paleur ak 60 minit odyo koherent.
Lang: en, zh
Klone Voy
Ming-Omni TTS
Modèl pale omni-modal 0.5B ki konpaye soti nan inclusionAI ak yon pwodiksyon 44.1kHz ak klonaj vwa zero-shot.
Lang: en, zh
Klone Voy
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.
Lang: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Klone VoyDeveloper-First API
OpenAI-kompatib REST API. One endpoint, 22 + modèl. Streaming sipò pou aplikasyon an tan reyèl.
- OpenAI-kompatib fòma
- Streaming TTS pou aplikasyon an tan reyèl
- Batch pwosesis pou gwo travay
- Notifikasyon Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Pri senp, transparan
Kòmanse gratis. Skale kòm ou grandi.
Gratis
15,000 karaktè + 5,000/jou
- 7 modèl gratis ki gen ladan Kokoro
- 5,000 karaktè pou chak jenerasyon
- Akses API enkli
Starter
500 kredi / mwa
- Tout 22+ modèl
- 100,000 karaktè pou chak jenerasyon
- Klonaj Vokal
Kesyon ki poze souvan
Ki sa nou ka amelyore? Feedback ou ede nou rezoud pwoblèm.
Kòmanse itilize AI Voice jodi a
Join kreyatè, devlopè, ak biznis ki itilize TTS.ai