Free AI Text to SpeechGenericName

33+ open-source modèl, 273+ vwa, 33+ Pa gen kont mande.

17K+
kreyatè
70K+
jenerasyon
33+
Modèl AI
273+
vwa
0/500 karaktè · Enskri pou 5,000 pou chak jenerasyon → Gratis
Love TTS.ai? Di zanmi ou yo!

33+ Modèl Vokal AI

Koleksyon ki pi konplè nan modèl TTS open-source nan yon sèl platfòm

KokoroKokoro Gratis

Kokoro se yon 82 milyon paramèt tèks-a-parole modèl ki punches byen pi wo pase klas pwa li. Pandan ke gwosè li ti, li pwodwi pale remarkabman natirèl ak ekspresif. Kokoro sipòte plizyè lang ki gen ladan angle, Japonè, Chinwa, ak Koreyen ak yon varyete de vwa ekspresif. Li kouri incredibly vit — jenere son prèske 100x pi vit pase tan reyèl sou yon GPU.

Pi bon pou: TTS bon jan kalite segondè ak latency minimòm, aplikasyon streaming

Eseye gratis

PiperPiper Gratis

Piper se yon motè tèks-a-parole limyè devlope pa Rhasspy ki itilize VITS ak larynx achitekti. Li kouri konplètman sou CPU, ki fè li ideyal pou aparèy edge, automatisation kay, ak aplikasyon ki mande TTS offline. Avèk plis pase 100 vwa nan plis pase 30 lang, Piper bay pale son natirèl nan vitès tan reyèl menm sou yon Raspberry Pi 4.

Pi bon pou: Previews rapid, accessibility, and embedded applications

Eseye gratis

VITSVITS Gratis

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) se yon metòd TTS paralèl bout-a-bòd ki kreye yon son ki pi natirèl pase modèl aktyèl ki baze sou de etap. Li adopte inférence variational ki ogmante ak koule normalisation ak yon pwosesis antrenman adversarial, rive jwenn yon amelyorasyon siyifikatif nan natiralizasyon.

Pi bon pou: Text-to-speech pou rezon jeneral ak prozodi natirèlName

Eseye gratis

MeloTTSMeloTTS Gratis

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Pi bon pou: Aplikasyon pwodiksyon ki bezwen TTS rapid, multilenguage

Eseye gratis

Kani TTS 2Kani TTS 2 Gratis

Kani-TTS-2 by NineNineSix se yon modèl paramèt 400M ultra-lightweight bati sou LiquidAI LFM2 backbone ak Nvidia NanoCodec. Li kouri nan jis 3GB VRAM ak reyalize 10 segonn nan pale nan ~ 2 segonn (RTF 0.2).

Pi bon pou: Pwodiksyon rapid, environnements ba- resous, aperçu rapid

Eseye gratis

OuteTTSOuteTTS Gratis

OuteTTS pwolonje gwo modèl lang ak kapasite tèks-a-parole pandan l ap kenbe achitekti orijinal la. Li sipòte backends multiple ki gen ladan llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ak menm infèrans navigatè via Transformers.js. Features zero-shot voice cloning through speaker profiles saved as JSON.

Pi bon pou: Edge deployment, TTS ki baze sou navigatè, environnements ki ba-resous

Eseye gratis

Pocket TTSPocket TTS Gratis

Pocket TTS pa Kyutai (kreyatè Moshi) se yon modèl tèks-a-parole 100M paramèt ki koube byen pi wo pase pwa li. Li kouri efikasman sou CPU, sipòte klonaj vwa zero-shot soti nan yon sèl echantiyon son, epi pwodwi pale natirèl-son. Ti gwosè modèl la fè li ideyal pou deployment edge ak anviwònman ki ba-resous.

Pi bon pou: Deployman limyè, environnements CPU-only, klonaj vwa rapid

Eseye gratis

Kitten TTSKitten TTS Gratis

Kitten TTS by KittenML se yon modèl tèks-a-parole ultra-lèjyè ki bati sou ONNX. Avèk varyasyon de 15M a 80M paramèt (25-80 MB sou disk), li bay sintezis vwa bon jan kalite segondè sou CPU san li pa mande yon GPU. Karakteristik 8 vwa enkòpore, vitès pale ajoutab, ak pre-pwosesyon tèks enkòpore pou nimewo, lajan, ak unite. Idèyal pou deployman edge ak aplikasyon ki gen ti latens.

Pi bon pou: TTS limyè vit, deployman edge, aplikasyon ki gen ti latens

Eseye gratis

Ming-Omni TTSMing-Omni TTS Gratis

Ming-omni-tts-0.5B pa inclusionAI se yon modèl pale omni-modal konpayon bati sou baz dense BailingMM ak yon dekodè odyo Patch-pa-Patch ki matche ak flè. Li bay 44.1kHz (nan kalite CD), sipòte klonaj vwa zewo-shot soti nan yon rekòmandasyon 3 + dezyèm, epi li gen ladan kontwòl efè / dyalèk / BGM ki enkòpore via enstriksyon JSON. Excellent stabilité - 0.83% WER sou rekòmandasyon Chinwa.

Pi bon pou: Narratif bilingual High-fidélité, efè vwa kontwole pa efè, kontni liv son Chinwa

Eseye gratis

MOSS-TTS NanoMOSS-TTS Nano Gratis

MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.

Pi bon pou: Free-tier TTS, high-volume production, low-latency interactive use

Eseye gratis

BarkBark Estansèl

Modèl tèks-nan-son ki baze sou transformateur ki jenere pale, mizik, ak efè son realist.

Pwogramè: Suno · Lisans: MIT

Tcheke li

Bark SmallBark Small Estansèl

Versiyon ki pi limyè nan Bark ak inférence pi vit ak itilize nan memwa ki pi ba.

Pwogramè: Suno · Lisans: MIT

Tcheke li

CosyVoice 2CosyVoice 2 Estansèl

Alibaba's scalable streaming TTS ak natiralizasyon parite imen ak latency prèske zewo.

Pwogramè: Alibaba (Tongyi Lab) · Lisans: Apache 2.0

Tcheke li

Dia TTSDia TTS Estansèl

Modèl jenerasyon dyalòg multi-pale ki kreye konvèsasyon natirèl ant pale yo.

Pwogramè: Nari Labs · Lisans: Apache 2.0

Tcheke li

Parler TTSParler TTS Estansèl

Descrivez la voix que vous voulez dans la langue naturelle et Parler génère la parole correspondante.

Pwogramè: Hugging Face · Lisans: Apache 2.0

Tcheke li

IndexTTS-2IndexTTS-2 Estansèl

Zero-shot TTS ak kontwòl emosyon fine-grained ak ekspresyon segondè.

Pwogramè: Index Team · Lisans: Bilibili Model License

Tcheke li

Spark TTSSpark TTS Estansèl

Voye klonaj TTS ak emosyon kontwole ak style pale via pwompts.

Pwogramè: SparkAudio · Lisans: CC BY-NC-SA 4.0

Tcheke li

GPT-SoVITSGPT-SoVITS Estansèl

Few-shot klonaj vwa TTS ki replike nenpòt vwa soti nan jis 5 segonn nan son.

Pwogramè: RVC-Boss · Lisans: MIT

Tcheke li

OrpheusOrpheus Estansèl

100,000 èdtan nan done pale yo te itilize pou fòme yon modèl TTS emosyonèl nivo imen.

Pwogramè: Canopy Labs · Lisans: Llama 3.2 Community

Tcheke li

Qwen3 TTSQwen3 TTS Estansèl

Alibaba's multilingual TTS ak klonaj vwa, preset vwa, ak konsepsyon vwa soti nan tèks.

Pwogramè: Alibaba (Qwen) · Lisans: Apache 2.0

Tcheke li

VieNeu-TTS-v2VieNeu-TTS-v2 Estansèl

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

Pwogramè: Phạm Nguyễn Ngọc Bảo · Lisans: Apache 2.0

Tcheke li

Chatterbox TurboChatterbox Turbo Estansèl

Chatterbox pi vit ak sub-200ms latency ak tags paralinguistik pou ri, touse, ak plis ankò.

Pwogramè: Resemble AI · Lisans: MIT

Tcheke li

VoxCPMVoxCPM Estansèl

Tokenizer-gratis TTS ki pwodwi 44.1kHz odyo ak konstan paragraf kontexte-konsyan.

Pwogramè: OpenBMB · Lisans: Apache 2.0

Tcheke li

VibeVoiceVibeVoice Estansèl

Microsoft modèl pou fòm long multi-pale kontni tankou podcasts ak audiobooks.

Pwogramè: Microsoft · Lisans: MIT

Tcheke li

CosyVoice3CosyVoice3 Estansèl

TTS multi-lang jenerasyon kap vini an ak bi-streaming, kontwòl efè, ak klonaj vwa zero-shot.

Pwogramè: Alibaba (FunAudioLLM) · Lisans: Apache 2.0

Tcheke li

NAMAA Saudi TTSNAMAA Saudi TTS Estansèl

Premye TTS Arabi Saoudit louvri. Dialekt natif natal Arabi Saoudit ak klonaj vwa kalite Chatterbox.

Pwogramè: NAMAA Space · Lisans: MIT

Tcheke li

Darwin TTSDarwin TTS Estansèl

Qwen3-TTS varyasyon cross-modal ak FFN pwa melanje soti nan Qwen3-1.7B modèl lang pou klonaj multilenguage pi byen.

Pwogramè: FINAL-Bench · Lisans: Apache 2.0

Tcheke li

MOSS-TTSDMOSS-TTSD Estansèl

Modèl pou kontinye yon dyalòg ak anpil paleur — kreye konvèsasyon style podcast ak jiska 5 paleur ak 60 minit odyo koherent.

Pwogramè: OpenMOSS · Lisans: Apache 2.0

Tcheke li

ChatterboxChatterbox Premium

Pwogram sa a gen ladan tou yon sistèm klonaj vwa ak kontwòl emosyonèl ki rele Resemble AI.

Kalite:

Tcheke li

Tortoise TTSTortoise TTS Premium

Atik sa a se yon atik ki gen anpil valè ki gen rapò ak arkeoloji.

Kalite:

Tcheke li

StyleTTS 2StyleTTS 2 Premium

Edikasyon nan lang kreyòl se yon edikasyon ki baze sou divèsite ak konpreyansyon.

Kalite:

Tcheke li

OpenVoiceOpenVoice Premium

Instant klonaj vwa ak kontwòl granulaire sou style, emosyon, ak aksan.

Kalite:

Tcheke li

Sesame CSMSesame CSM Premium

Modèl pale konvèsatif ki kreye yon dyalòg natirèl ak tan ak emosyon ki apwopriye.

Kalite:

Tcheke li

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS ak natiralizasyon parite imen ak latency prèske zewo.

Lang: en, zh, ja, ko, fr, de, it, es

Klone Voy

IndexTTS-2IndexTTS-2

Zero-shot TTS ak kontwòl emosyon fine-grained ak ekspresyon segondè.

Lang: en, zh

Klone Voy

Spark TTSSpark TTS

Voye klonaj TTS ak emosyon kontwole ak style pale via pwompts.

Lang: en, zh

Klone Voy

GPT-SoVITSGPT-SoVITS

Few-shot klonaj vwa TTS ki replike nenpòt vwa soti nan jis 5 segonn nan son.

Lang: en, zh, ja, ko

Klone Voy

ChatterboxChatterbox

Pwogram sa a gen ladan tou yon sistèm klonaj vwa ak kontwòl emosyonèl ki rele Resemble AI.

Lang: en

Klone Voy

Tortoise TTSTortoise TTS

Atik sa a se yon atik ki gen anpil valè ki gen rapò ak arkeoloji.

Lang: en

Klone Voy

OpenVoiceOpenVoice

Instant klonaj vwa ak kontwòl granulaire sou style, emosyon, ak aksan.

Lang: en, zh, ja, ko, fr, es

Klone Voy

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

Lang: vi, en

Klone Voy

Chatterbox TurboChatterbox Turbo

Chatterbox pi vit ak sub-200ms latency ak tags paralinguistik pou ri, touse, ak plis ankò.

Lang: en

Klone Voy

VoxCPMVoxCPM

Tokenizer-gratis TTS ki pwodwi 44.1kHz odyo ak konstan paragraf kontexte-konsyan.

Lang: en, zh

Klone Voy

OuteTTSOuteTTS

LLM-ki baze sou TTS ki kouri sou CPU, GPU, oswa navigatè via llama.cpp ak Transformers.js.

Lang: en

Klone Voy

Pocket TTSPocket TTS

100M modèl paramèt limyè pa Kyutai ak klonaj vwa soti nan yon sèl echantiyon.

Lang: en, fr

Klone Voy

CosyVoice3CosyVoice3

TTS multi-lang jenerasyon kap vini an ak bi-streaming, kontwòl efè, ak klonaj vwa zero-shot.

Lang: en, zh, ja, ko, de, es, fr, it, ru

Klone Voy

NAMAA Saudi TTSNAMAA Saudi TTS

Premye TTS Arabi Saoudit louvri. Dialekt natif natal Arabi Saoudit ak klonaj vwa kalite Chatterbox.

Lang: ar

Klone Voy

Darwin TTSDarwin TTS

Qwen3-TTS varyasyon cross-modal ak FFN pwa melanje soti nan Qwen3-1.7B modèl lang pou klonaj multilenguage pi byen.

Lang: en, ko, ja, zh

Klone Voy

MOSS-TTSDMOSS-TTSD

Modèl pou kontinye yon dyalòg ak anpil paleur — kreye konvèsasyon style podcast ak jiska 5 paleur ak 60 minit odyo koherent.

Lang: en, zh

Klone Voy

Ming-Omni TTSMing-Omni TTS

Modèl pale omni-modal 0.5B ki konpaye soti nan inclusionAI ak yon pwodiksyon 44.1kHz ak klonaj vwa zero-shot.

Lang: en, zh

Klone Voy

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

Lang: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Klone Voy

Developer-First API

OpenAI-kompatib REST API. One endpoint, 22 + modèl. Streaming sipò pou aplikasyon an tan reyèl.

  • OpenAI-kompatib fòma
  • Streaming TTS pou aplikasyon an tan reyèl
  • Batch pwosesis pou gwo travay
  • Notifikasyon Webhook
View API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Pri senp, transparan

Kòmanse gratis. Skale kòm ou grandi.

Gratis

$0

15,000 karaktè + 5,000/jou

  • 7 modèl gratis ki gen ladan Kokoro
  • 5,000 karaktè pou chak jenerasyon
  • Akses API enkli
Enskri pou gratis

Starter

$9/mo

500 kredi / mwa

  • Tout 22+ modèl
  • 100,000 karaktè pou chak jenerasyon
  • Klonaj Vokal
Kòmanse
Pi popilè

Pro

$29/mo

2,000 kredi / mwa

  • Tout bagay nan Starter
  • Akses API
  • Pwosesis priorité
Jwenn Pro

Biznis

$99/mo

10,000 kredi / mwa

  • Tout bagay nan Pro
  • Bulk API
  • Priyorite
Jwenn biznis

Gade tout plan ki gen ladan pake kredi →

Kesyon ki poze souvan

TTS.ai se platfòm vwa AI ki pi konplè, ki ofri plis pase 22 modèl tèks-a-parole, klonaj vwa, pale-a-tèks, ak zouti odyo.Tout modèl yo se sous louvri ak pa gen okenn vandè lock-an.

Wi! TTS.ai ofri gratis tèks-a-parole ak Kokoro, Piper, VITS, ak MeloTTS modèl. Pa gen kont mande. Enskri pou jwenn 15,000 karaktè gratis ak aksè a tout modèl. Plan peye kòmanse nan $9 / mwa.

Pou vitès, sèvi ak Kokoro oswa Piper. Pou bon jan kalite, eseye CosyVoice 2 oswa StyleTTS 2. Pou klone vwa, sèvi ak Chatterbox oswa GPT-SoVITS. Pou dyalòg, itilize Dia TTS. Eseye plizyè modèl sou menm tèks la pou konpare.

Wi. OpenAI-kompatib REST API pou TTS, STT, klonaj vwa, ak zouti son. Inkluded sou chak plan ki gen ladan gratis, ak limit pousantaj ki skale pa nivo (gratis: 10 req / min, Lite: 20, Starter: 30, Pro: 60, Biznis: 300).

Kalite vwa a varye selon modèl la. Modèl Premium tankou CosyVoice 2, StyleTTS 2, ak Chatterbox pwodwi yon vwa ki gen bon jan kalite moun ak yon intonasyon ak efè natirèl. Modèl gratis tankou Kokoro ofri yon bon jan kalite ekselan pou pifò ka.

TTS.ai sipòte plis pase 30 lang atravè bibliyotèk modèl li a. Anglè gen sipò modèl ki pi laj, men modèl tankou CosyVoice 2 kouvri Chinwa, Japonè, ak Koreyen; GPT-SoVITS kontwole Chinwa, Japonè, Koreyen, ak Angle; ak MeloTTS sipòte Angle, Espayòl, franse, Chinwa, Japonè, ak Koreyen.

Yes. All processing happens on our dedicated GPU servers. We do not store your text input or generated audio after delivery. Uploaded voice samples for cloning are used only for the current session and are not retained. We never share your data with third parties or use it to train models.

Wi. Tout son ki pwodwi sou TTS.ai se ou pou w itilize pou rezon komèsyal, ki gen ladan pou videyo YouTube, podcasts, liv son, aplikasyon, piblisite, ak pwodwi. Modèl nou yo se sous louvri anba lisans permissive (MIT, Apache 2.0).

TTS.ai jenere son an nan fòma WAV pa default pou pi bon kalite. Ou ka konvèti li nan MP3, FLAC, OGG, oswa M4A lè l sèvi avèk zouti gratis Audio Converter nou an.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Modèles gratis (Kokoro, Piper, VITS, MeloTTS) ne nécessitent pas de compte et coûtent zéro crédits. Modèles standards (2 crédits/1K caractères) incluent Bark, CosyVoice 2, F5-TTS, et Dia. Modèles Premium (4 crédits/1K caractères) incluent OpenVoice, Chatterbox, StyleTTS 2, et Tortoise. Modèles payés généralement offrent une qualité supérieure, plus de voix, et des fonctionnalités supplémentaires comme clonage de voix.

Wi. API a sipòte pwosesis batch pou konvèti gwo kantite tèks nan pale. Soumèt plizyè demann ak rekipere rezilta async lè l sèvi avèk travay UUIDs. Plan biznis ($ 99 / mwa) ak pi wo a gen ladan accès wout priyorite pou pwosesis batch pi vit. Idèyal pou pwodiksyon liv son, kontni kou, ak gwo-echèl voiceover pwojè.
4.1/5 (42)

Ki sa nou ka amelyore? Feedback ou ede nou rezoud pwoblèm.

Kòmanse itilize AI Voice jodi a

Join kreyatè, devlopè, ak biznis ki itilize TTS.ai