Free AI Metinden Söze
31+ açyk çeşme modyller, 231+ sesler 34+ diller. Hasap gerek däl.
Ses AI üçin isleýän her zadyňy
30+ esbap açyk çeşme AI modelleri bilen güýçlendirildi
31+ Ses Mody
Bir platformada açyk çeşme TTS modelleriň iň giňişleýin toplamasy
Kokoro Free
Kokoro 82 million parametrli metinden söze modeldir we öz agramy klasyndan has gowy işleýär. Kiçijik ululygyna garamazdan, ol örän nazik we beýanly sözi döredýär. Kokoro birnäçe dilleri goldaýar, şol sanda inglizçe, ýaponça, çinçe we koreýçe, dürli beýanly sesler bilen. Ol gaty tiz işleýär — GPU-da hakykat wagtyndan 100x tiz ses döredýär.
Saýlawlar Ýokary hilli TTS, az wagtlyk, ströming programmalar
Beýiklik
Piper Free
Piper VITS we larynx binagärliklerden peýdalanýan Rhasspy tarapyndan işlenip çykarylan ýeňil metinden söze enjamdyr. Ol doly CPU üstünde işleýär, bu ony edge enjamlar, öý awtomatlaşdyrma we off-line TTS talap edýän programler üçin ideal edýär. 30+ dilden 100 ses bilen, Piper Raspberry Pi 4-de hem hakykat wagtyň tizliginde tebigy sesli sözi hödürleýär.
Saýlawlar Tiz öň görmeler, elýeterlilik we girizlenlen programler
Beýiklik
VITS Free
VITS (Variasion Inference with adversarial learning for end-to-end Text-to-Speech) şu wagtky iki tapgyrly modellerden has has natural sounding audio döredýän bir TTS usuly. Ol normalizing flows bilen artdyrylan variasion inference we adversarial training prosesi kabul edip, naturalness-de bir uly gowylaşma gazanýar.
Saýlawlar Umumy maksatly metinde-söze dogry sözlem
Beýiklik
MeloTTS Free
MeloTTS by MyShell.ai bir köp dilli TTS kitaphanasy bolup inglizçe (Amerikan, Britanik, Hindistan, Awstralýa), ispança, fransuzça, çinçe, japonça we koreýçe goldaýar. Ol gaty tiz, metini diňe CPU bilen hakykatdan ykjam tizlikte işleýär. MeloTTS öndürijilik ulanmak üçin işlenip taýýarlanyldy we hem CPU hem GPU inference goldaýar.
Saýlawlar Gysga, köp dilli TTS'e mätäç programmalar
Beýiklik
OuteTTS Free
OuteTTS metinde-söze ukyplary bilen uly dil modellerini giňeldýär we özbaşdak binagärligi saklaýar. Ol llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, we hatda Transformers.js arkaly brauzer inferences bilen birnäçe arkadaklar goldaýar. JSON ýaly gaýd edilen sözleýji profiller arkaly zero-shot ses klonlama aýratynlyklary bar.
Saýlawlar Edge ulanyş, brauzer esasly TTS, az-resursly töwerekler
Beýiklik
Pocket TTS Free
Kyutai (Moshi-niň döredijileri) tarapyndan Pocket TTS bir 100M parametrli metinde-söze modeldir. Ol CPU-da çalt işleýär, bir ses nusgasyndan zero-shot ses klonlamany goldaýar, we dogry sesli sözi döredýär. Kiçi model ululygy ony edge depleniş we az-resursly töwerekler üçin ideal edýär.
Saýlawlar Gysga ulanyş, diňe CPU-ly gurşawlar, tiz ses klonlama
Beýiklik
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Saýlawlar Fast lightweight TTS, edge deployment, low-latency applications
Beýiklik
Bark Standard
Transform-based text-to-audio model which generates realistic speech, music, and sound effects
Programçi: Suno · Lisenziýa: MIT
Syna
Bark Small Standard
Bark'yň ýeňil wersiýasy çalt netije we az ýat ulanmak bilen.
Programçi: Suno · Lisenziýa: MIT
Syna
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Programçi: Alibaba (Tongyi Lab) · Lisenziýa: Apache 2.0
Syna
Dia TTS Standard
Birnäçe sözleýjiler arasyna dogry gürleşige ýol açýan köp sözleýjiler dialogy emele getiriş modeli.
Programçi: Nari Labs · Lisenziýa: Apache 2.0
Syna
Parler TTS Standard
Isleýän sesiňizi natiral dilde beýan ediň we Parler deňleşen sözi döreder.
Programçi: Hugging Face · Lisenziýa: Apache 2.0
Syna
GLM-TTS Standard
Açyk çeşme TTS modelleri arasynda iň az karakter hata derejesini gazanýar.
Programçi: Zhipu AI · Lisenziýa: GLM-4 License
Syna
IndexTTS-2 Standard
Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.
Programçi: Index Team · Lisenziýa: Bilibili Model License
Syna
Spark TTS Standard
Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.
Programçi: SparkAudio · Lisenziýa: CC BY-NC-SA 4.0
Syna
GPT-SoVITS Standard
5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS
Programçi: RVC-Boss · Lisenziýa: MIT
Syna
Orpheus Standard
100K sagat söz maglumaty bilen taýýarlalan adam derejeli emosional TTS modeli.
Programçi: Canopy Labs · Lisenziýa: Llama 3.2 Community
Syna
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Programçi: Alibaba (Qwen) · Lisenziýa: Apache 2.0
Syna
Chatterbox Turbo Standard
200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.
Programçi: Resemble AI · Lisenziýa: MIT
Syna
Dia 2 Standard
Birnäçe sözleýji dialog we paralingwistik çyzgylar bilen öwrümli-ilki söhbetdeşlik TTS
Programçi: Nari Labs · Lisenziýa: Apache 2.0
Syna
VoxCPM Standard
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency
Programçi: OpenBMB · Lisenziýa: Apache 2.0
Syna
TADA Standard
Zero-hallucinasiýa TTS metin-akustiki ikinji düzme bilen, deňeşdirilen LLM TTS'den 5x çalt.
Programçi: Hume AI · Lisenziýa: MIT
Syna
VibeVoice Standard
Podkastlar we audiokitaplar ýaly uzak şekilli köp sözleýji mazmun üçin Microsoft modeli.
Programçi: Microsoft · Lisenziýa: MIT
Syna
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Programçi: Alibaba (FunAudioLLM) · Lisenziýa: Apache 2.0
Syna
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Diller: en, zh, ja, ko, fr, de, it, es
Ses
GLM-TTS
Açyk çeşme TTS modelleri arasynda iň az karakter hata derejesini gazanýar.
Diller: en, zh
Ses
IndexTTS-2
Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.
Diller: en, zh
Ses
Spark TTS
Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.
Diller: en, zh
Ses
GPT-SoVITS
5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS
Diller: en, zh, ja, ko
Ses
Chatterbox
Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama
Diller: en
Ses
Tortoise TTS
Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.
Diller: en
Ses
OpenVoice
Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.
Diller: en, zh, ja, ko, fr, de, es, it
Ses
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Diller: en, zh, ja, ko, de, fr, ru, pt, es, it
Ses
Chatterbox Turbo
200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.
Diller: en
Ses
VoxCPM
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency
Diller: en, zh
Ses
OuteTTS
LLM esasly TTS CPU, GPU, ýa-da lama.cpp we Transformers.js arkaly brauzer üstünde işleýär.
Diller: en
Ses
Pocket TTS
Kyutai tarapyndan ýekeje nusgadan ses klonlama bilen ýeňil 100M parametr modeli.
Diller: en, fr
Ses
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Diller: en, zh, ja, ko, de, es, fr, it, ru
Ses
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Diller: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Ses
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Diller: en, zh
SesÖňki Öwrediji
OpenAI-gabat gelýän REST API. Bir ahtar, 22+ model. Hakykat wagtynda programmalar üçin ströming goldawy.
- OpenAI-gabat gelýän hili
- real-time programler üçin TTS öwürmek
- Beýik iş üçin bölekleýin işleme
- Webhook habarlary
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Basit, Açyk
Özgür başla. Ösýänçä ölçeýin.
Pro
2,000,000 karakter/aýda
- Başlançyda Her Şey
- API elýeterliligi
- Ön bellenen işleme
Gynançly Soraglar
Biz nämeni gowy edip bileris? Siziň pikiriňiz bize kynçylyklary düzetmäge kömek eder.