Free AI Metinden Söze
33+ açyk çeşme modyller, 273+ sesler 33+ diller. Hasap gerek däl.
Ses AI üçin isleýän her zadyňy
30+ esbap açyk çeşme AI modelleri bilen güýçlendirildi
33+ Ses Mody
Bir platformada açyk çeşme TTS modelleriň iň giňişleýin toplamasy
Kokoro Free
Kokoro 82 million parametrli metinden söze modeldir we öz agramy klasyndan has gowy işleýär. Kiçijik ululygyna garamazdan, ol örän nazik we beýanly sözi döredýär. Kokoro birnäçe dilleri goldaýar, şol sanda inglizçe, ýaponça, çinçe we koreýçe, dürli beýanly sesler bilen. Ol gaty tiz işleýär — GPU-da hakykat wagtyndan 100x tiz ses döredýär.
Saýlawlar Ýokary hilli TTS, az wagtlyk, ströming programmalar
Beýiklik
Piper Free
Piper VITS we larynx binagärliklerden peýdalanýan Rhasspy tarapyndan işlenip çykarylan ýeňil metinden söze enjamdyr. Ol doly CPU üstünde işleýär, bu ony edge enjamlar, öý awtomatlaşdyrma we off-line TTS talap edýän programler üçin ideal edýär. 30+ dilden 100 ses bilen, Piper Raspberry Pi 4-de hem hakykat wagtyň tizliginde tebigy sesli sözi hödürleýär.
Saýlawlar Tiz öň görmeler, elýeterlilik we girizlenlen programler
Beýiklik
VITS Free
VITS (Variasion Inference with adversarial learning for end-to-end Text-to-Speech) şu wagtky iki tapgyrly modellerden has has natural sounding audio döredýän bir TTS usuly. Ol normalizing flows bilen artdyrylan variasion inference we adversarial training prosesi kabul edip, naturalness-de bir uly gowylaşma gazanýar.
Saýlawlar Umumy maksatly metinde-söze dogry sözlem
Beýiklik
MeloTTS Free
MeloTTS by MyShell.ai bir köp dilli TTS kitaphanasy bolup inglizçe (Amerikan, Britanik, Hindistan, Awstralýa), ispança, fransuzça, çinçe, japonça we koreýçe goldaýar. Ol gaty tiz, metini diňe CPU bilen hakykatdan ykjam tizlikte işleýär. MeloTTS öndürijilik ulanmak üçin işlenip taýýarlanyldy we hem CPU hem GPU inference goldaýar.
Saýlawlar Gysga, köp dilli TTS'e mätäç programmalar
Beýiklik
Kani TTS 2 Free
Kani-TTS-2 by NineNineSix a NVIDIA NanoCodec bilen Liquid AI LFM2 backbone üstünde bina edilen bir ultra-agyr 400M parametr modelidir. Ol diňe 3GB VRAM bilen işleýär we A100 (RTF 0.2) üstünde ~10 sekuntda ~2 sekuntda sözi çykarýar. Häzirki halka çykan versiýa diňe inglizçe `kani-tts-2-en` barlag nokatyny getirýär we ses klonlamak üçin zerur bolan sözi äpişgesini açmaýar — klonlamak üçin Chatterbox / IndexTTS2 / F5-TTS ullan, ýa-da inglizçe däl üçin Kokoro / MeloTTS.
Saýlawlar Az VRAM sanawda tiz inglizçe emele getiriş, tiz öň görmeler
Beýiklik
OuteTTS Free
OuteTTS metinde-söze ukyplary bilen uly dil modellerini giňeldýär we özbaşdak binagärligi saklaýar. Ol llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, we hatda Transformers.js arkaly brauzer inferences bilen birnäçe arkadaklar goldaýar. JSON ýaly gaýd edilen sözleýji profiller arkaly zero-shot ses klonlama aýratynlyklary bar.
Saýlawlar Edge ulanyş, brauzer esasly TTS, az-resursly töwerekler
Beýiklik
Pocket TTS Free
Kyutai (Moshi-niň döredijileri) tarapyndan Pocket TTS bir 100M parametrli metinde-söze modeldir. Ol CPU-da çalt işleýär, bir ses nusgasyndan zero-shot ses klonlamany goldaýar, we dogry sesli sözi döredýär. Kiçi model ululygy ony edge depleniş we az-resursly töwerekler üçin ideal edýär.
Saýlawlar Gysga ulanyş, diňe CPU-ly gurşawlar, tiz ses klonlama
Beýiklik
Kitten TTS Free
Kitten TTS by KittenML bir ultra- ýeňil metinden söze modeldir ONNX üstünde bina edilen. 15M dan 80M parametrlere çenli (25-80 MB diskde), ol GPU gereksiz ýokary hilli ses sintezini CPUda hödürleýär. 8 içerki ses, düzedilip biljek söz tizligi, we içerki metin öň işleýşi sanlar, pullar, we birlikler üçin. Edge depleniş we az wagtlyk programmalar üçin ideal.
Saýlawlar Tiz we ýeňil TTS, edge depleme, az-latensyýa programler
Beýiklik
Ming-Omni TTS Free
InclusionAI tarapyndan Ming-omni-tts-0.5B BailingMM çuň backbone bilen Patch-by-Patch flow-matching audio decoder bilen gurlan bir kompakt omni-modal söz modelidir. 44.1kHz çykdajy (CD hiliň golaýynda), 3+ sekuntdan zero-shot ses klonlama goldaýar, we JSON görkezmeleri arkaly emotion / dialect / BGM kontroly içerýär.
Saýlawlar Iki dilde ýokary-dogrylykly gürrüň, emosional kontrol ses, Çinçe audiokitap mazmuny
Beýiklik
MOSS-TTS Nano Free
MOSS-TTS-Nano-100M MOSS-TTS maşgalanyň OpenMOSS's kompakt 100M-parametr varianty, delay-transformer binagärligini paýlaşýar. 8B modeliň iň ýokary hili ~80x kiçiräk agramlar üçin we soraga görä VRAM-yň dramatik pesligi üçin satýar, ony free-tier we ýokary geçirijilikli ulanmalar üçin laýyk edýär. Aynı 20-dil aralygy.
Saýlawlar Free-tier TTS, ýokary-volume öndürijilik, az-latency interaktiw ulanmak
Beýiklik
Bark _Öň bellenen
Transform-based text-to-audio model which generates realistic speech, music, and sound effects
Programçi: Suno · Lisenziýa: MIT
Syna
Bark Small _Öň bellenen
Bark'yň ýeňil wersiýasy çalt netije we az ýat ulanmak bilen.
Programçi: Suno · Lisenziýa: MIT
Syna
CosyVoice 2 _Öň bellenen
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Programçi: Alibaba (Tongyi Lab) · Lisenziýa: Apache 2.0
Syna
Dia TTS _Öň bellenen
Birnäçe sözleýjiler arasyna dogry gürleşige ýol açýan köp sözleýjiler dialogy emele getiriş modeli.
Programçi: Nari Labs · Lisenziýa: Apache 2.0
Syna
Parler TTS _Öň bellenen
Isleýän sesiňizi natiral dilde beýan ediň we Parler deňleşen sözi döreder.
Programçi: Hugging Face · Lisenziýa: Apache 2.0
Syna
IndexTTS-2 _Öň bellenen
Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.
Programçi: Index Team · Lisenziýa: Bilibili Model License
Syna
Spark TTS _Öň bellenen
Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.
Programçi: SparkAudio · Lisenziýa: CC BY-NC-SA 4.0
Syna
GPT-SoVITS _Öň bellenen
5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS
Programçi: RVC-Boss · Lisenziýa: MIT
Syna
Orpheus _Öň bellenen
100K sagat söz maglumaty bilen taýýarlalan adam derejeli emosional TTS modeli.
Programçi: Canopy Labs · Lisenziýa: Llama 3.2 Community
Syna
Qwen3 TTS _Öň bellenen
Alibaba's multilingual TTS with preset voices and voice design from text.
Programçi: Alibaba (Qwen) · Lisenziýa: Apache 2.0
Syna
VieNeu-TTS-v2 _Öň bellenen
Výetnamça + Inglizçe kod-swap TTS 7 öň bellenen sesler we zero-shot ses klonlama bilen. CPU-dan başga, GPU gerek däl.
Programçi: Phạm Nguyễn Ngọc Bảo · Lisenziýa: Apache 2.0
Syna
Chatterbox Turbo _Öň bellenen
200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.
Programçi: Resemble AI · Lisenziýa: MIT
Syna
VoxCPM _Öň bellenen
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency
Programçi: OpenBMB · Lisenziýa: Apache 2.0
Syna
VibeVoice _Öň bellenen
Podkastlar we audiokitaplar ýaly uzak şekilli köp sözleýji mazmun üçin Microsoft modeli.
Programçi: Microsoft · Lisenziýa: MIT
Syna
CosyVoice3 _Öň bellenen
Iki-sýurly, emosiýa kontrol, we zero-şot ses klonlama bilen ýene bir nesil köp dilli TTS
Programçi: Alibaba (FunAudioLLM) · Lisenziýa: Apache 2.0
Syna
NAMAA Saudi TTS _Öň bellenen
Ilki açyk Saud Arab TTS. Çatboş-hiç hili ses klonlama bilen Saud dialekti.
Programçi: NAMAA Space · Lisenziýa: MIT
Syna
Darwin TTS _Öň bellenen
Cross-modal Qwen3-TTS FFN wegtleri bilen Qwen3-1.7B dil modelinden birikdirildi has çuňňur köp dil klonlamak üçin.
Programçi: FINAL-Bench · Lisenziýa: Apache 2.0
Syna
MOSS-TTSD _Öň bellenen
Birnäçe sözleýji dialog dowam model — 5 sözleýji we 60 minutlyk birmeňzeş ses bilen podcast-style söhbetdeşlik dörediň.
Programçi: OpenMOSS · Lisenziýa: Apache 2.0
Syna
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Diller: en, zh, ja, ko, fr, de, it, es
Ses
IndexTTS-2
Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.
Diller: en, zh
Ses
Spark TTS
Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.
Diller: en, zh
Ses
GPT-SoVITS
5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS
Diller: en, zh, ja, ko
Ses
Chatterbox
Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama
Diller: en
Ses
Tortoise TTS
Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.
Diller: en
Ses
OpenVoice
Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.
Diller: en, zh, ja, ko, fr, es
Ses
VieNeu-TTS-v2
Výetnamça + Inglizçe kod-swap TTS 7 öň bellenen sesler we zero-shot ses klonlama bilen. CPU-dan başga, GPU gerek däl.
Diller: vi, en
Ses
Chatterbox Turbo
200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.
Diller: en
Ses
VoxCPM
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency
Diller: en, zh
Ses
OuteTTS
LLM esasly TTS CPU, GPU, ýa-da lama.cpp we Transformers.js arkaly brauzer üstünde işleýär.
Diller: en
Ses
Pocket TTS
Kyutai tarapyndan ýekeje nusgadan ses klonlama bilen ýeňil 100M parametr modeli.
Diller: en, fr
Ses
CosyVoice3
Iki-sýurly, emosiýa kontrol, we zero-şot ses klonlama bilen ýene bir nesil köp dilli TTS
Diller: en, zh, ja, ko, de, es, fr, it, ru
Ses
NAMAA Saudi TTS
Ilki açyk Saud Arab TTS. Çatboş-hiç hili ses klonlama bilen Saud dialekti.
Diller: ar
Ses
Darwin TTS
Cross-modal Qwen3-TTS FFN wegtleri bilen Qwen3-1.7B dil modelinden birikdirildi has çuňňur köp dil klonlamak üçin.
Diller: en, ko, ja, zh
Ses
MOSS-TTSD
Birnäçe sözleýji dialog dowam model — 5 sözleýji we 60 minutlyk birmeňzeş ses bilen podcast-style söhbetdeşlik dörediň.
Diller: en, zh
Ses
Ming-Omni TTS
InclusionAI-den 0.5B omni-modal söz model, ýokary-dogrylyk 44.1kHz çykdajy we zero-şot ses klonlama bilen.
Diller: en, zh
Ses
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — şol bir binagärlik, 80x kiçiräk, free-tier latency.
Diller: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
SesÖňki Öwrediji
OpenAI-gabat gelýän REST API. Bir ahtar, 22+ model. Hakykat wagtynda programmalar üçin ströming goldawy.
- OpenAI-gabat gelýän hili
- real-time programler üçin TTS öwürmek
- Beýik iş üçin bölekleýin işleme
- Webhook habarlary
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Gynançly Soraglar
Biz nämeni gowy edip bileris? Siziň pikiriňiz bize kynçylyklary düzetmäge kömek eder.