Free AI Metinden Söze

33+ açyk çeşme modyller, 273+ sesler 33+ diller. Hasap gerek däl.

18K+
döredijiler
71K+
nesil
33+
AI modelleri
273+
sesler
0/500 karakter · 5000 per generation üçin ýaz → Boş
5000 karakter 15,000 boş karakter Kredi kart ýok Ticar ulanmak OK
Beýiklik
Ses ýükle Baglanyşyk 24 sagadyň içinde gutarýar
TTS.ai-ni söýýäňmi? Dostlaryňa aýt!

33+ Ses Mody

Bir platformada açyk çeşme TTS modelleriň iň giňişleýin toplamasy

KokoroKokoro Free

Kokoro 82 million parametrli metinden söze modeldir we öz agramy klasyndan has gowy işleýär. Kiçijik ululygyna garamazdan, ol örän nazik we beýanly sözi döredýär. Kokoro birnäçe dilleri goldaýar, şol sanda inglizçe, ýaponça, çinçe we koreýçe, dürli beýanly sesler bilen. Ol gaty tiz işleýär — GPU-da hakykat wagtyndan 100x tiz ses döredýär.

Saýlawlar Ýokary hilli TTS, az wagtlyk, ströming programmalar

Beýiklik

PiperPiper Free

Piper VITS we larynx binagärliklerden peýdalanýan Rhasspy tarapyndan işlenip çykarylan ýeňil metinden söze enjamdyr. Ol doly CPU üstünde işleýär, bu ony edge enjamlar, öý awtomatlaşdyrma we off-line TTS talap edýän programler üçin ideal edýär. 30+ dilden 100 ses bilen, Piper Raspberry Pi 4-de hem hakykat wagtyň tizliginde tebigy sesli sözi hödürleýär.

Saýlawlar Tiz öň görmeler, elýeterlilik we girizlenlen programler

Beýiklik

VITSVITS Free

VITS (Variasion Inference with adversarial learning for end-to-end Text-to-Speech) şu wagtky iki tapgyrly modellerden has has natural sounding audio döredýän bir TTS usuly. Ol normalizing flows bilen artdyrylan variasion inference we adversarial training prosesi kabul edip, naturalness-de bir uly gowylaşma gazanýar.

Saýlawlar Umumy maksatly metinde-söze dogry sözlem

Beýiklik

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai bir köp dilli TTS kitaphanasy bolup inglizçe (Amerikan, Britanik, Hindistan, Awstralýa), ispança, fransuzça, çinçe, japonça we koreýçe goldaýar. Ol gaty tiz, metini diňe CPU bilen hakykatdan ykjam tizlikte işleýär. MeloTTS öndürijilik ulanmak üçin işlenip taýýarlanyldy we hem CPU hem GPU inference goldaýar.

Saýlawlar Gysga, köp dilli TTS'e mätäç programmalar

Beýiklik

Kani TTS 2Kani TTS 2 Free

Kani-TTS-2 by NineNineSix a NVIDIA NanoCodec bilen Liquid AI LFM2 backbone üstünde bina edilen bir ultra-agyr 400M parametr modelidir. Ol diňe 3GB VRAM bilen işleýär we A100 (RTF 0.2) üstünde ~10 sekuntda ~2 sekuntda sözi çykarýar. Häzirki halka çykan versiýa diňe inglizçe `kani-tts-2-en` barlag nokatyny getirýär we ses klonlamak üçin zerur bolan sözi äpişgesini açmaýar — klonlamak üçin Chatterbox / IndexTTS2 / F5-TTS ullan, ýa-da inglizçe däl üçin Kokoro / MeloTTS.

Saýlawlar Az VRAM sanawda tiz inglizçe emele getiriş, tiz öň görmeler

Beýiklik

OuteTTSOuteTTS Free

OuteTTS metinde-söze ukyplary bilen uly dil modellerini giňeldýär we özbaşdak binagärligi saklaýar. Ol llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, we hatda Transformers.js arkaly brauzer inferences bilen birnäçe arkadaklar goldaýar. JSON ýaly gaýd edilen sözleýji profiller arkaly zero-shot ses klonlama aýratynlyklary bar.

Saýlawlar Edge ulanyş, brauzer esasly TTS, az-resursly töwerekler

Beýiklik

Pocket TTSPocket TTS Free

Kyutai (Moshi-niň döredijileri) tarapyndan Pocket TTS bir 100M parametrli metinde-söze modeldir. Ol CPU-da çalt işleýär, bir ses nusgasyndan zero-shot ses klonlamany goldaýar, we dogry sesli sözi döredýär. Kiçi model ululygy ony edge depleniş we az-resursly töwerekler üçin ideal edýär.

Saýlawlar Gysga ulanyş, diňe CPU-ly gurşawlar, tiz ses klonlama

Beýiklik

Kitten TTSKitten TTS Free

Kitten TTS by KittenML bir ultra- ýeňil metinden söze modeldir ONNX üstünde bina edilen. 15M dan 80M parametrlere çenli (25-80 MB diskde), ol GPU gereksiz ýokary hilli ses sintezini CPUda hödürleýär. 8 içerki ses, düzedilip biljek söz tizligi, we içerki metin öň işleýşi sanlar, pullar, we birlikler üçin. Edge depleniş we az wagtlyk programmalar üçin ideal.

Saýlawlar Tiz we ýeňil TTS, edge depleme, az-latensyýa programler

Beýiklik

Ming-Omni TTSMing-Omni TTS Free

InclusionAI tarapyndan Ming-omni-tts-0.5B BailingMM çuň backbone bilen Patch-by-Patch flow-matching audio decoder bilen gurlan bir kompakt omni-modal söz modelidir. 44.1kHz çykdajy (CD hiliň golaýynda), 3+ sekuntdan zero-shot ses klonlama goldaýar, we JSON görkezmeleri arkaly emotion / dialect / BGM kontroly içerýär.

Saýlawlar Iki dilde ýokary-dogrylykly gürrüň, emosional kontrol ses, Çinçe audiokitap mazmuny

Beýiklik

MOSS-TTS NanoMOSS-TTS Nano Free

MOSS-TTS-Nano-100M MOSS-TTS maşgalanyň OpenMOSS's kompakt 100M-parametr varianty, delay-transformer binagärligini paýlaşýar. 8B modeliň iň ýokary hili ~80x kiçiräk agramlar üçin we soraga görä VRAM-yň dramatik pesligi üçin satýar, ony free-tier we ýokary geçirijilikli ulanmalar üçin laýyk edýär. Aynı 20-dil aralygy.

Saýlawlar Free-tier TTS, ýokary-volume öndürijilik, az-latency interaktiw ulanmak

Beýiklik

BarkBark _Öň bellenen

Transform-based text-to-audio model which generates realistic speech, music, and sound effects

Programçi: Suno · Lisenziýa: MIT

Syna

Bark SmallBark Small _Öň bellenen

Bark'yň ýeňil wersiýasy çalt netije we az ýat ulanmak bilen.

Programçi: Suno · Lisenziýa: MIT

Syna

CosyVoice 2CosyVoice 2 _Öň bellenen

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Programçi: Alibaba (Tongyi Lab) · Lisenziýa: Apache 2.0

Syna

Dia TTSDia TTS _Öň bellenen

Birnäçe sözleýjiler arasyna dogry gürleşige ýol açýan köp sözleýjiler dialogy emele getiriş modeli.

Programçi: Nari Labs · Lisenziýa: Apache 2.0

Syna

Parler TTSParler TTS _Öň bellenen

Isleýän sesiňizi natiral dilde beýan ediň we Parler deňleşen sözi döreder.

Programçi: Hugging Face · Lisenziýa: Apache 2.0

Syna

IndexTTS-2IndexTTS-2 _Öň bellenen

Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.

Programçi: Index Team · Lisenziýa: Bilibili Model License

Syna

Spark TTSSpark TTS _Öň bellenen

Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.

Programçi: SparkAudio · Lisenziýa: CC BY-NC-SA 4.0

Syna

GPT-SoVITSGPT-SoVITS _Öň bellenen

5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS

Programçi: RVC-Boss · Lisenziýa: MIT

Syna

OrpheusOrpheus _Öň bellenen

100K sagat söz maglumaty bilen taýýarlalan adam derejeli emosional TTS modeli.

Programçi: Canopy Labs · Lisenziýa: Llama 3.2 Community

Syna

Qwen3 TTSQwen3 TTS _Öň bellenen

Alibaba's multilingual TTS with preset voices and voice design from text.

Programçi: Alibaba (Qwen) · Lisenziýa: Apache 2.0

Syna

VieNeu-TTS-v2VieNeu-TTS-v2 _Öň bellenen

Výetnamça + Inglizçe kod-swap TTS 7 öň bellenen sesler we zero-shot ses klonlama bilen. CPU-dan başga, GPU gerek däl.

Programçi: Phạm Nguyễn Ngọc Bảo · Lisenziýa: Apache 2.0

Syna

Chatterbox TurboChatterbox Turbo _Öň bellenen

200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.

Programçi: Resemble AI · Lisenziýa: MIT

Syna

VoxCPMVoxCPM _Öň bellenen

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

Programçi: OpenBMB · Lisenziýa: Apache 2.0

Syna

VibeVoiceVibeVoice _Öň bellenen

Podkastlar we audiokitaplar ýaly uzak şekilli köp sözleýji mazmun üçin Microsoft modeli.

Programçi: Microsoft · Lisenziýa: MIT

Syna

CosyVoice3CosyVoice3 _Öň bellenen

Iki-sýurly, emosiýa kontrol, we zero-şot ses klonlama bilen ýene bir nesil köp dilli TTS

Programçi: Alibaba (FunAudioLLM) · Lisenziýa: Apache 2.0

Syna

NAMAA Saudi TTSNAMAA Saudi TTS _Öň bellenen

Ilki açyk Saud Arab TTS. Çatboş-hiç hili ses klonlama bilen Saud dialekti.

Programçi: NAMAA Space · Lisenziýa: MIT

Syna

Darwin TTSDarwin TTS _Öň bellenen

Cross-modal Qwen3-TTS FFN wegtleri bilen Qwen3-1.7B dil modelinden birikdirildi has çuňňur köp dil klonlamak üçin.

Programçi: FINAL-Bench · Lisenziýa: Apache 2.0

Syna

MOSS-TTSDMOSS-TTSD _Öň bellenen

Birnäçe sözleýji dialog dowam model — 5 sözleýji we 60 minutlyk birmeňzeş ses bilen podcast-style söhbetdeşlik dörediň.

Programçi: OpenMOSS · Lisenziýa: Apache 2.0

Syna

ChatterboxChatterbox Premium

Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama

Quality:

Syna

Tortoise TTSTortoise TTS Premium

Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.

Quality:

Syna

StyleTTS 2StyleTTS 2 Premium

Adam derejeli metin-söze öwrediş we garşydaş öwrediş arkaly.

Quality:

Syna

OpenVoiceOpenVoice Premium

Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.

Quality:

Syna

Sesame CSMSesame CSM Premium

Konwersasiýa söz model, dogry wagt we duýgu bilen dogry dialogy döredýär.

Quality:

Syna

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Diller: en, zh, ja, ko, fr, de, it, es

Ses

IndexTTS-2IndexTTS-2

Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.

Diller: en, zh

Ses

Spark TTSSpark TTS

Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.

Diller: en, zh

Ses

GPT-SoVITSGPT-SoVITS

5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS

Diller: en, zh, ja, ko

Ses

ChatterboxChatterbox

Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama

Diller: en

Ses

Tortoise TTSTortoise TTS

Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.

Diller: en

Ses

OpenVoiceOpenVoice

Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.

Diller: en, zh, ja, ko, fr, es

Ses

VieNeu-TTS-v2VieNeu-TTS-v2

Výetnamça + Inglizçe kod-swap TTS 7 öň bellenen sesler we zero-shot ses klonlama bilen. CPU-dan başga, GPU gerek däl.

Diller: vi, en

Ses

Chatterbox TurboChatterbox Turbo

200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.

Diller: en

Ses

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

Diller: en, zh

Ses

OuteTTSOuteTTS

LLM esasly TTS CPU, GPU, ýa-da lama.cpp we Transformers.js arkaly brauzer üstünde işleýär.

Diller: en

Ses

Pocket TTSPocket TTS

Kyutai tarapyndan ýekeje nusgadan ses klonlama bilen ýeňil 100M parametr modeli.

Diller: en, fr

Ses

CosyVoice3CosyVoice3

Iki-sýurly, emosiýa kontrol, we zero-şot ses klonlama bilen ýene bir nesil köp dilli TTS

Diller: en, zh, ja, ko, de, es, fr, it, ru

Ses

NAMAA Saudi TTSNAMAA Saudi TTS

Ilki açyk Saud Arab TTS. Çatboş-hiç hili ses klonlama bilen Saud dialekti.

Diller: ar

Ses

Darwin TTSDarwin TTS

Cross-modal Qwen3-TTS FFN wegtleri bilen Qwen3-1.7B dil modelinden birikdirildi has çuňňur köp dil klonlamak üçin.

Diller: en, ko, ja, zh

Ses

MOSS-TTSDMOSS-TTSD

Birnäçe sözleýji dialog dowam model — 5 sözleýji we 60 minutlyk birmeňzeş ses bilen podcast-style söhbetdeşlik dörediň.

Diller: en, zh

Ses

Ming-Omni TTSMing-Omni TTS

InclusionAI-den 0.5B omni-modal söz model, ýokary-dogrylyk 44.1kHz çykdajy we zero-şot ses klonlama bilen.

Diller: en, zh

Ses

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — şol bir binagärlik, 80x kiçiräk, free-tier latency.

Diller: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Ses

Öňki Öwrediji

OpenAI-gabat gelýän REST API. Bir ahtar, 22+ model. Hakykat wagtynda programmalar üçin ströming goldawy.

  • OpenAI-gabat gelýän hili
  • real-time programler üçin TTS öwürmek
  • Beýik iş üçin bölekleýin işleme
  • Webhook habarlary
API Senedleri Görkez
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Basit, Açyk

Özgür başla. Ösýänçä ölçeýin.

Boş

$0

15,000 karakter + 5,000/gün

  • Kokoro bilen 7 erbet mody
  • 5000 karakter
  • API erişmesi goşuldy
Beýiklik

Başlançy

$9/ms

500 kredit/aýda

  • Ehli 22+ modyller
  • 100,000 karakter
  • Ses Klonlama
Başla
Ençeme meşhur

Pro

$29/ms

2,000,000 karakter/aýda

  • Başlançyda Her Şey
  • API elýeterliligi
  • Ön bellenen işleme
Pro

$99/ms

10,000,000 karakter/aýda

  • Pro-da Her Zat
  • Bulk API
  • Prioritet nobaty
Işleri Al

Ehli planlary we karkater paketlerini görkez →

Gynançly Soraglar

TTS.ai iň giňişleýin AI ses platformasy, 22+ metin-dan-söz modellerini, ses klonlamany, söz-dan-söz we ses esbaplaryny hödürleýär. Hepsi modeller aç çeşmedir we satyjydan-kyzgynsyz.

Eý! TTS.ai Kokoro, Piper, VITS, we MeloTTS modelleri bilen beýik metinde-söze elýeterliligi hödürleýär. Hasap gerek däl. 15,000 beýik karakteri almak we ähli modellere elýeterli bolmak üçin ýazyň. Ödenmeli planlar $9/aýda başlaýar.

Tizlik üçin Kokoro ýa-da Piper ullan. Hillilik üçin CosyVoice 2 ýa-da StyleTTS 2 ullan. Ses klonlamak üçin Chatterbox ýa-da GPT-SoVITS ullan. Dialog üçin Dia TTS ullan. Birden köp modelleri deňeşdirmek üçin şol bir metin üstünde ullan.

Eý. TTS, STT, ses klonlamak, we ses esbaplary üçin OpenAI-hoşlaşýan REST API. Her planda, mugt hem-de mugt bolmadyk her planda, tizlik çäkleri dereje boýunça ölçeýän (Mugt: 10 req/min, Lite: 20, Başlangyç: 30, Pro: 60, İş: 300). Senedleri tts.ai/api/ adresinden gör.

Sesiň hili modelden modele üýtgeýär. CosyVoice 2, StyleTTS 2, we Chatterbox ýaly premium modeller adama meňzeş sesiň hilini we dogry intonasiýany we emosiýany döredýär. Kokoro ýaly mugt modeller köplenç ulanyş ýagdaýlary üçin gowy sesiň hilini hödürleýär.

TTS.ai öz model kitaphanasy içinde 30+ dili goldaýar. Inglizçe iň giň model goldawyna eýedir, emma CosyVoice 2 ýaly modeller Çinçe, Japonça we Koreýçeni goldaýar; GPT-SoVITS Çinçe, Japonça, Koreýçeni we Inglizçeni goldaýar; we MeloTTS Inglizçe, Ispança, Fransuzça, Çinçe, Japonça we Koreýçeni goldaýar.

Eý. Bütün işleme biziň niýetlenen GPU serwerlerimizde bolup geçýär. Biz siziň metin girdişiňizi ýa-da iberilen sesiňizi saklaýarys. Klonlamak üçin ýüklenen ses nusgalary diňe şu wagtky sessiýa üçin ulanylýar we saklanmaýar. Biz hiç wagt siziň dataňyzy üçünji taraplar bilen paýlaşamyz ýa-da olary modelleri taýýarlamak üçin ulanýarys.

Eý. TTS.ai-de döreýän ähli sesler, YouTube wideolary, podkastlar, audiokitaplar, programmalar, reklamalar we önümleriň içinde, siziň söwdaly ulanmak üçindir. Biziň modellerimiz azat çeşme lisenziyalary astyndadyr (MIT, Apache 2.0). Hiç bir hak ýa-da atlandyrylma talap edilmeýär.

TTS.ai WAV formatda ses döretýär. Siz MP3, FLAC, OGG, ýa-da M4A'a özbaşdak Audio Konwerter asty bilen üýtgedip bilersiňiz. API islegde islendik çykdajy formatyny belli etmeki goldaýar.

Klonlamak isleýän sesiň gysga ses nusgasyny (5 sekuntdan az) ýükle, soňra bu sesde söz döretmek üçin islendik metin ýaz. Chatterbox, GPT-SoVITS, we CosyVoice 2 ýaly modeller ses klonlamany goldaýar. Klonlanan ses tonu, aksenti we sözleniş stilini alýar.

Beýiklik

Eý. API köp mukdarda metinleri söze öwürmek üçin bölek işleme goldaýar. Birnäçe soragy iber we netijeleri iş UUIDs ulanyp asynchronously al. Biznes plan ($99/mo) we has ýokarylar çalt bölek işlemek üçin priority queue access içer. Audiokitap emeli, kurs mazmuny, we uly ölçegli sesli sözleýiş proýektleri üçin ideal.
4.1/5 (42)

Biz nämeni gowy edip bileris? Siziň pikiriňiz bize kynçylyklary düzetmäge kömek eder.

Bugün AI Ses ulanmak başla

TTS.ai ulanyp döredijilere, işleýjilere we işlere goşulyş