Free AI Metinden Söze

31+ açyk çeşme modyller, 231+ sesler 34+ diller. Hasap gerek däl.

8K+
döredijiler
32K+
nesil
31+
AI modelleri
231+
sesler
0/500 karakter · Sign up for 5,000 per generation → Boş
5000 karakter 15,000 boş karakter Kredi kart ýok Ticar ulanmak OK
Beýiklik
Ses ýükle Baglanyşyk 24 sagadyň içinde gutarýar
TTS.ai-ni söýýäňmi? Dostlaryňa aýt!

31+ Ses Mody

Bir platformada açyk çeşme TTS modelleriň iň giňişleýin toplamasy

KokoroKokoro Free

Kokoro 82 million parametrli metinden söze modeldir we öz agramy klasyndan has gowy işleýär. Kiçijik ululygyna garamazdan, ol örän nazik we beýanly sözi döredýär. Kokoro birnäçe dilleri goldaýar, şol sanda inglizçe, ýaponça, çinçe we koreýçe, dürli beýanly sesler bilen. Ol gaty tiz işleýär — GPU-da hakykat wagtyndan 100x tiz ses döredýär.

Saýlawlar Ýokary hilli TTS, az wagtlyk, ströming programmalar

Beýiklik

PiperPiper Free

Piper VITS we larynx binagärliklerden peýdalanýan Rhasspy tarapyndan işlenip çykarylan ýeňil metinden söze enjamdyr. Ol doly CPU üstünde işleýär, bu ony edge enjamlar, öý awtomatlaşdyrma we off-line TTS talap edýän programler üçin ideal edýär. 30+ dilden 100 ses bilen, Piper Raspberry Pi 4-de hem hakykat wagtyň tizliginde tebigy sesli sözi hödürleýär.

Saýlawlar Tiz öň görmeler, elýeterlilik we girizlenlen programler

Beýiklik

VITSVITS Free

VITS (Variasion Inference with adversarial learning for end-to-end Text-to-Speech) şu wagtky iki tapgyrly modellerden has has natural sounding audio döredýän bir TTS usuly. Ol normalizing flows bilen artdyrylan variasion inference we adversarial training prosesi kabul edip, naturalness-de bir uly gowylaşma gazanýar.

Saýlawlar Umumy maksatly metinde-söze dogry sözlem

Beýiklik

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai bir köp dilli TTS kitaphanasy bolup inglizçe (Amerikan, Britanik, Hindistan, Awstralýa), ispança, fransuzça, çinçe, japonça we koreýçe goldaýar. Ol gaty tiz, metini diňe CPU bilen hakykatdan ykjam tizlikte işleýär. MeloTTS öndürijilik ulanmak üçin işlenip taýýarlanyldy we hem CPU hem GPU inference goldaýar.

Saýlawlar Gysga, köp dilli TTS'e mätäç programmalar

Beýiklik

OuteTTSOuteTTS Free

OuteTTS metinde-söze ukyplary bilen uly dil modellerini giňeldýär we özbaşdak binagärligi saklaýar. Ol llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, we hatda Transformers.js arkaly brauzer inferences bilen birnäçe arkadaklar goldaýar. JSON ýaly gaýd edilen sözleýji profiller arkaly zero-shot ses klonlama aýratynlyklary bar.

Saýlawlar Edge ulanyş, brauzer esasly TTS, az-resursly töwerekler

Beýiklik

Pocket TTSPocket TTS Free

Kyutai (Moshi-niň döredijileri) tarapyndan Pocket TTS bir 100M parametrli metinde-söze modeldir. Ol CPU-da çalt işleýär, bir ses nusgasyndan zero-shot ses klonlamany goldaýar, we dogry sesli sözi döredýär. Kiçi model ululygy ony edge depleniş we az-resursly töwerekler üçin ideal edýär.

Saýlawlar Gysga ulanyş, diňe CPU-ly gurşawlar, tiz ses klonlama

Beýiklik

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Saýlawlar Fast lightweight TTS, edge deployment, low-latency applications

Beýiklik

BarkBark Standard

Transform-based text-to-audio model which generates realistic speech, music, and sound effects

Programçi: Suno · Lisenziýa: MIT

Syna

Bark SmallBark Small Standard

Bark'yň ýeňil wersiýasy çalt netije we az ýat ulanmak bilen.

Programçi: Suno · Lisenziýa: MIT

Syna

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Programçi: Alibaba (Tongyi Lab) · Lisenziýa: Apache 2.0

Syna

Dia TTSDia TTS Standard

Birnäçe sözleýjiler arasyna dogry gürleşige ýol açýan köp sözleýjiler dialogy emele getiriş modeli.

Programçi: Nari Labs · Lisenziýa: Apache 2.0

Syna

Parler TTSParler TTS Standard

Isleýän sesiňizi natiral dilde beýan ediň we Parler deňleşen sözi döreder.

Programçi: Hugging Face · Lisenziýa: Apache 2.0

Syna

GLM-TTSGLM-TTS Standard

Açyk çeşme TTS modelleri arasynda iň az karakter hata derejesini gazanýar.

Programçi: Zhipu AI · Lisenziýa: GLM-4 License

Syna

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.

Programçi: Index Team · Lisenziýa: Bilibili Model License

Syna

Spark TTSSpark TTS Standard

Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.

Programçi: SparkAudio · Lisenziýa: CC BY-NC-SA 4.0

Syna

GPT-SoVITSGPT-SoVITS Standard

5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS

Programçi: RVC-Boss · Lisenziýa: MIT

Syna

OrpheusOrpheus Standard

100K sagat söz maglumaty bilen taýýarlalan adam derejeli emosional TTS modeli.

Programçi: Canopy Labs · Lisenziýa: Llama 3.2 Community

Syna

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Programçi: Alibaba (Qwen) · Lisenziýa: Apache 2.0

Syna

Chatterbox TurboChatterbox Turbo Standard

200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.

Programçi: Resemble AI · Lisenziýa: MIT

Syna

Dia 2Dia 2 Standard

Birnäçe sözleýji dialog we paralingwistik çyzgylar bilen öwrümli-ilki söhbetdeşlik TTS

Programçi: Nari Labs · Lisenziýa: Apache 2.0

Syna

VoxCPMVoxCPM Standard

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

Programçi: OpenBMB · Lisenziýa: Apache 2.0

Syna

TADATADA Standard

Zero-hallucinasiýa TTS metin-akustiki ikinji düzme bilen, deňeşdirilen LLM TTS'den 5x çalt.

Programçi: Hume AI · Lisenziýa: MIT

Syna

VibeVoiceVibeVoice Standard

Podkastlar we audiokitaplar ýaly uzak şekilli köp sözleýji mazmun üçin Microsoft modeli.

Programçi: Microsoft · Lisenziýa: MIT

Syna

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Programçi: Alibaba (FunAudioLLM) · Lisenziýa: Apache 2.0

Syna

ChatterboxChatterbox Premium

Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama

_Hili:

Syna

Tortoise TTSTortoise TTS Premium

Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.

_Hili:

Syna

StyleTTS 2StyleTTS 2 Premium

Adam derejeli metin-söze öwrediş we garşydaş öwrediş arkaly.

_Hili:

Syna

OpenVoiceOpenVoice Premium

Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.

_Hili:

Syna

Sesame CSMSesame CSM Premium

Konwersasiýa söz model, dogry wagt we duýgu bilen dogry dialogy döredýär.

_Hili:

Syna

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

_Hili:

Syna

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

_Hili:

Syna

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Diller: en, zh, ja, ko, fr, de, it, es

Ses

GLM-TTSGLM-TTS

Açyk çeşme TTS modelleri arasynda iň az karakter hata derejesini gazanýar.

Diller: en, zh

Ses

IndexTTS-2IndexTTS-2

Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.

Diller: en, zh

Ses

Spark TTSSpark TTS

Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.

Diller: en, zh

Ses

GPT-SoVITSGPT-SoVITS

5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS

Diller: en, zh, ja, ko

Ses

ChatterboxChatterbox

Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama

Diller: en

Ses

Tortoise TTSTortoise TTS

Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.

Diller: en

Ses

OpenVoiceOpenVoice

Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.

Diller: en, zh, ja, ko, fr, de, es, it

Ses

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Diller: en, zh, ja, ko, de, fr, ru, pt, es, it

Ses

Chatterbox TurboChatterbox Turbo

200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.

Diller: en

Ses

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

Diller: en, zh

Ses

OuteTTSOuteTTS

LLM esasly TTS CPU, GPU, ýa-da lama.cpp we Transformers.js arkaly brauzer üstünde işleýär.

Diller: en

Ses

Pocket TTSPocket TTS

Kyutai tarapyndan ýekeje nusgadan ses klonlama bilen ýeňil 100M parametr modeli.

Diller: en, fr

Ses

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Diller: en, zh, ja, ko, de, es, fr, it, ru

Ses

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Diller: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Ses

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Diller: en, zh

Ses

Öňki Öwrediji

OpenAI-gabat gelýän REST API. Bir ahtar, 22+ model. Hakykat wagtynda programmalar üçin ströming goldawy.

  • OpenAI-gabat gelýän hili
  • real-time programler üçin TTS öwürmek
  • Beýik iş üçin bölekleýin işleme
  • Webhook habarlary
API Senedleri Görkez
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Basit, Açyk

Özgür başla. Ösýänçä ölçeýin.

Boş

$0

15 kredit

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakter çäk
  • 3 jan/sagat (hasap ýok)
Beýiklik

Başlançy

$9/ms

500 kredit/aýda

  • Ehli 22+ modyller
  • 100,000 karakter
  • Ses Klonlama
Başla
Ençeme meşhur

Pro

$29/ms

2,000,000 karakter/aýda

  • Başlançyda Her Şey
  • API elýeterliligi
  • Ön bellenen işleme
Pro

$99/ms

10,000,000 karakter/aýda

  • Pro-da Her Zat
  • Bulk API
  • Prioritet nobaty
Işleri Al

Ehli planlary we karkater paketlerini görkez →

Gynançly Soraglar

TTS.ai iň giňişleýin AI ses platformasy, 22+ metin-dan-söz modellerini, ses klonlamany, söz-dan-söz we ses esbaplaryny hödürleýär. Hepsi modeller aç çeşmedir we satyjydan-kyzgynsyz.

Eý! TTS.ai Kokoro, Piper, VITS, we MeloTTS modelleri bilen beýik metinde-söze elýeterliligi hödürleýär. Hasap gerek däl. 15,000 beýik karakteri almak we ähli modellere elýeterli bolmak üçin ýazyň. Ödenmeli planlar $9/aýda başlaýar.

Tizlik üçin Kokoro ýa-da Piper ullan. Hillilik üçin CosyVoice 2 ýa-da StyleTTS 2 ullan. Ses klonlamak üçin Chatterbox ýa-da GPT-SoVITS ullan. Dialog üçin Dia TTS ullan. Birden köp modelleri deňeşdirmek üçin şol bir metin üstünde ullan.

Eý. TTS, STT, ses klonlamak, we ses esbaplary üçin OpenAI-gabat gelýän REST API. Pro ($29/mo) we Enterprise ($99/mo) planlarda elýeterli. tts.ai/api/ adresinden resminamalary gör.

Sesiň hili modelden modele üýtgeýär. CosyVoice 2, StyleTTS 2, we Chatterbox ýaly premium modeller adama meňzeş sesiň hilini we dogry intonasiýany we emosiýany döredýär. Kokoro ýaly mugt modeller köplenç ulanyş ýagdaýlary üçin gowy sesiň hilini hödürleýär.

TTS.ai öz model kitaphanasy içinde 30+ dili goldaýar. Inglizçe iň giň model goldawyna eýedir, emma CosyVoice 2 ýaly modeller Çinçe, Japonça we Koreýçeni goldaýar; GPT-SoVITS Çinçe, Japonça, Koreýçeni we Inglizçeni goldaýar; we MeloTTS Inglizçe, Ispança, Fransuzça, Çinçe, Japonça we Koreýçeni goldaýar.

Eý. Bütün işleme biziň niýetlenen GPU serwerlerimizde bolup geçýär. Biz siziň metin girdişiňizi ýa-da iberilen sesiňizi saklaýarys. Klonlamak üçin ýüklenen ses nusgalary diňe şu wagtky sessiýa üçin ulanylýar we saklanmaýar. Biz hiç wagt siziň dataňyzy üçünji taraplar bilen paýlaşamyz ýa-da olary modelleri taýýarlamak üçin ulanýarys.

Eý. TTS.ai-de döreýän ähli sesler, YouTube wideolary, podkastlar, audiokitaplar, programmalar, reklamalar we önümleriň içinde, siziň söwdaly ulanmak üçindir. Biziň modellerimiz azat çeşme lisenziyalary astyndadyr (MIT, Apache 2.0). Hiç bir hak ýa-da atlandyrylma talap edilmeýär.

TTS.ai WAV formatda ses döretýär. Siz MP3, FLAC, OGG, ýa-da M4A'a özbaşdak Audio Konwerter asty bilen üýtgedip bilersiňiz. API islegde islendik çykdajy formatyny belli etmeki goldaýar.

Klonlamak isleýän sesiň gysga ses nusgasyny (5 sekuntdan az) ýükle, soňra bu sesde söz döretmek üçin islendik metin ýaz. Chatterbox, GPT-SoVITS, we CosyVoice 2 ýaly modeller ses klonlamany goldaýar. Klonlanan ses tonu, aksenti we sözleniş stilini alýar.

Beýiklik

Eý. API köp mukdarda metinleri söze öwürmek üçin batch işleýşini goldaýar. Birnäçe soragy iber we netijeleri iş UUIDs ulanyp asynchronously al. Enterprise planlary ($99/mo) has çalt batch işleýşini almak üçin priority queue accessy içer. Audiokitap öndürmek, kurs mazmuny, we uly ölçegli diktafon proýektleri üçin ideal.
4.0/5 (22)

Biz nämeni gowy edip bileris? Siziň pikiriňiz bize kynçylyklary düzetmäge kömek eder.

Bugün AI Ses ulanmak başla

TTS.ai ulanyp döredijilere, işleýjilere we işlere goşulyş