Free AI Mətndən Söhbətə

33+ açıq mənbə modelləri, 273+ səslər, 33+ Hesab tələb olunmur.

18K+
yaradıcıları
73K+
nəsillər
33+
AI modelləri
273+
səslər
0/500 hərflər · 5000-ə qədər qeydiyyatdan keçin → Pulsuz
5,000 karakter 15,000 azad xarakter Kredit kartı yoxdur Ticari istifadə üçün OK
Qeydiyyatdan keç
Audio endirilsin Körpünün müddəti 24 saat ərzində başa çatır
TTS.ai-ni sevirsiniz? Dostlarınıza deyin!

Sesi AI üçün lazım olan hər şey

Açıq mənbəli AI modelləri ilə təchiz olunmuş 30+ alət

33+ AI səs modelləri

Bir platformada açıq mənbəli TTS modellərinin ən geniş kolleksiyası

KokoroKokoro Pulsuz

Kokoro 82 milyon parametrli mətndən-sözə modeldir və öz ağırlıq sinfindən çox üstündür. Kiçik ölçüsünə baxmayaraq, o, çox təbii və ifadəli bir səs istehsal edir. Kokoro ingilis, yapon, çin və koreyalı dilləri də daxil olmaqla bir çox dilləri dəstəkləyir və müxtəlif ifadəli səslər istehsal edir. O, inanılmaz sürətlə işləyir - GPU-da real vaxtda səsi 100x sürətlə istehsal edir.

Ən Yaxşı: Minimal gecikmə ilə yüksək keyfiyyətli TTS, axın tətbiqetmələri

Pulsuz Yoxla

PiperPiper Pulsuz

Piper Rhasspy tərəfindən inkişaf etdirilmiş VITS və larynx arxitekturalarını istifadə edən yüngül mətn-söhbətə motordur. CPU-da işləyir, bu da onu edge cihazları, ev avtomatlaşdırması və offlayn TTS tələb edən proqramlar üçün ideal edir. 30-dan çox dildə 100 səslə Piper Raspberry Pi 4-də belə real vaxt sürətində təbii səsli sözlər təqdim edir.

Ən Yaxşı: Tez önizləmələr, əlçatanlıq və daxili proqramlar

Pulsuz Yoxla

VITSVITS Pulsuz

VITS (variasiyalı nəticə ilə qarşılıqlı öyrənmə üçün son-son Text-to-Speech) hazırkı iki mərhələli modellərdən daha təbii səslənən səsi yaradan paralel son-son TTS metodudur. Normallaşdırma axınları ilə artırılmış variasiyalı nəticəni və qarşılıqlı öyrənmə prosesini qəbul edir, təbiiliyi əhəmiyyətli dərəcədə yaxşılaşdırır.

Ən Yaxşı: Təbii prozodiya ilə ümumi məqsədli mətn-söhbətə çevirici

Pulsuz Yoxla

MeloTTSMeloTTS Pulsuz

MyShell.ai tərəfindən yaradılan MeloTTS İngilis (Amerika, İngiltərə, Hindistan, Avstraliya), İspan, Fransız, Çin, Yapon və Koreya dillərini dəstəkləyən çoxdilli TTS kitabxanasıdır. Bu kitabxana çox sürətlidir, yalnız CPU-da mətni real vaxt sürəti ilə işləyir. MeloTTS istehsal üçün hazırlanmışdır və CPU və GPU-nun nəticələrini dəstəkləyir.

Ən Yaxşı: Çoxdilli və sürətli TTS tələb edən proqramlar

Pulsuz Yoxla

Kani TTS 2Kani TTS 2 Pulsuz

NineNineSix tərəfindən hazırlanmış Kani-TTS-2 NVIDIA NanoCodec ilə Liquid AI LFM2 backbone üzərində qurulan ultra-yüngül 400M parametrli modeldir. Bu model yalnız 3GB VRAM-da işləyir və A100 (RTF 0.2) üzərində ~2 saniyədə ~10 saniyəlik danışıq istehsal edir. Hazırkı ictimai buraxılış yalnız ingilis dilində `kani-tts-2-en` kontrol nöqtəsi ilə gəlir və səs klonlaşdırılması üçün lazım olan səsləndirici-içəriləmə hook-u ifşa etmir - klonlaşdırma üçün Chatterbox / IndexTTS2 / F5-TTS, ya da ingilis dilində olmayan Kokoro / MeloTTS istifadə edin.

Ən Yaxşı: Düşük VRAM qurğularında sürətli ingiliscə yaradılması, sürətli önizləmələr

Pulsuz Yoxla

OuteTTSOuteTTS Pulsuz

OuteTTS orijinal quruluşunu qoruyaraq mətn-söhbətə imkanları ilə böyük dil modellərini genişləndirir. llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM və hətta Transformers.js vasitəsilə brauzer inference daxil olmaqla bir çox arxa tərəfi dəstəkləyir. JSON olaraq qeyd edilmiş səsvermə profilləri vasitəsilə zero-shot səs klonlaşdırmasını dəstəkləyir.

Ən Yaxşı: Edge işə salma, brauzer əsaslı TTS, az resurs tələb edən mühitə

Pulsuz Yoxla

Pocket TTSPocket TTS Pulsuz

Kyutai tərəfindən (Moshi-nin yaradıcıları) hazırlanmış Pocket TTS, 100M parametrli kompakt mətn-söhbətə çevirmə modelidir. CPU-da səmərəli işləyir, tək səs nümunəsindən səs klonlaşdırmasını dəstəkləyir və təbii səsli söhbət yaradır. Kiçik model ölçüsü onu edge işə salınması və az resurslu mühitə ideal edir.

Ən Yaxşı: Yüngül işə salma, CPU-dan istifadə edən mühitə uyğun, sürətli səs klonlama

Pulsuz Yoxla

Kitten TTSKitten TTS Pulsuz

Kitten TTS by KittenML ONNX üzərində qurulan ultra-yüngül mətn-söhbətə çevirmə modelidir. 15M-dən 80M parametrə qədər variantları ilə (25-80 MB diskdə), CPU-da GPU tələb etmədən yüksək keyfiyyətli səs sintezini təmin edir. 8 daxili səs, düzəldilə bilən danışıq sürəti və rəqəmlər, pul vahidləri və vahidlər üçün daxili mətn əvvəldən işləməsi xüsusiyyətlərinə malikdir. Ən son işə salma və aşağı gecikmə tətbiqləri üçün idealdır.

Ən Yaxşı: Yüksək sürətli TTS, kənar işə salma, aşağı gecikmə tətbiqetmələri

Pulsuz Yoxla

Ming-Omni TTSMing-Omni TTS Pulsuz

Ming-omni-tts-0.5B inclusionAI tərəfindən hazırlanmış BailingMM sıx backbone üzərində qurulan Patch-by-Patch axın uyğun audio dekoderi olan kompakt omni-modal danışıq modelidir. 44.1kHz çıxış (CD keyfiyyətinə yaxın), 3+ saniyə istinaddan zero-shot səs klonlaşdırmasını dəstəkləyir və JSON əmrləri vasitəsilə daxili emosional / dialekt / BGM idarəsini ehtiva edir. Mükəmməl sabitlik — Çin benchmarklarında 0.83% WER.

Ən Yaxşı: İki dildə yüksək keyfiyyətli danışıq, emosional səs aktyorluğu, Çin audiokitab məzmunu

Pulsuz Yoxla

MOSS-TTS NanoMOSS-TTS Nano Pulsuz

MOSS-TTS-Nano-100M, MOSS-TTS ailəsinin OpenMOSS'un kompakt 100M-parametr variantıdır, gecikmə-transformator mimarisini paylaşır. 8B modelinin maksimum keyfiyyətini ~80x kiçik çəkilər və istək başına dramatik aşağı VRAM üçün dəyişir, onu free-tier və yüksək-keçidlilik işə salmaları üçün uyğun edir. Aynı 20-dilli hədəfə çatır.

Ən Yaxşı: Free-tier TTS, yüksək həcmli istehsal, aşağı gecikməli interaktiv istifadə

Pulsuz Yoxla

BarkBark Əsas

Realist danışıq, musiqi və səs effektləri yaradan transformator əsaslı mətn-audio modeli.

Yaradıcı: Suno · Lisenziya: MIT

Yoxla

Bark SmallBark Small Əsas

Bark-ın daha sürətli nəticələr və daha az yaddaş istifadəsi ilə daha yüngül versiyası.

Yaradıcı: Suno · Lisenziya: MIT

Yoxla

CosyVoice 2CosyVoice 2 Əsas

Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.

Yaradıcı: Alibaba (Tongyi Lab) · Lisenziya: Apache 2.0

Yoxla

Dia TTSDia TTS Əsas

Multi-speaker dialog generasiyası modeli, səsverənlər arasında təbii söhbətlər yaradır.

Yaradıcı: Nari Labs · Lisenziya: Apache 2.0

Yoxla

Parler TTSParler TTS Əsas

İstəydiyiniz səsi təbii dildə təsvir edin və Parler uyğun səsi yaradacaq.

Yaradıcı: Hugging Face · Lisenziya: Apache 2.0

Yoxla

IndexTTS-2IndexTTS-2 Əsas

Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.

Yaradıcı: Index Team · Lisenziya: Bilibili Model License

Yoxla

Spark TTSSpark TTS Əsas

Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.

Yaradıcı: SparkAudio · Lisenziya: CC BY-NC-SA 4.0

Yoxla

GPT-SoVITSGPT-SoVITS Əsas

Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.

Yaradıcı: RVC-Boss · Lisenziya: MIT

Yoxla

OrpheusOrpheus Əsas

İnsan səviyyəli emosional TTS modeli 100K saatlıq danışıq məlumatları üzərində hazırlanmışdır.

Yaradıcı: Canopy Labs · Lisenziya: Llama 3.2 Community

Yoxla

Qwen3 TTSQwen3 TTS Əsas

Alibaba'nın çoxdilli TTS-i əvvəlcədən təyin olunmuş səslərlə və mətndən səs dizaynı ilə.

Yaradıcı: Alibaba (Qwen) · Lisenziya: Apache 2.0

Yoxla

VieNeu-TTS-v2VieNeu-TTS-v2 Əsas

7 əvvəlcədən təyin olunmuş səs və zero-shot səs klonlaşdırması ilə vietnam + ingilis kod-əsaslı TTS. Yalnız CPU, GPU tələb olunmur.

Yaradıcı: Phạm Nguyễn Ngọc Bảo · Lisenziya: Apache 2.0

Yoxla

Chatterbox TurboChatterbox Turbo Əsas

Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.

Yaradıcı: Resemble AI · Lisenziya: MIT

Yoxla

VoxCPMVoxCPM Əsas

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

Yaradıcı: OpenBMB · Lisenziya: Apache 2.0

Yoxla

VibeVoiceVibeVoice Əsas

Podkastlar və audiokitablar kimi uzun formalı çox səsli məzmun üçün Microsoft modeli.

Yaradıcı: Microsoft · Lisenziya: MIT

Yoxla

CosyVoice3CosyVoice3 Əsas

Bi-streaming, emosional nəzarət və zero-shot səs klonlaşdırması ilə yeni nəsil çoxdilli TTS.

Yaradıcı: Alibaba (FunAudioLLM) · Lisenziya: Apache 2.0

Yoxla

NAMAA Saudi TTSNAMAA Saudi TTS Əsas

İlk açıq Səudiyyə-Ərəb TTS. Chatterbox-keyfiyyətli səs klonlaşdırması ilə yerli Səudiyyə dialekti.

Yaradıcı: NAMAA Space · Lisenziya: MIT

Yoxla

Darwin TTSDarwin TTS Əsas

Qwen3-1.7B dil modeli ilə qarışdırılmış FFN ağırlığı ilə cross-modal Qwen3-TTS variantı daha kəskin çoxdilli klonlaşdırma üçün.

Yaradıcı: FINAL-Bench · Lisenziya: Apache 2.0

Yoxla

MOSS-TTSDMOSS-TTSD Əsas

Multi-speaker dialog davam modeli — 5-ə qədər səsləndirici və 60 dəqiqəlik koherent audio ilə podcast-style söhbətləri yarada bilərsiniz.

Yaradıcı: OpenMOSS · Lisenziya: Apache 2.0

Yoxla

ChatterboxChatterbox Premium

Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.

Keyfiyyət :

Yoxla

Tortoise TTSTortoise TTS Premium

Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.

Keyfiyyət :

Yoxla

StyleTTS 2StyleTTS 2 Premium

İnsan səviyyəsində text-to-speech stil diffuziya və qarşıdurma təlim vasitəsilə.

Keyfiyyət :

Yoxla

OpenVoiceOpenVoice Premium

Stil, emosionallıq və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.

Keyfiyyət :

Yoxla

Sesame CSMSesame CSM Premium

Konversasiyalı danışıq modeli, uyğun vaxt və emosionallıqla təbii dialoq yaradan.

Keyfiyyət :

Yoxla

CosyVoice 2CosyVoice 2

Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.

Dillər: en, zh, ja, ko, fr, de, it, es

Sesi Dəyişdir

IndexTTS-2IndexTTS-2

Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.

Dillər: en, zh

Sesi Dəyişdir

Spark TTSSpark TTS

Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.

Dillər: en, zh

Sesi Dəyişdir

GPT-SoVITSGPT-SoVITS

Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.

Dillər: en, zh, ja, ko

Sesi Dəyişdir

ChatterboxChatterbox

Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.

Dillər: en

Sesi Dəyişdir

Tortoise TTSTortoise TTS

Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.

Dillər: en

Sesi Dəyişdir

OpenVoiceOpenVoice

Stil, emosionallıq və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.

Dillər: en, zh, ja, ko, fr, es

Sesi Dəyişdir

VieNeu-TTS-v2VieNeu-TTS-v2

7 əvvəlcədən təyin olunmuş səs və zero-shot səs klonlaşdırması ilə vietnam + ingilis kod-əsaslı TTS. Yalnız CPU, GPU tələb olunmur.

Dillər: vi, en

Sesi Dəyişdir

Chatterbox TurboChatterbox Turbo

Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.

Dillər: en

Sesi Dəyişdir

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

Dillər: en, zh

Sesi Dəyişdir

OuteTTSOuteTTS

LLM-ə əsaslanan TTS CPU, GPU, ya da llama.cpp və Transformers.js vasitəsilə brauzer üzərində işləyir.

Dillər: en

Sesi Dəyişdir

Pocket TTSPocket TTS

Kyutai tərəfindən tək nümunədən səs klonlaşdırması ilə yüngül 100M parametr modeli.

Dillər: en, fr

Sesi Dəyişdir

CosyVoice3CosyVoice3

Bi-streaming, emosional nəzarət və zero-shot səs klonlaşdırması ilə yeni nəsil çoxdilli TTS.

Dillər: en, zh, ja, ko, de, es, fr, it, ru

Sesi Dəyişdir

NAMAA Saudi TTSNAMAA Saudi TTS

İlk açıq Səudiyyə-Ərəb TTS. Chatterbox-keyfiyyətli səs klonlaşdırması ilə yerli Səudiyyə dialekti.

Dillər: ar

Sesi Dəyişdir

Darwin TTSDarwin TTS

Qwen3-1.7B dil modeli ilə qarışdırılmış FFN ağırlığı ilə cross-modal Qwen3-TTS variantı daha kəskin çoxdilli klonlaşdırma üçün.

Dillər: en, ko, ja, zh

Sesi Dəyişdir

MOSS-TTSDMOSS-TTSD

Multi-speaker dialog davam modeli — 5-ə qədər səsləndirici və 60 dəqiqəlik koherent audio ilə podcast-style söhbətləri yarada bilərsiniz.

Dillər: en, zh

Sesi Dəyişdir

Ming-Omni TTSMing-Omni TTS

InclusionAI-dən yüksək keyfiyyətli 44.1kHz çıxışı və sıfır-şot səs klonlaşdırması ilə kompakt 0.5B omni-modal danışıq modeli.

Dillər: en, zh

Sesi Dəyişdir

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variantı — eyni arxitektura, 80x kiçik, free-tier latency.

Dillər: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Sesi Dəyişdir

Yaradıcı-Əvvəlcə API

OpenAI-ya uyğun REST API. Bir son nöqtə, 22+ model. Rəsmi proqramlar üçün axın dəstəyi.

  • OpenAI-ya uyğun format
  • Rəsmi proqramlar üçün TTS axını
  • Böyük iş üçün dəstəli işləmə
  • Webhook bildirişləri
API sənədlərini göstər
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Sadə, Şəffaf Qiymətləndirmə

Pulsuz başlayın. Böyüdükcə ölçün.

Pulsuz

$0

15,000 karakter + 5,000/gün

  • Kokoro da daxil olmaqla 7 pulsuz model
  • 5,000 karakter
  • API girişi daxildir
Qeyd Ol

Başlat

$9/30 dəqiqə

500 kredit

  • Bütün 22+ model
  • 100,000 karakter
  • Səs Klonlama
Başla
Ən çox sevilən

Pro

$29/30 dəqiqə

2,000 kredit/ay

  • Başlanğıcda hər şey
  • API girişi
  • Əsas işləmə
Pro

İş

$99/30 dəqiqə

10,000 kredit/ay

  • Pro-da hər şey
  • Bulk API
  • Önəmli qrup
İşi Al

Bütün planları göstər →

Tez-tez Sorulan Sual

TTS.ai ən geniş AI səs platforması, 22+ mətn-söhbət modelləri, səs klonlaşdırması, mətn-söhbət və audio alətləri təklif edir. Bütün modellər satıcının bağlanması olmadan açıq mənbəlidir.

Bəli! TTS.ai Kokoro, Piper, VITS və MeloTTS modelləri ilə pulsuz mətn-söhbətə çevirmə təklif edir. Hesab tələb olunmur. 15,000 pulsuz xarakter və bütün modellərə çıxış üçün qeydiyyatdan keçin. Ödənişli planlar ayda $9-dan başlayır.

Sür'ət üçün Kokoro və ya Piper istifadə edin. Keyfiyyət üçün CosyVoice 2 və ya StyleTTS 2 istifadə edin. Sesi klonlaşdırmaq üçün Chatterbox və ya GPT-SoVITS istifadə edin. Dialoq üçün Dia TTS istifadə edin. Müqayisə etmək üçün eyni mətn üzərində bir neçə model istifadə edin.

Bəli. TTS, STT, səs klonlama və audio alətləri üçün OpenAI-a uyğun REST API. Pulsuz da daxil olmaqla hər planda, səviyyəyə görə ölçülən sürət məhdudiyyətləri ilə daxildir (pulsuz: 10 req/min, Lite: 20, Starter: 30, Pro: 60, Biznes: 300). sənədləri tts.ai/api/ saytında görmək olar.

Səs keyfiyyəti modeldən modelə dəyişir. CosyVoice 2, StyleTTS 2 və Chatterbox kimi premium modellər təbii intonasiya və emosionallıqla insana yaxın səs keyfiyyəti istehsal edir. Kokoro kimi pulsuz modellər çoxlu istifadə halları üçün mükəmməl keyfiyyət təklif edir.

TTS.ai modeli kitabxanasında 30-dan çox dil dəstəkləyir. İngilis dili ən geniş model dəstəkinə malikdir, lakin CosyVoice 2 kimi modellər Çin, Yapon və Koreya dillərini dəstəkləyir; GPT-SoVITS Çin, Yapon, Koreya və İngilis dillərini dəstəkləyir; və MeloTTS İngilis, İspan, Fransız, Çin, Yapon və Koreya dillərini dəstəkləyir.

Bəli. Bütün proseslər bizim xüsusi GPU vericilərimizdə baş verir. Biz sizin mətn daxilinizi və ya göndərildikdən sonra yaradılan səsi saxlamırıq. Klonlaşdırma üçün yüklənmiş səs nümunələri yalnız hazırkı iclas üçün istifadə olunur və saxlanmır. Biz heç vaxt məlumatlarınızı üçüncü tərəflərlə paylaşmırıq və ya modelləri öyrətmək üçün istifadə etmirik.

Bəli. TTS.ai-də yaradılan bütün səslər sizindir və YouTube videoları, podcastlar, audiokitablar, proqramlar, reklamlar və məhsullar daxil olmaqla kommersiya məqsədləri üçün istifadə edə bilərsiniz. Bizim modellərimiz açıq mənbəli və icazəli lisenziyalar altındadır (MIT, Apache 2.0). Heç bir royalti və ya etibar tələb olunmur.

TTS.ai ən yüksək keyfiyyət üçün ön qurğu olaraq WAV formatında səs yarada bilir. Bizim pulsuz Audio Konvertləşdirici aləti ilə MP3, FLAC, OGG və ya M4A formatlarına çevirə bilərsiniz. API istəkdə istədiyiniz çıxış formatını doğrudan göstərməyi dəstəkləyir.

Klonlamaq istədiyiniz səsin qısa audio nümunəsini yükləyin (5 saniyədən az olmamalıdır), sonra bu səsdə danışmaq üçün istənilən mətni daxil edin. Chatterbox, GPT-SoVITS və CosyVoice 2 kimi modellər səs klonlamasını dəstəkləyir. Klonlanmış səs tonu, aksenti və danışıq üslubunu ələ keçirir.

Pulsuz modellər (Kokoro, Piper, VITS, MeloTTS) hesab tələb etmir və sıfır karakter dəyərinə malikdir. Standart modellər (2,000 karakter/1K daxili) Bark, CosyVoice 2, F5-TTS və Dia daxildir. Premium modellər (4,000 karakter/1K daxili) OpenVoice, Chatterbox, StyleTTS 2 və Tortoise daxildir. Ödənişli modellər daha yüksək keyfiyyət, daha çox səs və səs klonlaşdırması kimi əlavə xüsusiyyətlər təklif edir.

Bəli. API böyük həcmli mətnləri səsə çevirmək üçün paketli işləməni dəstəkləyir. Bir çox tələbləri göndər və iş UUID-lərini istifadə edərək nəticələri asynchronously əldə et. Biznes planı ($99/mo) və daha yüksəklər daha sürətli paketli işləmə üçün prioritet sıraya çıxışı ehtiva edir. Audiokitab istehsalı, kurs məzmunu və böyük ölçülü səsli layihələr üçün idealdır.
4.1/5 (42)

Nəyi yaxşılaşdıra bilərik? Sizin rəyiniz problemləri düzəltməyə kömək edir.

Bu gün AI səsini istifadə etməyə başlayın

TTS.ai istifadə edərək yaradıcılara, inkişaf etdiricilərə və bizneslərə qoşulun