Free AI Mətndən Söhbətə

31+ açıq mənbə modelləri, 231+ səslər, 34+ Hesab tələb olunmur.

9K+
yaradıcıları
34K+
nəsillər
31+
AI modelləri
231+
səslər
0/500 hərflər · Sign up for 5,000 per generation → Pulsuz
5,000 karakter 15,000 azad xarakter Kredit kartı yoxdur Ticari istifadə üçün OK
Qeydiyyatdan keç
Audio endirilsin Körpünün müddəti 24 saat ərzində başa çatır
TTS.ai-ni sevirsiniz? Dostlarınıza deyin!

Sesi AI üçün lazım olan hər şey

Açıq mənbəli AI modelləri ilə təchiz olunmuş 30+ alət

31+ AI səs modelləri

Bir platformada açıq mənbəli TTS modellərinin ən geniş kolleksiyası

KokoroKokoro Pulsuz

Kokoro 82 milyon parametrli mətndən-sözə modeldir və öz ağırlıq sinfindən çox üstündür. Kiçik ölçüsünə baxmayaraq, o, çox təbii və ifadəli bir səs istehsal edir. Kokoro ingilis, yapon, çin və koreyalı dilləri də daxil olmaqla bir çox dilləri dəstəkləyir və müxtəlif ifadəli səslər istehsal edir. O, inanılmaz sürətlə işləyir - GPU-da real vaxtda səsi 100x sürətlə istehsal edir.

Ən Yaxşı: Minimal gecikmə ilə yüksək keyfiyyətli TTS, axın tətbiqetmələri

Pulsuz Yoxla

PiperPiper Pulsuz

Piper Rhasspy tərəfindən inkişaf etdirilmiş VITS və larynx arxitekturalarını istifadə edən yüngül mətn-söhbətə motordur. CPU-da işləyir, bu da onu edge cihazları, ev avtomatlaşdırması və offlayn TTS tələb edən proqramlar üçün ideal edir. 30-dan çox dildə 100 səslə Piper Raspberry Pi 4-də belə real vaxt sürətində təbii səsli sözlər təqdim edir.

Ən Yaxşı: Tez önizləmələr, əlçatanlıq və daxili proqramlar

Pulsuz Yoxla

VITSVITS Pulsuz

VITS (variasiyalı nəticə ilə qarşılıqlı öyrənmə üçün son-son Text-to-Speech) hazırkı iki mərhələli modellərdən daha təbii səslənən səsi yaradan paralel son-son TTS metodudur. Normallaşdırma axınları ilə artırılmış variasiyalı nəticəni və qarşılıqlı öyrənmə prosesini qəbul edir, təbiiliyi əhəmiyyətli dərəcədə yaxşılaşdırır.

Ən Yaxşı: Təbii prozodiya ilə ümumi məqsədli mətn-söhbətə çevirici

Pulsuz Yoxla

MeloTTSMeloTTS Pulsuz

MyShell.ai tərəfindən yaradılan MeloTTS İngilis (Amerika, İngiltərə, Hindistan, Avstraliya), İspan, Fransız, Çin, Yapon və Koreya dillərini dəstəkləyən çoxdilli TTS kitabxanasıdır. Bu kitabxana çox sürətlidir, yalnız CPU-da mətni real vaxt sürəti ilə işləyir. MeloTTS istehsal üçün hazırlanmışdır və CPU və GPU-nun nəticələrini dəstəkləyir.

Ən Yaxşı: Çoxdilli və sürətli TTS tələb edən proqramlar

Pulsuz Yoxla

OuteTTSOuteTTS Pulsuz

OuteTTS orijinal quruluşunu qoruyaraq mətn-söhbətə imkanları ilə böyük dil modellərini genişləndirir. llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM və hətta Transformers.js vasitəsilə brauzer inference daxil olmaqla bir çox arxa tərəfi dəstəkləyir. JSON olaraq qeyd edilmiş səsvermə profilləri vasitəsilə zero-shot səs klonlaşdırmasını dəstəkləyir.

Ən Yaxşı: Edge işə salma, brauzer əsaslı TTS, az resurs tələb edən mühitə

Pulsuz Yoxla

Pocket TTSPocket TTS Pulsuz

Kyutai tərəfindən (Moshi-nin yaradıcıları) hazırlanmış Pocket TTS, 100M parametrli kompakt mətn-söhbətə çevirmə modelidir. CPU-da səmərəli işləyir, tək səs nümunəsindən səs klonlaşdırmasını dəstəkləyir və təbii səsli söhbət yaradır. Kiçik model ölçüsü onu edge işə salınması və az resurslu mühitə ideal edir.

Ən Yaxşı: Yüngül işə salma, CPU-dan istifadə edən mühitə uyğun, sürətli səs klonlama

Pulsuz Yoxla

Kitten TTSKitten TTS Pulsuz

Kitten TTS by KittenML ONNX üzərində qurulan ultra-yüngül mətn-söhbətə çevirmə modelidir. 15M-dən 80M parametrə qədər variantları ilə (25-80 MB diskdə), CPU-da GPU tələb etmədən yüksək keyfiyyətli səs sintezini təmin edir. 8 daxili səs, düzəldilə bilən danışıq sürəti və rəqəmlər, pul vahidləri və vahidlər üçün daxili mətn əvvəldən işləməsi xüsusiyyətlərinə malikdir. Ən son işə salma və aşağı gecikmə tətbiqləri üçün idealdır.

Ən Yaxşı: Yüksək sürətli TTS, kənar işə salma, aşağı gecikmə tətbiqetmələri

Pulsuz Yoxla

BarkBark Əsas

Realist danışıq, musiqi və səs effektləri yaradan transformator əsaslı mətn-audio modeli.

Yaradıcı: Suno · Lisenziya: MIT

Yoxla

Bark SmallBark Small Əsas

Bark-ın daha sürətli nəticələr və daha az yaddaş istifadəsi ilə daha yüngül versiyası.

Yaradıcı: Suno · Lisenziya: MIT

Yoxla

CosyVoice 2CosyVoice 2 Əsas

Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.

Yaradıcı: Alibaba (Tongyi Lab) · Lisenziya: Apache 2.0

Yoxla

Dia TTSDia TTS Əsas

Multi-speaker dialog generasiyası modeli, səsverənlər arasında təbii söhbətlər yaradır.

Yaradıcı: Nari Labs · Lisenziya: Apache 2.0

Yoxla

Parler TTSParler TTS Əsas

İstəydiyiniz səsi təbii dildə təsvir edin və Parler uyğun səsi yaradacaq.

Yaradıcı: Hugging Face · Lisenziya: Apache 2.0

Yoxla

GLM-TTSGLM-TTS Əsas

Açıq mənbəli TTS modelləri arasında ən aşağı xarakter səhv dərəcəsini əldə edir.

Yaradıcı: Zhipu AI · Lisenziya: GLM-4 License

Yoxla

IndexTTS-2IndexTTS-2 Əsas

Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.

Yaradıcı: Index Team · Lisenziya: Bilibili Model License

Yoxla

Spark TTSSpark TTS Əsas

Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.

Yaradıcı: SparkAudio · Lisenziya: CC BY-NC-SA 4.0

Yoxla

GPT-SoVITSGPT-SoVITS Əsas

Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.

Yaradıcı: RVC-Boss · Lisenziya: MIT

Yoxla

OrpheusOrpheus Əsas

İnsan səviyyəli emosional TTS modeli 100K saatlıq danışıq məlumatları üzərində hazırlanmışdır.

Yaradıcı: Canopy Labs · Lisenziya: Llama 3.2 Community

Yoxla

Qwen3 TTSQwen3 TTS Əsas

Alibaba-nın çoxdilli TTS səs klonlaşdırması, əvvəlcədən seçilmiş səslər və mətndən səs dizaynı ilə.

Yaradıcı: Alibaba (Qwen) · Lisenziya: Apache 2.0

Yoxla

Chatterbox TurboChatterbox Turbo Əsas

Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.

Yaradıcı: Resemble AI · Lisenziya: MIT

Yoxla

Dia 2Dia 2 Əsas

Multi-speaking dialog və paralingvistik işarələrlə ilk konversasiya TTS.

Yaradıcı: Nari Labs · Lisenziya: Apache 2.0

Yoxla

VoxCPMVoxCPM Əsas

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

Yaradıcı: OpenBMB · Lisenziya: Apache 2.0

Yoxla

TADATADA Əsas

Zero-hallucinasiya TTS mətn-akustik ikiqat düzəlişlə, müqayisəli LLM TTS-dən 5x daha sürətlidir.

Yaradıcı: Hume AI · Lisenziya: MIT

Yoxla

VibeVoiceVibeVoice Əsas

Podkastlar və audiokitablar kimi uzun formalı çox səsli məzmun üçün Microsoft modeli.

Yaradıcı: Microsoft · Lisenziya: MIT

Yoxla

CosyVoice3CosyVoice3 Əsas

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Yaradıcı: Alibaba (FunAudioLLM) · Lisenziya: Apache 2.0

Yoxla

ChatterboxChatterbox Premium

Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.

Keyfiyyət :

Yoxla

Tortoise TTSTortoise TTS Premium

Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.

Keyfiyyət :

Yoxla

StyleTTS 2StyleTTS 2 Premium

İnsan səviyyəsində text-to-speech stil diffuziya və qarşıdurma təlim vasitəsilə.

Keyfiyyət :

Yoxla

OpenVoiceOpenVoice Premium

Stil, emosionallıq və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.

Keyfiyyət :

Yoxla

Sesame CSMSesame CSM Premium

Konversasiyalı danışıq modeli, uyğun vaxt və emosionallıqla təbii dialoq yaradan.

Keyfiyyət :

Yoxla

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Keyfiyyət :

Yoxla

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Keyfiyyət :

Yoxla

CosyVoice 2CosyVoice 2

Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.

Dillər: en, zh, ja, ko, fr, de, it, es

Sesi Dəyişdir

GLM-TTSGLM-TTS

Açıq mənbəli TTS modelləri arasında ən aşağı xarakter səhv dərəcəsini əldə edir.

Dillər: en, zh

Sesi Dəyişdir

IndexTTS-2IndexTTS-2

Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.

Dillər: en, zh

Sesi Dəyişdir

Spark TTSSpark TTS

Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.

Dillər: en, zh

Sesi Dəyişdir

GPT-SoVITSGPT-SoVITS

Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.

Dillər: en, zh, ja, ko

Sesi Dəyişdir

ChatterboxChatterbox

Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.

Dillər: en

Sesi Dəyişdir

Tortoise TTSTortoise TTS

Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.

Dillər: en

Sesi Dəyişdir

OpenVoiceOpenVoice

Stil, emosionallıq və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.

Dillər: en, zh, ja, ko, fr, de, es, it

Sesi Dəyişdir

Qwen3 TTSQwen3 TTS

Alibaba-nın çoxdilli TTS səs klonlaşdırması, əvvəlcədən seçilmiş səslər və mətndən səs dizaynı ilə.

Dillər: en, zh, ja, ko, de, fr, ru, pt, es, it

Sesi Dəyişdir

Chatterbox TurboChatterbox Turbo

Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.

Dillər: en

Sesi Dəyişdir

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

Dillər: en, zh

Sesi Dəyişdir

OuteTTSOuteTTS

LLM-ə əsaslanan TTS CPU, GPU, ya da llama.cpp və Transformers.js vasitəsilə brauzer üzərində işləyir.

Dillər: en

Sesi Dəyişdir

Pocket TTSPocket TTS

Kyutai tərəfindən tək nümunədən səs klonlaşdırması ilə yüngül 100M parametr modeli.

Dillər: en, fr

Sesi Dəyişdir

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Dillər: en, zh, ja, ko, de, es, fr, it, ru

Sesi Dəyişdir

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Dillər: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Sesi Dəyişdir

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Dillər: en, zh

Sesi Dəyişdir

Yaradıcı-Əvvəlcə API

OpenAI-ya uyğun REST API. Bir son nöqtə, 22+ model. Rəsmi proqramlar üçün axın dəstəyi.

  • OpenAI-ya uyğun format
  • Rəsmi proqramlar üçün TTS axını
  • Böyük iş üçün dəstəli işləmə
  • Webhook bildirişləri
API sənədlərini göstər
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Sadə, Şəffaf Qiymətləndirmə

Pulsuz başlayın. Böyüdükcə ölçün.

Pulsuz

$0

15 kredit

  • Kokoro, Piper, VITS, MeloTTS
  • 500 xarakter həddi
  • 3 gen/saat (heç bir hesab yoxdur)
Qeyd Ol

Başlat

$9/30 dəqiqə

500 kredit

  • Bütün 22+ model
  • 100,000 karakter
  • Səs Klonlama
Başla
Ən çox sevilən

Pro

$29/30 dəqiqə

2,000 kredit/ay

  • Başlanğıcda hər şey
  • API girişi
  • Əsas işləmə
Pro

İş

$99/30 dəqiqə

10,000 kredit/ay

  • Pro-da hər şey
  • Bulk API
  • Önəmli qrup
İşi Al

Bütün planları göstər →

Tez-tez Sorulan Sual

TTS.ai ən geniş AI səs platforması, 22+ mətn-söhbət modelləri, səs klonlaşdırması, mətn-söhbət və audio alətləri təklif edir. Bütün modellər satıcının bağlanması olmadan açıq mənbəlidir.

Bəli! TTS.ai Kokoro, Piper, VITS və MeloTTS modelləri ilə pulsuz mətn-söhbətə çevirmə təklif edir. Hesab tələb olunmur. 15,000 pulsuz xarakter və bütün modellərə çıxış üçün qeydiyyatdan keçin. Ödənişli planlar ayda $9-dan başlayır.

Sür'ət üçün Kokoro və ya Piper istifadə edin. Keyfiyyət üçün CosyVoice 2 və ya StyleTTS 2 istifadə edin. Sesi klonlaşdırmaq üçün Chatterbox və ya GPT-SoVITS istifadə edin. Dialoq üçün Dia TTS istifadə edin. Müqayisə etmək üçün eyni mətn üzərində bir neçə model istifadə edin.

Bəli. TTS, STT, səs klonlaşdırması və audio alətləri üçün OpenAI-a uyğun REST API. Pro ($29/mo) və Enterprise ($99/mo) planlarında mövcuddur. tts.ai/api/ saytında sənədləri gör.

Səs keyfiyyəti modeldən modelə dəyişir. CosyVoice 2, StyleTTS 2 və Chatterbox kimi premium modellər təbii intonasiya və emosionallıqla insana yaxın səs keyfiyyəti istehsal edir. Kokoro kimi pulsuz modellər çoxlu istifadə halları üçün mükəmməl keyfiyyət təklif edir.

TTS.ai modeli kitabxanasında 30-dan çox dil dəstəkləyir. İngilis dili ən geniş model dəstəkinə malikdir, lakin CosyVoice 2 kimi modellər Çin, Yapon və Koreya dillərini dəstəkləyir; GPT-SoVITS Çin, Yapon, Koreya və İngilis dillərini dəstəkləyir; və MeloTTS İngilis, İspan, Fransız, Çin, Yapon və Koreya dillərini dəstəkləyir.

Bəli. Bütün proseslər bizim xüsusi GPU vericilərimizdə baş verir. Biz sizin mətn daxilinizi və ya göndərildikdən sonra yaradılan səsi saxlamırıq. Klonlaşdırma üçün yüklənmiş səs nümunələri yalnız hazırkı iclas üçün istifadə olunur və saxlanmır. Biz heç vaxt məlumatlarınızı üçüncü tərəflərlə paylaşmırıq və ya modelləri öyrətmək üçün istifadə etmirik.

Bəli. TTS.ai-də yaradılan bütün səslər sizindir və YouTube videoları, podcastlar, audiokitablar, proqramlar, reklamlar və məhsullar daxil olmaqla kommersiya məqsədləri üçün istifadə edə bilərsiniz. Bizim modellərimiz açıq mənbəli və icazəli lisenziyalar altındadır (MIT, Apache 2.0). Heç bir royalti və ya etibar tələb olunmur.

TTS.ai ən yüksək keyfiyyət üçün ön qurğu olaraq WAV formatında səs yarada bilir. Bizim pulsuz Audio Konvertləşdirici aləti ilə MP3, FLAC, OGG və ya M4A formatlarına çevirə bilərsiniz. API istəkdə istədiyiniz çıxış formatını doğrudan göstərməyi dəstəkləyir.

Klonlamaq istədiyiniz səsin qısa audio nümunəsini yükləyin (5 saniyədən az olmamalıdır), sonra bu səsdə danışmaq üçün istənilən mətni daxil edin. Chatterbox, GPT-SoVITS və CosyVoice 2 kimi modellər səs klonlamasını dəstəkləyir. Klonlanmış səs tonu, aksenti və danışıq üslubunu ələ keçirir.

Pulsuz modellər (Kokoro, Piper, VITS, MeloTTS) hesab tələb etmir və sıfır karakter dəyərinə malikdir. Standart modellər (2,000 karakter/1K daxili) Bark, CosyVoice 2, F5-TTS və Dia daxildir. Premium modellər (4,000 karakter/1K daxili) OpenVoice, Chatterbox, StyleTTS 2 və Tortoise daxildir. Ödənişli modellər daha yüksək keyfiyyət, daha çox səs və səs klonlaşdırması kimi əlavə xüsusiyyətlər təklif edir.

Bəli. API böyük həcmli mətnləri danışığa çevirmək üçün batch işləməni dəstəkləyir. Birdən çox istək göndərin və iş UUID-lərini istifadə edərək nəticələri asynchronously əldə edin. Enterprise planları ($99/mo) daha sürətli batch işləmə üçün prioritet növbəyə çıxışı ehtiva edir. Audiobook istehsalı, kurs məzmunu və böyük ölçülü voiceover layihələri üçün idealdır.
4.0/5 (22)

Nəyi yaxşılaşdıra bilərik? Sizin rəyiniz problemləri düzəltməyə kömək edir.

Bu gün AI səsini istifadə etməyə başlayın

TTS.ai istifadə edərək yaradıcılara, inkişaf etdiricilərə və bizneslərə qoşulun