Free AI Test għal Diskors

Parametri ta’ 82M Ultra veloċi Ilħna espressivi Multilingwi Appoġġ għall-istrimjar

Mudell tal-parametru ħafif 82M li jagħti diskors ta ’kwalità tal-istudjo b’inferenza blazing-fast.

Stabbli · 1.5GB VRAM Ipprovaha

Piper

CPU faċli Kapaċi offline 100 + vuċijiet 35 + lingwi Appoġġ SSML

A malajr, test neural lokali biex sistema diskors ottimizzata għall Raspberry Pi u apparat inkorporat.

Stabbli · 0 (CPU only) VRAM Ipprovaha

VITS

Sinteżi minn tarf sa tarf Prożodi naturali Inferenza mgħaġġla Kelliema multipli

Autoencoder varjazzjonali kondizzjonali b'tagħlim kontradittorju għal test-to-speech minn tarf sa tarf.

Stabbli · 1GB VRAM Ipprovaha

MeloTTS

Ottimizzat għall-CPU Multilingwi Akcenti multipli Lest għall-produzzjoni Latenza baxxa

Kwalità għolja multilingwi test-to-diskors li taħdem fuq CPU bil-latenza minima.

Stabbli · 0.5GB (GPU optional) VRAM Ipprovaha

Bark

Effetti tal-ħoss Daħk/tgħawwiġ Ġenerazzjoni tal-mużika 100+ kelliem Multilingwi

Mudell tat-test għall-awdjo bbażat fuq trasformatur li jiġġenera diskors realistiku, mużika u effetti tal-ħoss.

bil-mod · 5GB VRAM Ipprovaha

Bark Small

Piż ħafif Aktar malajr minn qoxra sħiħa Diskors emozzjonali Multilingwi

Verżjoni eħfef tal-Qoxra b'inferenza aktar mgħaġġla u użu tal-memorja aktar baxxa.

Medju · 2GB VRAM Ipprovaha

CosyVoice 2

Streaming Klonazzjoni zero-shot Cross-lingual Kontroll tal-emozzjonijiet Parità umana

TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.

Dia TTS

Kelliema multipli Ġenerazzjoni tad-djalogu It-teħid ta’ dawriet naturali Espressjoni emozzjonali Parametri 1.6B

Mudell ta' ġenerazzjoni ta' djalogu b'ħafna kelliema li joħloq konversazzjonijiet naturali bejn kelliema.

Parler TTS

Deskrizzjoni tal-vuċi Kontroll tal-lingwa naturali Flessibbli vuċi ħolqien Ebda vuċijiet preset meħtieġa

Tiddeskrivi l-vuċi li tixtieq fil-lingwa naturali u Parler jiġġenera diskors li jaqblu.

Indic Parler TTS

11 Lingwi Indjani Deskrizzjoni tal-vuċi Kontroll tal-lingwa naturali Pronunciazzjoni Awtentika Indjana

Diskussjoni ta ’kwalità għolja għal 8+ lingwi Indjani b’kontroll tal-vuċi b’lingwa naturali.

bil-mod · 8GB VRAM Ipprovaha

KhanomTan TTS

Tajlandiż TTS Kelliema multipli Arkitettura ta’ YourTTS Liċenzja kummerċjali sikura

Tajlandiż-ewwel test-to-diskors b'għażla ta' vuċijiet kelliema.

Stabbli · 2GB VRAM Ipprovaha

IndexTTS-2

Kontroll tal-emozzjonijiet Zero-shot Vetturi ta’ emozzjoni Diskors espressiv Kontroll ta’ ħbub fini

Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.

Spark TTS

Klonazzjoni tal-vuċi Kontroll tal-emozzjonijiet Kontroll tal-istil Ibbażat fuq il-prompt 5-sekonda klonazzjoni

TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.

GPT-SoVITS

5-sekonda klonazzjoni Il-vuċi tal-kanzunetta Tagħlim bi ftit sparar Fedeltà għolja Cross-lingual

Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.

bil-mod · 6GB VRAM Ipprovaha

Orpheus

Emozzjoni fil-livell uman 100K sigħat taħriġ Enfasi naturali Diskors espressiv

Mudell emozzjonali TTS fil-livell tal-bniedem imħarreġ fuq 100K sigħat ta' dejta tad-diskors.

Chatterbox

Klonazzjoni b’żero skud Kontroll tal-emozzjonijiet Fedeltà għolja Trasferiment tal-istil Klonazzjoni ta’ kampjun wieħed

Stat-tal-aħħar żero-shot kklonjar vuċi mal-kontroll emozzjoni minn Resemble AI.

Tortoise TTS

L-ogħla kwalità Multi-vuċi Arkitettura DALL-E Klonazzjoni tal-vuċi Awtorigressiva

Test-to-speech b'ħafna vuċijiet iffokat fuq il-kwalità b'arkitettura autoregressiva.

bil-mod · 8GB VRAM Ipprovaha

StyleTTS 2

Livell uman Diffużjoni tal-istil Taħriġ kontradittorju Varjazzjoni naturali Fedeltà għolja

Test-to-speech fil-livell tal-bniedem permezz ta’ diffużjoni tal-istil u taħriġ kontradittorju.

OpenVoice

Klonazzjoni immedjata Konverżjoni tal-vuċi Kontroll tal-emozzjonijiet Kontroll tal-aċċent Multilingwi

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u aċċent.

Qwen3 TTS

9 vuċijiet predefiniti Disinn tal-vuċi minn test Kontroll tal-emozzjonijiet 10 lingwi

TTS multilingwi ta ’Alibaba b’vuċijiet issettjati minn qabel u disinn tal-vuċi mit-test.

Medju · 7GB VRAM Ipprovaha

VieNeu-TTS-v2

7 vuċijiet predefiniti (aċċenti tat-Tramuntana + tan-Nofsinhar) En-Vi code-switching Klonazzjoni tal-vuċi (referenza 3-5s) Appoġġ għall-podcast / multi-speaker CPU biss - l-ebda GPU meħtieġa

Vjetnamiż + Ingliż kodiċi-swiċċjar TTS b'7 vuċijiet preset u klonazzjoni vuċi żero-shot. CPU biss, l-ebda GPU meħtieġa.

Stabbli · CPU VRAM Ipprovaha

Sesame CSM

Konversazzjoni Żmien naturali It-teħid tar-rotazzjoni Kanal ta’ wara Parametri 1B

Mudell ta’ diskors konversazzjonali li jiġġenera djalogu naturali biż-żmien u l-emozzjoni xierqa.

bil-mod · 8GB VRAM Ipprovaha

Chatterbox Turbo

Latenza ta ’Sub-200ms It-tikketti paralingwistiċi 6x fil-ħin reali Klonazzjoni tal-vuċi Watermarking

Chatterbox aktar mgħaġġel b'latenza sub-200ms u tags paralinguistic għal daħk, sogħla, u aktar.

Stabbli · 2GB VRAM Ipprovaha

VoxCPM

Awdjo 44.1kHz Mingħajr tokenizer Klonazzjoni translingwistika Konxju tal-kuntest Issettjar fin tal-LoRA

TTS mingħajr tokenizer li jipproduċi awdjo 44.1kHz b'konsistenza tal-paragrafu konxja mill-kuntest.

Stabbli · 4GB VRAM Ipprovaha

Kani TTS 2

3GB VRAM Ultra veloċi Piż ħafif NanoCodec Ħieles

Mudell TTS Ingliż ultra-ħfief 400M li jaħdem biss fi 3GB VRAM.

Stabbli · 3GB VRAM Ipprovaha

OuteTTS

Inferenza tas-CPU Inferenza tal-browser Backends multipli Profili tal-kelliema

TTS ibbażat fuq LLM li jaħdem fuq CPU, GPU, jew browser permezz llama.cpp u Transformers.js.

bil-mod · 2GB VRAM Ipprovaha

VibeVoice

Kelliema multipli Sa 90 min Ġenerazzjoni tal-podcast Konsistenza tal-kelliem 200ms streaming

Mudell Microsoft għal kontenut multi-speaker f'forma twila bħal podcasts u kotba awdjo.

Stabbli · 4GB VRAM Ipprovaha

Pocket TTS

Parametri 100M Inferenza tas-CPU Klonazzjoni tal-vuċi Klonazzjoni ta’ kampjun wieħed Lest għat-tarf

Mudell tal-parametru ħafif 100M minn Kyutai bi klonazzjoni tal-vuċi minn kampjun wieħed.

Stabbli · 1GB VRAM Ipprovaha

Kitten TTS

Inferenza CPU biss Taħt 80MB mudell daqs 8 vuċijiet mibnija fil Kontroll tal-veloċità Ibbażat fuq ONNX 24kHz output

TTS ultra-ħfief taħt 80MB. Runs fuq CPU mingħajr GPU.

Stabbli · 0GB VRAM Ipprovaha

CosyVoice3

Bi-streaming Kontroll tal-emozzjonijiet Klonazzjoni tal-vuċi Kontroll tal-veloċità/volum Istruzzjoni li ġejja

TTS multilingwi tal-ġenerazzjoni li jmiss b'bi-streaming, kontroll tal-emozzjoni, u klonazzjoni tal-vuċi żero-shot.

Stabbli · 4GB VRAM Ipprovaha

NAMAA Saudi TTS

Dialekt Għarbi Sawdi Għarbi Standard Modern Klonazzjoni tal-vuċi b'zero-shot Kontroll tal-emozzjonijiet Pronunzja nattiva

L-ewwel miftuħa Sawdi-Għarbi TTS. Nattiv Sawdi djalett bil-vuċi klonazzjoni Chatterbox-kwalità.

Medju · 6GB VRAM Ipprovaha

Darwin TTS

Klonazzjoni tal-vuċi Cross-lingual FFN imħallat 4 lingwi ewlenin Qwen3 spina dorsali

Varjant cross-modal Qwen3-TTS b'piżijiet FFN imħallta mill-mudell tal-lingwa Qwen3-1.7B għal klonazzjoni multilingwi aktar qawwija.

Medju · 7GB VRAM Ipprovaha

MOSS-TTSD

Djalogu b'ħafna kelliema Sa 5 kelliema 60min awdjo koerenti Klonazzjoni tal-vuċi Ottimizzazzjoni tal-Podcast

Mudell ta’ kontinwazzjoni ta’ djalogu b’ħafna kelliema — jiġġenera konversazzjonijiet fl-istil tal-podcast b’sa 5 kelliema u 60 minuta ta’ awdjo koerenti.

Medju · 12GB VRAM Ipprovaha

Ming-Omni TTS

44.1kHz output Klonazzjoni tal-vuċi Kontroll tal-emozzjonijiet Kontroll tad-djalett Ġenerazzjoni tal-BGM Kompatt 0.5B

Mudell tad-diskors omni-modal 0.5B kompatti minn inclusionAI b'output 44.1kHz b'fiduċja għolja u klonazzjoni tal-vuċi zero-shot.

Medju · 3GB VRAM Ipprovaha

MOSS-TTS Nano