Tasuta tehisintellekt Tekst kõnele

82M parameetrid Ultra-fast Väljendavad hääled Mitmekeelne Toetus meetmete ühtlustamiseks

Lightweight 82M parameetri mudel pakkuda stuudio-kvaliteet kõne koos lõõskav-kiire järeldus.

Kiire · 1.5GB VRAM Proovi seda.

Piper

CPU-sõbralik Võrgust väljas 100+ häält 35+ keelt SSML toetus

Kiire, kohalik neuraalne tekst kõne süsteemi optimeeritud Vaarika Pi ja sisseehitatud seadmed.

Kiire · 0 (CPU only) VRAM Proovi seda.

VITS

Lõppsüntesatsioon Looduslik prosoodia Kiire järeldus Mitu kõnelejat

Tingimuslik variational autoencoder võistleva õppe lõpuni teksti kõne.

Kiire · 1GB VRAM Proovi seda.

MeloTTS

CPU optimeeritud Mitmekeelne Mitu aktsenti Tootmisvalmis Madal latentsus

Kvaliteetne mitmekeelne tekst-kõne, mis töötab CPU minimaalse latentsus.

Kiire · 0.5GB (GPU optional) VRAM Proovi seda.

Bark

Heliefektid Naermine/ohkamine Muusika põlvkond 100+ kõnelejat Mitmekeelne

Transformer-põhine teksti-to-audio mudel, mis tekitab realistlik kõne, muusika, ja heliefekte.

Aeglane · 5GB VRAM Proovi seda.

Bark Small

Kerge Kiirem kui puukoor Emotsionaalsed kõned Mitmekeelne

Kergem versioon Bark kiirem järeldus ja madalam mälu kasutamine.

Keskmine · 2GB VRAM Proovi seda.

CosyVoice 2

Streaming Nullkuumutatud kloonimine Keeleülene Emotsioonikontroll Inimpariteet

Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.

Dia TTS

Multikõlarid Dialoogi genereerimine Looduslik ümberpööramine Emotsionaalne väljendus 1.6B parameetrid

Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.

Parler TTS

Hääle kirjeldus Loomulik keelekontroll Paindlik häälloome Eelseadistatud hääli pole vaja

Kirjelda oma soovitud häält loomulikus keeles ja Parler loob sobiva kõne.

Indic Parler TTS

11 India keelt Hääle kirjeldus Loomulik keelekontroll Autentne indikaalne hääldus

Kvaliteetne kõne 8+ India keeltele loomuliku keele häälekontrolliga.

Aeglane · 8GB VRAM Proovi seda.

KhanomTan TTS

Tai TTS Mitu kõnelejat Sinu TTS arhitektuur Kommertskaubaveo luba

Tai-esimene teksti kõne-kõne koos valik kõlar hääled.

Kiire · 2GB VRAM Proovi seda.

IndexTTS-2

Emotsioonikontroll Nulllask Emotsioonivektorid Väljendav kõne Peentäidisega kontroll

Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.

Spark TTS

Hääle kloonimine Emotsioonikontroll Stiili kontroll Prompt- based 5-sekundiline kloonimine

Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.

GPT-SoVITS

5-sekundiline kloonimine Laula häält Vähene õppimine Suur truudus Keeleülene

Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.

Aeglane · 6GB VRAM Proovi seda.

Orpheus

Inimlikud emotsioonid 100K-tunnine koolitus Loomulik rõhuasetus Väljendav kõne

Inimese tasemel emotsionaalne TTS mudel treenitud 100K tundi kõne andmeid.

Chatterbox

Nullkuumutatud kloonimine Emotsioonikontroll Suur truudus Stiili ülekanne Ühe proovi kloonimine

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Tortoise TTS

Kõrgeim kvaliteet Mitmehäälne DALL-E arhitektuur Hääle kloonimine Autoregressiivne

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Aeglane · 8GB VRAM Proovi seda.

StyleTTS 2

Inimtase Stiili hajumine Adverssaarsed koolitused Looduslik varieerumine Suur truudus

Inimese tasemel teksti kõne-kõne kaudu stiili difusiooni ja võistlevate koolitus.

OpenVoice

Kohene kloonimine Hääle teisendamine Emotsioonikontroll Kiire kontroll Mitmekeelne

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Qwen3 TTS

9 eelseadistatud häält Hääle kujundus tekstist Emotsioonikontroll 10 keelt

Alibaba mitmekeelne TTS eelseadistatud häälte ja häälekujundusega tekstist.

Keskmine · 7GB VRAM Proovi seda.

VieNeu-TTS-v2

7 eelseadistatud häält (põhja + lõuna aktsent) En-Vi kood-lülitid Hääle kloonimine (viidatud3-5s) Podcast / mitmekõnelise toetuse Ainult CPU- ga ei ole GPU- d vaja

Vietnami + inglise kood-switching TTS 7 eelnevalt hääled ja null-shot hääl kloonimine. CPU-ainult, ei GPU vaja.

Kiire · CPU VRAM Proovi seda.

Sesame CSM

Vestlus Loomulik ajastus Pöördemoment Seljakanal 1B parameetrid

Vestluskõne mudel, mis loob loomuliku dialoogi sobiva ajastuse ja emotsioonidega.

Aeglane · 8GB VRAM Proovi seda.

Chatterbox Turbo

Sub-200ms latency Paralingvistika sildid 6x reaalajas Hääle kloonimine Veemärgistamine

Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.

Kiire · 2GB VRAM Proovi seda.

VoxCPM

44,1kHz audio Tokeneser-free Keeleülene kloonimine Kontekstiteadlik LoRA peenhäälestus

Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.

Kiire · 4GB VRAM Proovi seda.

Kani TTS 2

3GB VRAM Ultra-fast Kerge NanoCodec Vaba

Ultra-valgus 400M Inglise TTS mudel töötab vaid 3GB VRAM.

Kiire · 3GB VRAM Proovi seda.

OuteTTS

CPU järeldus Brauseri järeldus Mitmed taustaprogrammid Kõlarid

LLM-põhine TTS, mis töötab CPU, GPU, või brauseri kaudu lama.cpp ja Transformers.js.

Aeglane · 2GB VRAM Proovi seda.

VibeVoice

Multikõlarid Kuni 90 min Podcasti tootmine Kõlari konsistents 200ms streaming

Microsoft mudel pikaform multi-kõlar sisu nagu podcasts ja audiobooks.

Kiire · 4GB VRAM Proovi seda.

Pocket TTS

100M parameetrid CPU järeldus Hääle kloonimine Ühe valimi kloonimine Edge valmisComment

Kyutai kerge 100M parameetri mudel, mille puhul ühe proovi hääl kloonitakse.

Kiire · 1GB VRAM Proovi seda.

Kitten TTS

Ainult CPU järeldus Mudeli suurus alla 80MB 8 sisseehitatud häält Kiiruse reguleerimine ONNX-põhine 24kHz väljund

Ultra-kerge TTS alla 80MB. Käivitab CPU ilma GPU.

Kiire · 0GB VRAM Proovi seda.

CosyVoice3

Bistreaming Emotsioonikontroll Hääle kloonimine Kiiruse/mahu kontroll Juhised järgnevaks:

Järgmise põlvkonna mitmekeelne TTS koos bi-streaming, emotsioonide kontroll, ja null-shot hääl kloonimine.

Kiire · 4GB VRAM Proovi seda.

NAMAA Saudi TTS

Saudi Araabia dialekt Kaasaegne standard araabia keel Nullkuumus hääl kloonimine Emotsioonikontroll Kohalik hääldus

Esimene avatud Saudi-Arabic TTS. Native Saudi dialekt Chatterbox-kvaliteedi hääl kloonimine.

Keskmine · 6GB VRAM Proovi seda.

Darwin TTS

Hääle kloonimine Keeleülene FFN-blister 4 põhikeelt Qwen3 selgroog

Intermodaalne Qwen3-TTS variant FFN kaaluga, mis on segatud Qwen3-1.7B keelemudelist teravama mitmekeelse kloonimise jaoks.

Keskmine · 7GB VRAM Proovi seda.

MOSS-TTSD

Mitmehäälne dialoog Kuni 5 kõnelejat 60min ühtne heli Hääle kloonimine Podcast-optimeeritud

Multi-speaker dialoogi jätkamise mudel ~ genereerida podcast stiilis vestlusi kuni 5 kõlarid ja 60 minutit sidusat heli.

Keskmine · 12GB VRAM Proovi seda.

Ming-Omni TTS

44,1kHz väljund Hääle kloonimine Emotsioonikontroll Dialekti kontroll geneetiliselt muundatud organismide tekitamine Kompaktne 0,5B

Kompaktne 0,5B omni-modaalne kõnemudel inclusionAI suure truuduse 44,1kHz väljundiga ja nullkuuma hääle kloonimisega.

Keskmine · 3GB VRAM Proovi seda.

MOSS-TTS Nano