Ազատ AI Տեքստից խոսքName

82M պարամետրեր Շատ արագ Էքսպրեսիվ ձայներ Բազմալեզու Ցանցային աջակցություն

82 մլն պարամետրով թեթև մոդել, որն ապահովում է ստուդիական որակի խոսակցություն՝ արագ եզրակացություններով։

Օգտագործել · 1.5GB VRAM Փորձեք :

Piper

պրոցեսոր Offline- ի ունակություն 100+ ձայներ 35+ լեզուներ SSML աջակցություն

արագ, տեղական նյարդային տեքստից խոսքի համակարգ, որը օպտիմիզացված է Raspberry Pi-ի և ներկառուցված սարքերի համար։

Օգտագործել · 0 (CPU only) VRAM Փորձեք :

VITS

Ամբողջական սինթեզի ապահովում Ֆիզիկական պրոսոդիա արագ եզրակացություն Ավելացնել լսարան

Շատ արագ ընթերցվող տեքստը ձայնագրելու համար օգտագործվում է պայմանական տարբերակիչ ավտոմատ կոդավորիչը։

Օգտագործել · 1GB VRAM Փորձեք :

MeloTTS

պրոցեսորային օպտիմիզացված Բազմալեզու Ավելի քան մեկ ակցենտ Գործողություն Չափազանց ուշացում

Հնարավոր է նվազագույն ժամանակահատվածով պրոցեսորի վրա աշխատող բարձրորակ բազմլեզու տեքստը խոսքի վերածող ծրագիր։

Օգտագործել · 0.5GB (GPU optional) VRAM Փորձեք :

Bark

ձայնային էֆեկտներ Ծիծաղում/հառաչում Երաժշտության ստեղծում 100+ ձայնագրություն Բազմալեզու

Տրանսֆորմերների վրա հիմնված տեքստը ձայնային մոդել, որը ստեղծում է իրական խոսակցություն, երաժշտություն և ձայնային էֆեկտներ։

Դադար · 5GB VRAM Փորձեք :

Bark Small

Համարձակ Ավելի արագ, քան ամբողջական Bark- ը Էմոցիոնալ խոսք Բազմալեզու

Bark-ի ավելի թեթև տարբերակը՝ ավելի արագ եզրակացություններով և հիշողության ավելի քիչ օգտագործմամբ։

Ընդհանուր · 2GB VRAM Փորձեք :

CosyVoice 2

Սահմանափակ Zero-shot կլոնավորում ՀամլեզուName Էմոցիաների վերահսկում Մարդկային-բարեհաջողություն

Alibaba-ի արագացվող TTS-ը, որը բնական է և մոտ է 0-ին.

Dia TTS

Բազմաձայնիչ Դիալոգների ստեղծում Ճիշտ ընթացք Էմոցիաների արտահայտություն 1.6B պարամետրեր

Բազմախոսնակ դիալոգների ստեղծման մոդել, որը ստեղծում է խոսողների միջև բնական զրույցներ։

Parler TTS

ձայնային նկարագրություն Բնական լեզվի վերահսկում Լայնամասշտաբ ձայնային ստեղծում Ոչ մի նախօրոք սահմանված ձայն չի պահանջվում

Օգտագործեք բնական լեզուն և Parler-ը կստեղծի ձեզ համար հարմար ձայն.

Indic Parler TTS

11 Հնդկական լեզուներ Ձայնային նկարագրություն Բնական լեզվի վերահսկում Հնդկական արտասանություն

8+ լեզուների համար բարձրորակ խոսակցություն՝ բնական լեզվի ձայնային կառավարմամբ.

Դադար · 8GB VRAM Փորձեք :

KhanomTan TTS

ԹայերենName Ավելացնել լսարան YourTTS ճարտարապետություն Առևտրային-ապահով լիազորագիր

Թայերեն-հայերեն տեքստը խոսքի վերածող ծրագրի ընտրություն ձայների համար.

Օգտագործել · 2GB VRAM Փորձեք :

IndexTTS-2

Էմոցիաների կառավարում Զերո-շոու Էմոցիաների վեկտորներ Էքսպրեսիվ խոսք Չափազանց մանրամասն վերահսկում

Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։

Spark TTS

Ձայնի կլոնավորում Էմոցիաների վերահսկում Ստեղծող Խնդրի վրա հիմնված 5 վայրկյանի կլոնավորում

TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։

GPT-SoVITS

5 վայրկյանի կլոունավորում Երգում եմ Չափազանց քիչ նկարներ Հեռացնել Ցուցադրել լեզուները

Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։

Դադար · 6GB VRAM Փորձեք :

Orpheus

Մարդկային զգացմունքների մակարդակը : 100K ժամեր ուսուցում Բնական շեշտավորում Էքսպրեսիվ խոսք

100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ

Chatterbox

Zero-shot կլոունավորում Էմոցիաների կառավարում Հեռացնել Տեսակ փոխանցում Միայն մեկ նմուշ հնարք

Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։

Tortoise TTS

Ամենաբարձր որակը Բազմաձայն DALL-E ճարտարապետություն Ձայնի կլոնավորում Ավտոռեգրեսիա

Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։

Դադար · 8GB VRAM Փորձեք :

StyleTTS 2

Մարդկային մակարդակի Ստեղծող Հակառակորդի վարժություն Ծածկագիր Հեռացնել

Human-level text-to-speech through style diffusion and adversary training (անգլերեն) Վիքիպահեստում

OpenVoice

Անմիջական կլոնավորում Ձայնի փոխակերպում Էմոցիաների կառավարում Ակցիոնների կառավարում Բազմալեզու

Ձայնի արագ կլոունավորում՝ կերպարի, զգացմունքների և ակցենտերի մանրամասն կառավարմամբ։

Qwen3 TTS

9 նախատեսված ձայներ Ձայնի կառուցվածք տեքստում Էմոցիաների կառավարում 10 լեզու

Alibaba-ի բազմլեզու TTS-ը նախատեսված ձայներով և ձայնի դիզայնով տեքստում։

Ընդհանուր · 7GB VRAM Փորձեք :

VieNeu-TTS-v2

7 նախատեսված ձայներ (Հյուսիս + Հարավ ակցենտներ) En-Vi կոդային փոխանցում Ձայնի կլոնավորում (3-5 վայրկյան) Podcast / բազմահաղորդիչների աջակցություն Միայն CPU — GPU-ի կարիք չկա

Վիետնամերեն + Անգլերեն կոդ-փոխանցող TTS 7 նախատեսված ձայներով և zero-shot ձայնի կլոինգով։ Պահանջվում է միայն CPU, ոչ GPU։

Օգտագործել · CPU VRAM Փորձեք :

Sesame CSM

Խոսակցական Բնական ժամանակացույց Ընդմիջում Հետին ալիք 1B պարամետրեր

Ընդհանուր լեզուաբանություն, լեզուաբանության բնագավառ, որը ուսումնասիրում է լեզուների կառուցվածքը և լեզուների միջև կապերը։

Դադար · 8GB VRAM Փորձեք :

Chatterbox Turbo

200 մսիսից պակաս ձգձգվածություն Կապույտ 6x իրական ժամանակում Ձայնի կլոնավորում Ջրային նշան

200 մլրդ դրամ, 200 մլն դոլար և 200 մլն եվրո, 200 մլն դոլար և 200 մլն դոլար՝ 2009 թվականի տվյալներով։

Օգտագործել · 2GB VRAM Փորձեք :

VoxCPM

44.1kHz ձայն Tokenizer-free Համլեզու կլոնավորում Կոնտեքստը հաշվի առնող LoRA-ի մանրամասն կարգավորում

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency Վիքիպահեստում

Օգտագործել · 4GB VRAM Փորձեք :

Kani TTS 2

3 ԳԲ VRAM Շատ արագ Համարձակ NanoCodec Ազատ

400 մ. անգլերեն TTS մոդել, որը աշխատում է միայն 3GB VRAM-ով.

Օգտագործել · 3GB VRAM Փորձեք :

OuteTTS

Օպերացիոն համակարգ Բրաուզերի եզրակացություն Բազմաթիվ աջակցող ծրագրեր Խոսողի պրոֆիլներ

LLM-ի վրա հիմնված TTS, որը աշխատում է CPU, GPU կամ բրաուզերի միջոցով llama.cpp և Transformers.js.

Դադար · 2GB VRAM Փորձեք :

VibeVoice

Բազմաձայնիչ 90 րոպե Podcast-ի ստեղծում Ծրագրի ցուցակ 200մս հոսք

Microsoft-ի մոդելը երկար ձևի բազմահնչյուն բովանդակության համար, ինչպիսիք են podcast-ները և ձայնագրված գրքերը։

Օգտագործել · 4GB VRAM Փորձեք :

Pocket TTS

100M պարամետրեր Օպերացիոն համակարգ Ձայնի կլոնավորում Միանման օրինակի կլոունավորում Չափազանց եզրային

Kyutai-ի հեշտ 100M պարամետրերի մոդել, ձայնի կլոինգի համար մեկ նմուշից

Օգտագործել · 1GB VRAM Փորձեք :

Kitten TTS

Ընդհանուր 80ՄԲ-ից փոքր 8 ներկառուցված ձայներ արագության վերահսկում ONNX- ի վրա հիմնված 24kHz արտահոսք

80ՄԲ-ից քիչ TTS-ի ուլտրա-քիչ ծանրություն։ Պարունակում է պրոցեսոր առանց գրաֆիկական պրոցեսորի։

Օգտագործել · 0GB VRAM Փորձեք :

CosyVoice3

Երկու ալիք Էմոցիաների կառավարում Ձայնի կլոնավորում արագության/ձայնի կառավարում Հատկություն

Հաջորդ սերունդի բազմալեզու TTS-ը, որը ներառում է bi-streaming, emotional control և zero-shot ձայնային կլոինգ։

Օգտագործել · 4GB VRAM Փորձեք :

NAMAA Saudi TTS

Սուդյան ԱրաբերենName Դասական արաբերենName Զերո-շոթ ձայնային կլոունավորում Էմոցիաների կառավարում Հայերեն արտասանություն

Առաջին բաց արաբերեն-սուդյան TTS-ը։ Սուդյան լեզու Chatterbox-ի որակով ձայնի կլոինով։

Ընդհանուր · 6GB VRAM Փորձեք :

Darwin TTS

Ձայնի կլոնավորում Ցուցադրել լեզուները FFN-ի խառնվածք 4 հիմնական լեզուներ Qwen3 սկզբունք

Cross-modal Qwen3-TTS տարբերակը FFN-ի արժեքներով, որը խառնված է Qwen3-1.7B լեզվի մոդելի հետ՝ ավելի արագ բազմլեզու կլոինգի համար։

Ընդհանուր · 7GB VRAM Փորձեք :

MOSS-TTSD

Բազմաձայնիչների երկխոսություն Մինչև 5 լսարան 60 րոպե համապատասխան ձայն Ձայնի կլոնավորում Podcast-ի օպտիմիզացում

Multi-speaker dialogue continuation model — ստեղծում է podcast-style զրույցներ մինչև 5 խոսնակների և 60 րոպե համապատասխան ձայնային նյութով.

Ընդհանուր · 12GB VRAM Փորձեք :

Ming-Omni TTS

44.1kHz ելք Ձայնի կլոնավորում Էմոցիաների կառավարում Դիալեկտի կառավարում BGM ստեղծում Կոմպրեսիոն 0. 5B

1995-ին թողարկվել է 5.1-ին ձայնային համակարգով 4.1-ին ձայնային համակարգով և 4.4-ին ձայնային համակարգով ձայնային համակարգով։

Ընդհանուր · 3GB VRAM Փորձեք :

MOSS-TTS Nano