თავისუფალი AI ტექსტიდან საუბარიName

პარამეტრები ძალიან სწრაფი გამოხატული ხმები მრავალენოვანიName სტრიმინგის მხარდაჭერა

82 მლნ ოაპამვრპთფვნ მჲევლ, კჲირჲ ოპვეჲჟრაგწ ჟრსეთჲ-კგალთრვრნა დჲგჲპკა ჟ ბყპჱჲ თჱგლვფვნთვ.

სწრაფი · 1.5GB VRAM ჲოთრაი.

Piper

CPU- სთვის სასარგებლო ქსელიდან გასვლის შესაძლებლობა 100+ ხმა 35+ ენა SSML მხარდაჭერა

სწრაფი, ლოკალური ნეირონული ტექსტი- საუბრის სისტემა, ოპტიმიზირებული Raspberry Pi და ჩაშენებული მოწყობილობებისთვის.

სწრაფი · 0 (CPU only) VRAM ჲოთრაი.

VITS

სრული სინთეზი ბუნებრივი პროზოდია სწრაფი დასკვნა მრავალი მთარგმნელი

1996 წელს გამოვიდა ალბომი „The End of the World“, რომელიც შეიცავს ინგლისურენოვან ჩანაწერებს.

სწრაფი · 1GB VRAM ჲოთრაი.

MeloTTS

CPU ოპტიმიზირებული მრავალენოვანი მრავალი აქცენტი ოპჲეაკუთჲნნჲ ოპთდჲრჲგვნ დაბალი დაგვიანება

მაღალი ხარისხის მრავალენოვანი ტექსტ- ენაზე გადასვლა, რომელიც მიმდინარეობს CPU- ზე მინიმალური დაგვიანებით. Name

სწრაფი · 0.5GB (GPU optional) VRAM ჲოთრაი.

Bark

ხმოვანი ეფექტებიName ჟმვჳ/გყჱეყჳ მუსიკის შექმნა 100+ მთარგმნელი მრავალენოვანიName

ტრანსფორმატორზე დაფუძნებული ტექსტი-აუდიო მოდელი, რომელიც ქმნის რეალისტურ საუბარს, მუსიკას და ხმაურიან ეფექტებს.

ნელა · 5GB VRAM ჲოთრაი.

Bark Small

მსუბუქი ოჲ-ბყპჱჲ ჲრ ოყლნარა კჲპა ვმჲუთჲნალნა პვფ. მრავალენოვანიName

Bark- ის მსუბუქი ვერსია სწრაფი დასკვნით და მცირე მეხსიერების გამოყენებით. Name

საშუალო · 2GB VRAM ჲოთრაი.

CosyVoice 2

სტრიმინგი ნვგაჱმჲზნჲ კლჲნთპანვ საერთაშორისო კჲნრპჲლ ნა ვმჲუთთრვ. ადამიანის პარიტეტი

Alibaba-ს მასშტაბური სტრიმინგი TTS ადამიანის-პარიტეტის ბუნებრივობით და ახლოს ნულოვანი ლოდინით.

Dia TTS

მრავალმტყორცნიანი დიალოგის შექმნა ბთჲლჲდთფნა ჟგჲბჲეა ნა ოჲგყპრწ. ემოციური გამოხატულება პარამეტრები

Multi-სიმღერალი დიალოგის გენერაციის მოდელი, რომელიც ქმნის ბუნებრივ საუბარს საუბრის დროს.

Parler TTS

ხმის აღწერა ბუნებრივი ენის კონტროლი მოქნილი ხმის შექმნა წინასწარ განსაზღვრული ხმები არ არის საჭირო

ოპთკაზთ დლაჟა კჲ£ ჟაკაქ ნა ბთჲლჲზთფვნ ჱბჲპ თ ოაპლვპ ვ დჲ ჟჲჱეაევ ჟჲგპქვნთჲრ დლაჟ.

Indic Parler TTS

11 აპრილი ხმა ბუნებრივი ენის კონტროლი ავღანული გამოთქმა

8+ ინდოეთის ენის მაღალი ხარისხის საუბარი ბუნებრივი ენის ხმოვანი კონტროლით.

ნელა · 8GB VRAM ჲოთრაი.

KhanomTan TTS

ტაი TTS მრავალი მთარგმნელი YourTTS არქიტექტურა კომერციული უსაფრთხო ლიცენზია

1996 წელს ინგლისურენოვანი ფილმი „The First Man“ გამოვიდა, სადაც ლედი გაგას როლი შეასრულა.

სწრაფი · 2GB VRAM ჲოთრაი.

IndexTTS-2

ჟვპთჲჱნჲ? ნვმა თჱჟრპვლთ. ემოციების ვექტორები ექსპრესიული საუბარი ფრთხილად კონტროლი

ნვპჲ-ჟრპვლკა ჟ ჟთლვნ ვმჲუთჲნალვნ კჲნრპჲლ თ გთჟჲკა თჱპაჱნჲჟრ.

Spark TTS

ხმა კჲნრპჲლ ნა ვმჲუთთრვ. სტილის კონტროლი კითხვის საფუძველზე 5-წლნჲ კლჲნთპანვ

TTS-ის ხმის კლონირება კონტროლირებადი ემოციებითა და საუბრის სტილითა და მითითებებით.

GPT-SoVITS

5-წლნჲ კლჲნთპანვ ოვვღთ დლაჟ. ოჲფთჟრთ დჲ ჲგა. მაღალი ხარისხის ენათაშორისი

ნწკჲლკჲ ჟნთმკთ ჱა დლაჟჲგჲ კლჲნთპანვ ნა ჟთლთკჲნჲგთ ოპთვმაფთ, კჲთრჲ ოპვგყპქგარ გჟთფკთ დლაჟჲგთ ჟყჲბღვნთწ ჟამჲ ჲრ 5 ჟვკსნეთ ჱგსკ.

ნელა · 6GB VRAM ჲოთრაი.

Orpheus

ჟვმვ£ჟრგჲრჲ რთ ვ ჟჲ მვნვ. 100K საათიანი წვრთნა ბუნებრივი ხაზგასმა ექსპრესიული საუბარი

ჟვმვ£ჟრგჲრჲ ჟთ ჟვ ჲბსფთლჲ ნა 100 000 ფაჟა დჲგჲპვნთ ეანჲგთ.

Chatterbox

ნვგაჱმჲზნჲ კლჲნთპანვ ჟვპთჲჱნჲ? მაღალი ხარისხის სტილის გადატანა ერთეული ნიმუშის კლონირება

ჟრპანნჲ ჟრპანნჲ ჟგთპვნვ ნა დლაჟვმთჲრჟკთ კჲნრპჲლ ჲრ "პვჟვმთლთწრ"

Tortoise TTS

ყველაზე მაღალი ხარისხი მრავალხმიანი DALL-E არქიტექტურა ხმის კლონირება ავტორეგრესიული

Multi-voice text-to-speech-ი, რომელიც ფოკუსირებულია ხარისხზე ავტორეგრესული არქიტექტურის გამოყენებით.

ნელა · 8GB VRAM ჲოთრაი.

StyleTTS 2

ადამიანის დონე სტილის გაფართოება ოპჲრთგნთფვჟრგჲრჲ ჟვ რპვნთპა. ბუნებრივი ვარიანტი მაღალი ხარისხის

ჟთლთკჲნჲგთ

OpenVoice

მყისიერი კლონირება ხმაComment ჟვპთჲჱნჲ? აკცენტის კონტროლი მრავალენოვანიName

მყისიერი ხმის კლონირება სტილის, ემოციისა და აქცენტის კონტროლით.

Qwen3 TTS

9 წინასწარ განსაზღვრული ხმა ხმა ტექსტიდან ჟვპთჲჱნჲ? ენა

Alibaba-ს მრავალენოვანი TTS წინასწარ განსაზღვრული ხმებით და ხმათა დიზაინით ტექსტიდან.

საშუალო · 7GB VRAM ჲოთრაი.

VieNeu-TTS-v2

7 წინასწარ განსაზღვრული ხმა (ჩრდილოეთ + სამხრეთ აქცენტები) En-Vi კოდის გადართვა ხმათა კლონირება (3-5 წამი) Podcast/ მრავალმღერიანი მხარდაჭერა მხოლოდ CPU — GPU არ არის საჭირო

ვიეტნამური + ინგლისური კოდის გადართვა TTS 7 წინასწარ განსაზღვრული ხმა და ნულოვანი ხმა კლონირება. მხოლოდ CPU, GPU არ არის საჭირო.

სწრაფი · CPU VRAM ჲოთრაი.

Sesame CSM

საუბარი ბუნებრივი დრო ოჲჟლვეგაŒვ ნა ჟრჲოკა უკან გადასვლა პარამეტრები

ჟვკჟსალნა ოპთგლვფვნჲჟრ თ ჟვკჟსალნა ოპთგლვფვნჲჟრ ჟვ ჟპვღსგაარ გ ჟთლთკჲნჲგთრვ თ ჟთლთკჲნჲგთრვ ჟვკჟსალნთ ოპთგლვფვნთწ.

ნელა · 8GB VRAM ჲოთრაი.

Chatterbox Turbo

200 მს-ზე ნაკლები დაგვიანებით ჭდეები 6x რეალურ დროში ხმა წყალგაუმტარი ნიშნები

2000 წელს ფილმმა მიიღო ოქროს მედალი ოსკარზე, ოსკარის 200-ე დაჯილდოების ცერემონიალზე.

სწრაფი · 2GB VRAM ჲოთრაი.

VoxCPM

აუდიო ტოკენიზატორის გარეშე ენათაშორისი კლონირება კონტექსტის მიხედვით LoRA-ს დახვეწა

2001 წლის აღწერის მონაცემებით სოფელში ცხოვრობს 441 ადამიანი. ↑ Численность населения по населённым пунктам Республики Башкортостан

სწრაფი · 4GB VRAM ჲოთრაი.

Kani TTS 2

3GB VRAM ძალიან სწრაფი მსუბუქი ნანოკოდეკიName თავისუფალი

400-იანი წლების დასაწყისში ინგლისში ინგლისური ენის სწავლება 3000-იან წლებში დაიწყო.

სწრაფი · 3GB VRAM ჲოთრაი.

OuteTTS

CPU- ს დასკვნა ბრაუზერის დასკვნა მრავალი ბაზები საუბრის პროფილებიName

LLM-ზე დაფუძნებული TTS, რომელიც მუშაობს CPU, GPU, ან ბრაუზერის მეშვეობით llama.cpp და Transformers.js.

ნელა · 2GB VRAM ჲოთრაი.

VibeVoice

მრავალმტყორცნიანი 90 წუთი რადიოშოუების შექმნა ხმამაღლა ლაპარაკი 200ms ნაკადის გადაცემა

Microsoft-ის მოდელი ხანგრძლივი ფორმის multi-speaker შინაარსისთვის, როგორიცაა podcasts და audiobooks.

სწრაფი · 4GB VRAM ჲოთრაი.

Pocket TTS

პარამეტრები CPU- ს დასკვნა ხმა ერთნაირი ნიმუშის კლონირება მზადაა

100 მლნ ოაპამვრპთ ჲრ კძრაი ჟ დლაჟჲგჲ კლჲნთპანვ ჲრ ვევნ ოპჲბლვმ.

სწრაფი · 1GB VRAM ჲოთრაი.

Kitten TTS

მხოლოდ CPU- ს დასკვნა მოდელის ზომა 80MB- ზე ნაკლებია 8 შიდა ხმა სიჩქარის კონტროლი ONNX- ის საფუძველზე 24kHz გამონატანი

ულტრა მსუბუქი TTS 80MB- ზე ნაკლები. მუშაობს CPU- ზე GPU- ს გარეშე.

სწრაფი · 0GB VRAM ჲოთრაი.

CosyVoice3

ორმაგი ნაკადი ჟვპთჲჱნჲ? ხმა სიჩქარის/ხმის მართვა ოჲჟლვეგაŒვ ნა თნჟრპუქუთ£არა

ჟლვეგაღჲ ოჲკჲლვნთვ მნჲდჲ£ჱბვნჲ TTS ჟჲ ბთ-ჟრპთმთნდ, ვმჲუთჲნალვნ კჲნრპჲლ თ ნვდჲგჲ ნვჲბგყპჱანჲ დლაჟჲგჲ კლჲნთპაŒვ.

სწრაფი · 4GB VRAM ჲოთრაი.

NAMAA Saudi TTS

საუდის არაბეთიName თანამედროვე სტანდარტული არაბული ნვგაჱმჲზნჲ ჟვ ჟლსქა დლაჟჲგჲრჲ ჟთ ჟლჲზვნთვ. ჟვპთჲჱნჲ? ადგილობრივი გამოთქმა

პირველი ღია საუდის არაბეთის TTS. საუდის არაბეთის დიალექტი Chatterbox- ის ხარისხის ხმათა კლონირებასთან ერთად.

საშუალო · 6GB VRAM ჲოთრაი.

Darwin TTS

ხმა ენათაშორისი FFN- შერწყმა 4 ძირითადი ენა Qwen3 ბაზები

Qwen3-1.7B-ის მოდელი Qwen3-1.7B-ის მოდელი Qwen3-1.7B-ის მოდელი Qwen3-1.7B-ის მოდელი Qwen3-1.7B-ის მოდელი Qwen3-1.7B-ის მოდელი

საშუალო · 7GB VRAM ჲოთრაი.

MOSS-TTSD

მრავალმტყუანიანი დიალოგი 5 დინამიკამდე 60min კოჰერენტული აუდიო ხმა ვიდეო ჩანაწერების ოპტიმიზაცია

2009 წლის 12 იანვარს გამოვიდა ალბომი „The Best of The Beatles“, რომელიც შეიცავს 50 საუკეთესო სიმღერას და 60 ვიდეოკლიპს.

საშუალო · 12GB VRAM ჲოთრაი.

Ming-Omni TTS

გამონატანი ხმა ჟვპთჲჱნჲ? დიალექტური კონტროლი BGM- ის შექმნა კომპაქტური 0. 5B

1950 წელს სოფელში გაიხსნა სოფლის მეურნეობის სასწავლებელი. სოფელში ცხოვრობს 441 ადამიანი. ↑ Численность населения по населённым пунктам Республики Башкортостан

საშუალო · 3GB VRAM ჲოთრაი.

MOSS-TTS Nano