Чөлөөт AI Үгнээс үсэг рүүName

82М параметрүүд Маш хурдан Сэтгэл хөдлөм дуунууд Олон хэл Сурталчилгааны дэмжлэг

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Хурдан · 1.5GB VRAM оролдож үз

Piper

CPU- гийн уян хатан байдал Холбоогүй 100+ дуунууд 35+ хэл SSML дэмжлэг

Raspberry Pi болон суурилуулсан төхөөрөмжүүдэд тохируулсан хурдан, орон нутгийн нейрон текстээс яриа болгох систем. Name

Хурдан · 0 (CPU only) VRAM оролдож үз

VITS

Бүх талаар нь синтезлэх Уран үгийн дэс дараа Хурдан дүгнэлт Олон дуут дамжуулагч

Бүх түвшний текст-амьдралд зориулсан өрсөлдөөнтэй суралцах нөхцөлтэй хувирлын автокодлогч.

Хурдан · 1GB VRAM оролдож үз

MeloTTS

CPU-г сайжруулсан Олон хэл Олон тооны өнгө Үйлдвэрлэлийн бэлэн байдал Хэт богино хугацаа

CPU дээр хамгийн бага эргэлтийн хугацаатай ажилладаг чанартай олон хэлний текст- рүү- яриа.

Хурдан · 0.5GB (GPU optional) VRAM оролдож үз

Bark

Сонсох эффектүүд Инээмсэглэж/Үргэлжлүүлэх Хөгжим үүсгэх 100+ дуут дохио Олон хэл

Трансформатор дээр суурилсан текстээс дууны загвар нь бодит яриа, хөгжим, дууны эффектүүдийг үүсгэдэг. Name

Удаан · 5GB VRAM оролдож үз

Bark Small

Хөнгөн Бүтээгдэхүүний нэр: Сэтгэл хөдлөлийн яриа Олон хэл

Барк-ийн илүү хурдан тооцоолол, бага санах ой ашиглах боломжтой хувилбар. Name

Хэмжээ · 2GB VRAM оролдож үз

CosyVoice 2

Хугацаа Zero-shot клончлох Олон хэлний Сэтгэл хөдлөлийн удирдлага Хүний-паритет

Alibaba-ийн хэмжээст дамжуулах TTS нь хүний-паритын байгалийн байдал болон нууцлалын ойролцоо.

Dia TTS

Олон дуут Диалогийн самбар үүсгэх Өөрчлөлт хийх Сэтгэл хөдлөл Параметрууд

Олон дуут ярианы генератор нь дуут ярианууд хооронд байгалийн яриаг бий болгодог.

Parler TTS

Дууны тайлбар Орчин үеийн хэлний хяналт Хөгжилтэй дууны бүтэц Өмнөх байдлаар тохируулсан дуунууд хэрэггүй

Та хүссэн дуу хоолойгоо байгалийн хэлээрээ тодорхойл, Parler тохирох дуу хоолойг үүсгэнэ.

Indic Parler TTS

Энэтхэгийн хэлнүүд Дууны тайлбар Уламжлалт хэлний хяналт Үндэсний дуугаралт

8+ Энэтхэг хэлний чанартай яриа, байгалийн хэлний дууны удирдлагатай.

Удаан · 8GB VRAM оролдож үз

KhanomTan TTS

Тай TTS Олон дуут дамжуулагч Таны TTS архитектур Худалдааны аюулгүй лиценз

Тай- ийн анхны текст- рүү- яриа, сонголттой дуу хоолойгоор. Name

Хурдан · 2GB VRAM оролдож үз

IndexTTS-2

Сэтгэл хөдлөлийн удирдлага Нууц үг Сэтгэл хөдлөл Сэтгэл хөдлөлийн яриа Хэт нарийвчлалтай хяналт

Zero-shot TTS, нарийн мэдрэмжтэй, өндөр илэрхийлэлтэй.

Spark TTS

Дууны дугуй Сэтгэл хөдлөлийн удирдлага Стиль удирдлага Асуулт- суурилсан 5 секундын дуурайлт

ТТС-ийн дууны клоныг удирдах сэтгэл хөдлөл болон дуудлагаар ярих хэв маяг.

GPT-SoVITS

5 секундын дуурайлт Хөгжим Зарим зурагт суралцах Маш сайн Олон хэл

5 секундын аудионоос ямар ч дууг репликацилах хэдхэн секундын дууны клонинг TTS.

Удаан · 6GB VRAM оролдож үз

Orpheus

Хүний түвшний мэдрэмж 100K цагийн сургалт Тодорхойлолт Сэтгэл хөдлөлийн яриа

Хүний түвшний сэтгэл хөдлөлийн TTS загварыг 100K цагийн ярианы мэдээллээр бэлтгэсэн.

Chatterbox

Нууц үгийг хадгалах Сэтгэл хөдлөлийн удирдлага Маш сайн Стиль шилжүүлэх Нэг жишээг дуурайх

"Resemble AI"-ийн сэтгэл хөдлөлийн хяналттай, хамгийн сүүлийн үеийн дууны клон.

Tortoise TTS

Хамгийн өндөр чанар Олон дуут DALL-E архитектур Дууны дугуй Авто регресс

Авторегрессив загвартай чанарт суурилсан олон дуут текст-то-сонголт.

Удаан · 8GB VRAM оролдож үз

StyleTTS 2

Хүний түвшин Диффузийн хэв маяг Тоглоомын дасгал Урт Маш сайн

Хүний түвшний текст-то-уламжлалт яриа, маргаантай сургалтын аргаар.

OpenVoice

Үргэлжлүүлэх Дуу хөрвүүлэгч Сэтгэл хөдлөлийн удирдлага Хөгжмийн удирдлага Олон хэл

Хэлний хэв маяг, сэтгэл хөдлөл, өнгө аясыг хянах боломж бүхий шууд дууны дугуйлан.

Qwen3 TTS

9 өмнөх тохируулсан дуунууд Үгний загвар Сэтгэл хөдлөлийн удирдлага 10 хэл

Alibaba-ийн олон хэлний TTS нь өмнөх тохируулсан дуунууд болон текстээс дууны загварыг агуулдаг.

Хэмжээ · 7GB VRAM оролдож үз

VieNeu-TTS-v2

7 өмнөх тохируулсан дуунууд (өмнөд + хойд өнгө) En-Vi код солих Дууны дуураймал (3-5с) Подкаст / олон дуут дэмжлэг График процессор шаардахгүй

Вьетнам + Англи код солих TTS 7-н өмнөх тохируулсан дуу хоолой, 0-р гүйдлийн дуу хоолойг дуурайх. CPU-ийн хэрэглээ, график процессор шаардахгүй. Name

Хурдан · CPU VRAM оролдож үз

Sesame CSM

Ярилцлага Орчин үеийн цаг Алхам Ар тал 1B параметрүүд

Уулзалтын ярианы загвар нь тохирох цаг хугацаа, мэдрэмжтэй байгалийн яриаг бий болгодог.

Удаан · 8GB VRAM оролдож үз

Chatterbox Turbo

200мс-ээс бага хугацааны хоцролт Паралингвистик тэмдгүүд 6x бодит цаг Дууны дугуй Усны тэмдэг

200мс-ийн доод хугацаатай, инээмсэглэх, ханиалгах, гэх мэт үгсийг тэмдэглэх паралингвист хэмжүүртэй хурдан Чатбокс.

Хурдан · 2GB VRAM оролдож үз

VoxCPM

Аудио Токенизаторгүй Хэл хоорондын хослол Контекст мэдрэгч LoRA нарийвчлал

Токенизаторгүй TTS нь 44.1kHz аудиог агуулга мэдрэх параграфын тогтвортой байдалтай гаргадаг.

Хурдан · 4GB VRAM оролдож үз

Kani TTS 2

3ГБ VRAM Маш хурдан Хөнгөн Нанокодек Хязгааргүй

Ultra-lightweight 400M English TTS загвар нь зөвхөн 3GB VRAM дээр ажилладаг.

Хурдан · 3GB VRAM оролдож үз

OuteTTS

CPU- ийн дүгнэлт Хөтөч Олон тооны талын програмууд Хөгжмийн профайл

LLM-ийн суурилсан TTS нь CPU, GPU, эсвэл llama.cpp болон Transformers.js-ийн браузер дээр ажилладаг.

Удаан · 2GB VRAM оролдож үз

VibeVoice

Олон дуут 90 минут хүртэл Подкаст үүсгэх Хөгжмийн зохиолч 200мс урсгал

Microsoft загвар нь подкаст болон аудио ном зэрэг олон дуут контентын урт хэлбэрийн загвар юм.

Хурдан · 4GB VRAM оролдож үз

Pocket TTS

Параметрууд CPU- ийн дүгнэлт Дууны дугуй Нэг жишээг дуурайх Хэсэгчлэн бэлэн

Kyutai-ийн 100M параметрийн загвар, нэг жишээнээс дууны клонлолт. Name

Хурдан · 1GB VRAM оролдож үз

Kitten TTS

CPU-ийн дүгнэлт 80МБ-аас бага хэмжээтэй загвар 8 доторх дуунуудName Хурд хяналт ONNX дээр суурилсан 24кГц гаралт

80MB-аас бага хэмжээтэй, маш хөнгөн TTS. График процессоргүй CPU дээр ажиллана.

Хурдан · 0GB VRAM оролдож үз

CosyVoice3

Хоёр урсгал Сэтгэл хөдлөлийн удирдлага Дууны дугуй Хурд/Дэлгэцний дуу чимээ Зааварчилгаа

Би-стриминг, сэтгэл хөдлөлийн хяналт, дууны клонлолтгүй олон хэлний дараагийн үеийн TTS.

Хурдан · 4GB VRAM оролдож үз

NAMAA Saudi TTS

Саудын Арабын хэл Шинэ үеийн стандарт араб Нууц үгийг бүү хадгалах Сэтгэл хөдлөлийн удирдлага Өөрийнх нь дуугаралт

Саудын Арабын анхны нээлттэй TTS. Саудын Арабын үндэсний хэлний Chatterbox-ийн чанартай дууны клон.

Хэмжээ · 6GB VRAM оролдож үз

Darwin TTS

Дууны дугуй Олон хэл FFN- холисон 4 үндсэн хэл Qwen3-ийн нугасны систем

Cross-modal Qwen3-TTS хувилбар нь FFN жинтэй, Qwen3-1.7B хэлний загвараас илүү нарийвчлалтай олон хэлний клонлолт хийхэд тохиромжтой.

Хэмжээ · 7GB VRAM оролдож үз

MOSS-TTSD

Олон дуут яригч 5 дуут дохио хүртэл 60мин нэгдмэл дуу Дууны дугуй Подкастын тохиргоо

Олон дуут ярианы үргэлжлэх загвар -5гар утас болон 60 минутын нийцтэй аудиотой подкаст маягийн яриа үүсгэх.

Хэмжээ · 12GB VRAM оролдож үз

Ming-Omni TTS

44. 1 кГц гаралт Дууны дугуй Сэтгэл хөдлөлийн удирдлага Диалект удирдлага БГМ үүсгэх Компакт 0. 5B

InclusionAI-ийн 0.5B олон модаль ярианы загвар, өндөр чанартай 44.1kHz-ийн гаралт, дууны 0-шот клончлол.

Хэмжээ · 3GB VRAM оролдож үз

MOSS-TTS Nano