ਮੁਫਤ AI ਪਾਠ ਤੋਂ ਬੋਲੀComment

82M ਪੈਰਾਮੀਟਰ ਅਤਿ ਤੇਜ਼ ਭਾਵਨਾਤਮਕ ਆਵਾਜ਼ਾਂ ਬਹੁ- ਭਾਸ਼ਾ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ

ਹਲਕਾ 82M ਪੈਰਾਮੀਟਰ ਮਾਡਲ, ਜੋ ਕਿ ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਬੋਲੀ ਅਤੇ ਤੇਜ਼ ਇੰਫਰਰੇਸ਼ਨ ਦਿੰਦਾ ਹੈ ।

ਸਥਿਰ · 1.5GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Piper

CPU- ਮਿੱਤਰ ਆਫਲਾਇਨ ਸਮਰਥਿਤ 100+ ਆਵਾਜ਼ਾਂ 35+ ਭਾਸ਼ਾਵਾਂ SSML ਸਹਿਯੋਗ

ਇੱਕ ਤੇਜ਼, ਲੋਕਲ ਨਯੂਰਲ ਪਾਠ ਤੋਂ ਬੋਲੀ ਸਿਸਟਮ, ਜੋ ਕਿ ਰਸਬੇਰੀ ਪੀ ਅਤੇ ਇੰਬੈੱਡ ਜੰਤਰਾਂ ਲਈ ਅਨੁਕੂਲ ਹੈ । Name

ਸਥਿਰ · 0 (CPU only) VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

VITS

ਅੰਤ- ਤੋਂ- ਅੰਤ ਸੰਸਲੇਸ਼ਣ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਕਈ ਸਪੀਕਰ

ਅੰਤ- ਤੋਂ- ਅੰਤ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ ਨਾਲ ਸ਼ਰਤਿਤ ਵੇਰੀਏਸ਼ਨਲ ਆਟੋ- ਇੰਕੋਡਰ ਹੈ ।

ਸਥਿਰ · 1GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

MeloTTS

CPU- ਅਨੁਕੂਲ ਬਹੁ- ਭਾਸ਼ਾ ਕਈ ਇਕਸਟੈਨਸ਼ਨ ਉਤਪਾਦਨ- ਤਿਆਰ ਘੱਟ ਲੇਟੈਂਸੀ

ਉੱਚ ਕੁਆਲਟੀ ਬਹੁ- ਭਾਸ਼ਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ, ਜੋ ਕਿ ਘੱਟੋ- ਘੱਟ ਲੋਡ ਨਾਲ CPU ਉੱਤੇ ਚੱਲਦਾ ਹੈ । Name

ਸਥਿਰ · 0.5GB (GPU optional) VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Bark

ਸਾਊਂਡ ਪਰਭਾਵ ਹੱਸਣਾ/ਸੁਣਨਾ ਸੰਗੀਤ ਨਿਰਮਾਣ 100+ ਸਪੀਕਰ ਬਹੁ- ਭਾਸ਼ਾ

ਟਰਾਂਸਫਾਰਮਰ ਅਧਾਰਿਤ ਪਾਠ- ਤੋਂ- ਆਡੀਓ ਮਾਡਲ, ਜੋ ਕਿ ਅਸਲੀ ਬੋਲੀ, ਸੰਗੀਤ ਅਤੇ ਸਾਊਂਡ ਪਰਭਾਵ ਪੈਦਾ ਕਰਦਾ ਹੈ । Name

ਹੌਲੀ · 5GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Bark Small

ਹਲਕਾ ਪੂਰੀ ਬਾਰਕ ਤੋਂ ਤੇਜ਼ ਭਾਵਨਾਤਮਕ ਬੋਲੀ ਬਹੁ- ਭਾਸ਼ਾ

ਬਰਕ ਦਾ ਹਲਕਾ ਵਰਜਨ ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਅਤੇ ਘੱਟ ਮੈਮੋਰੀ ਵਰਤੋਂ ਨਾਲ ਹੈ ।

ਮੀਡਿਆ · 2GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

CosyVoice 2

ਸਟਰੀਮਿੰਗ ਜ਼ੀਰੋ- ਸ਼ਾਟ ਕਲੋਨਿੰਗ ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਮਨੁੱਖੀ- ਸਮਾਨਤਾ

ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।

Dia TTS

ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਬਣਾਇਆ ਕੁਦਰਤੀ ਤਰੱਕੀ ਈਮੋਸ਼ਨਲ ਐਕਸਪ੍ਰੈਸ਼ਨ 1.6B ਪੈਰਾਮੀਟਰ

ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਪੈਦਾ ਕਰਨ ਵਾਲਾ ਮਾਡਲ, ਜੋ ਕਿ ਸਪੀਕਰ ਦਰਮਿਆਨ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਬਣਾਉਂਦਾ ਹੈ ।

Parler TTS

ਆਵਾਜ਼ ਵੇਰਵਾ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਕੰਟਰੋਲ ਲਚਕਦਾਰ ਆਵਾਜ਼ ਬਣਾਉਣਾ ਕੋਈ ਪ੍ਰੀ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਲੋੜੀਦੀਆਂ ਨਹੀਂ

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਆਪਣੀ ਪਸੰਦ ਦੀ ਆਵਾਜ਼ ਦੱਸੋ ਅਤੇ ਪਾਰਲਰ ਮੇਲ ਖਾਂਦਾ ਬੋਲ ਤਿਆਰ ਕਰੇਗਾ ।

Indic Parler TTS

ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਆਵਾਜ਼ ਵੇਰਵਾ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਕੰਟਰੋਲ ਅਸਲੀ ਭਾਰਤੀ ਉਚਾਰਨ

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਬੋਲੀ ਕੰਟਰੋਲ ਨਾਲ 8+ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲੀ ਬੋਲੀ।

ਹੌਲੀ · 8GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

KhanomTan TTS

ਥਾਈ TTS ਕਈ ਸਪੀਕਰ YourTTS ਆਰਕੀਟੈਕਚਰ ਵਪਾਰਕ- ਸੁਰੱਖਿਅਤ ਲਾਈਸੈਂਸ

ਥਾਈ- ਪਹਿਲਾ ਟੈਕਸਟ- ਤੋਂ- ਬੋਲੀ ਇੱਕ ਚੋਣ ਬੋਲਣ ਵਾਲੀਆਂ ਆਵਾਜ਼ਾਂ ਨਾਲ ਹੈ । Name

ਸਥਿਰ · 2GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

IndexTTS-2

ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਜ਼ੀਰੋ- ਸ਼ਾਟ ਈਮੋਸ਼ਨ ਵੈਕਟਰ ਭਾਵਪੂਰਤ ਬੋਲੀ ਫਾਈਨ- ਗ੍ਰੇਨਡ ਕੰਟਰੋਲ

ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।

Spark TTS

ਬੋਲੀ ਕਲੋਨਿੰਗ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਸਟਾਈਲ ਕੰਟਰੋਲ ਪ੍ਰਸ਼ਨ- ਅਧਾਰਿਤ 5- ਸਕਿੰਟ ਕਲੋਨਿੰਗ

ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name

GPT-SoVITS

5- ਸਕਿੰਟ ਕਲੋਨਿੰਗ ਗਾਉਣ ਵਾਲੀ ਆਵਾਜ਼ ਕੁਝ- ਛਾਪੇ ਸਿੱਖਣਾ ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ ਕ੍ਰਾਸ- ਭਾਸ਼ਾ

ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।

ਹੌਲੀ · 6GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Orpheus

ਮਨੁੱਖੀ- ਪੱਧਰ ਦੀ ਭਾਵਨਾ 100K ਘੰਟੇ ਟਰੇਨਿੰਗ ਕੁਦਰਤੀ ਹਾਈਲਾਈਟ ਭਾਵਪੂਰਤ ਬੋਲੀ

100K ਘੰਟੇ ਬੋਲੀ ਡਾਟਾ ਉੱਤੇ ਟਰੇਨ ਕੀਤਾ ਮਨੁੱਖੀ- ਪੱਧਰ ਦਾ ਭਾਵਨਾਤਮਕ TTS ਮਾਡਲ ਹੈ ।

Chatterbox

ਜ਼ੀਰੋ-ਸ਼ੋਟ ਕਲੋਨਿੰਗ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ ਸਟਾਈਲ ਟਰਾਂਸਫਰ ਇੱਕਲਾ ਸੈਂਪਲ ਕਲੋਨਿੰਗ

ਰੀਸਿਮਬਿਲ AI ਤੋਂ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਸਟੇਟ-ਆਫ-ਦਿ-ਆਰਟ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਵੌਇਸ ਕਲੋਨਿੰਗ।

Tortoise TTS

ਸਭ ਤੋਂ ਉੱਚੀ ਕੁਆਲਟੀ ਬਹੁ- ਆਵਾਜ਼ DALL- E ਆਰਕੀਟੈਕਚਰ ਬੋਲੀ ਕਲੋਨਿੰਗ ਆਟੋ- ਰਿਗਰੈਸ਼ਨ

ਮਲਟੀ-ਵਾਇਸ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਆਟੋ-ਰਿਗਰੈੱਸਿਵ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਕੁਆਲਟੀ ਉੱਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ।

ਹੌਲੀ · 8GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

StyleTTS 2

ਮਨੁੱਖੀ- ਪੱਧਰ ਸਟਾਈਲ ਡਿਫਿਊਜ਼ਨ ਮੁਕਾਬਲਾ ਟਰੇਨਿੰਗ ਕੁਦਰਤੀ ਵੇਰੀਏਸ਼ਨ ਉੱਚ ਭਰੋਸੇਯੋਗਤਾ

ਸਟਾਈਲ ਪ੍ਰਸਾਰ ਅਤੇ ਵਿਰੋਧੀ ਟ੍ਰੇਨਿੰਗ ਰਾਹੀਂ ਮਨੁੱਖੀ ਪੱਧਰ ਦਾ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ।

OpenVoice

ਤੁਰੰਤ ਕਲੋਨਿੰਗ ਬੋਲੀ ਬਦਲੋ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਐਕਸੈਂਟ ਕੰਟਰੋਲ ਬਹੁ- ਭਾਸ਼ਾ

ਸਟਾਈਲ, ਭਾਵਨਾ ਅਤੇ ਅੱਖਰਾਂ ਉੱਤੇ ਗਰਾਨੀਕਲ ਕੰਟਰੋਲ ਨਾਲ ਤੁਰੰਤ ਬੋਲੀ ਕਲੋਨਿੰਗ । Name

Qwen3 TTS

9 ਪਹਿਲਾਂ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਪਾਠ ਤੋਂ ਬੋਲੀ ਡਿਜ਼ਾਈਨ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਭਾਸ਼ਾਵਾਂ

ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਪਹਿਲਾਂ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਪਾਠ ਤੋਂ ਆਵਾਜ਼ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ ।

ਮੀਡਿਆ · 7GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

VieNeu-TTS-v2

7 ਪਹਿਲਾਂ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ (ਉੱਤਰ + ਦੱਖਣੀ ਇਕਸਟੈਨਸ਼ਨ) En-Vi ਕੋਡ-ਸਵਿੱਚਿੰਗ ਬੋਲੀ ਕਲੋਨਿੰਗ (3-5ਸਕਿੰਟ ਹਵਾਲਾ) ਪੋਡਕਾਸਟ / ਬਹੁ- ਸਪੀਕਰ ਸਹਿਯੋਗ ਕੇਵਲ CPU — ਕੋਈ GPU ਲੋੜੀਦੀ ਨਹੀਂ

ਵੀਅਤਨਾਮੀ + ਅੰਗਰੇਜ਼ੀ ਕੋਡ- ਸਵਿੱਚਿੰਗ TTS7ਪ੍ਰੀ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ । ਕੇਵਲ CPU, ਕੋਈ GPU ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।

ਸਥਿਰ · CPU VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Sesame CSM

ਸੰਵਾਦ ਕੁਦਰਤੀ ਸਮਾਂ ਤਰੱਕੀ ਬੈਕ- ਚੈਨਲ 1B ਪੈਰਾਮੀਟਰ

ਸੰਵਾਦੀ ਬੋਲੀ ਦਾ ਮਾਡਲ, ਜੋ ਕਿ ਸਹੀ ਸਮੇਂ ਅਤੇ ਭਾਵਨਾ ਨਾਲ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਪੈਦਾ ਕਰਦਾ ਹੈ।

ਹੌਲੀ · 8GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Chatterbox Turbo

ਸਬ- 200ms ਲੈਂਟੀਟੀ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ 6x ਰੀਅਲ- ਟਾਈਮ ਬੋਲੀ ਕਲੋਨਿੰਗ ਵਾਟਰਮਾਰਕ

ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।

ਸਥਿਰ · 2GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

VoxCPM

44. 1kHz ਆਡੀਓ ਟੋਕਨਾਈਜ਼ਰ- ਮੁਕਤ ਕ੍ਰਾਸ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਪਰਸੰਗ- ਸੰਵੇਦਨਸ਼ੀਲ LoRA ਫਿਨ- ਟੁਨਿੰਗ

Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName

ਸਥਿਰ · 4GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Kani TTS 2

3GB VRAM ਅਤਿ ਤੇਜ਼ ਹਲਕਾ ਨਾਨੋ- ਕੋਡੈਕ ਮੁਫਤ

ਅਤਿ-ਹਲਕਾ 400M ਅੰਗਰੇਜ਼ੀ TTS ਮਾਡਲ, ਜੋ ਕਿ ਸਿਰਫ਼ 3GB VRAM ਵਿੱਚ ਚੱਲਦਾ ਹੈ।

ਸਥਿਰ · 3GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

OuteTTS

CPU ਅੰਦਾਜ਼ਾ ਬਰਾਊਜ਼ਰ ਅੰਦਾਜ਼ਾ ਕਈ ਬੈਕਐਂਡ ਸਪੀਕਰ ਪਰੋਫਾਇਲ

LLM ਅਧਾਰਿਤ TTS, ਜੋ ਕਿ CPU, GPU, ਜਾਂ ਝਲਕਾਰਾ ਉੱਤੇ llama. cpp ਅਤੇ Transformers. js ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ ।

ਹੌਲੀ · 2GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

VibeVoice

ਬਹੁ- ਸਪੀਕਰ 90 ਮਿੰਟ ਤੱਕ ਪੋਡਕਾਸਟ ਬਣਾਇਆ ਸਪੀਕਰ ਸਥਿਰਤਾ 200ms ਸਟਰੀਮਿੰਗ

ਪੋਡਕਾਸਟ ਅਤੇ ਆਡੀਓਬੁੱਕਾਂ ਵਰਗੇ ਲੰਬੇ-ਫਾਰਮ ਮਲਟੀ-ਸਪੀਕਰ ਸਮੱਗਰੀ ਲਈ Microsoft ਮਾਡਲ ਹੈ ।

ਸਥਿਰ · 4GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Pocket TTS

100M ਪੈਰਾਮੀਟਰ CPU ਅੰਦਾਜ਼ਾ ਬੋਲੀ ਕਲੋਨਿੰਗ ਇੱਕ- ਸੈਂਪਲ ਕਲੋਨਿੰਗ ਐਂਡ- ਤਿਆਰ

ਇੱਕ ਸੈਂਪਲ ਤੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਕਿਊਟਾਈ ਵਲੋਂ ਹਲਕਾ 100M ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਹੈ । Name

ਸਥਿਰ · 1GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Kitten TTS

ਕੇਵਲ CPU- ਹੀ ਅੰਦਾਜ਼ਾ 80MB ਤੋਂ ਘੱਟ ਮਾਡਲ ਸਾਈਜ਼ 8 ਅੰਦਰੂਨੀ ਆਵਾਜ਼ਾਂ ਸਪੀਡ ਕੰਟਰੋਲ ONNX ਅਧਾਰਿਤ 24kHz ਆਉਟਪੁੱਟ

80MB ਤੋਂ ਘੱਟ ਅਤਿ- ਹਲਕਾ TTS । CPU ਉੱਤੇ GPU ਬਿਨਾਂ ਚੱਲਦਾ ਹੈ ।

ਸਥਿਰ · 0GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

CosyVoice3

ਦੋਹਰੀ- ਸਟਰੀਮਿੰਗ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਬੋਲੀ ਕਲੋਨਿੰਗ ਸਪੀਡ/ਵੋਲਟੇਜ ਕੰਟਰੋਲ ਨਿਰਦੇਸ਼ ਹੇਠਾਂ

ਅਗਲੀ ਪੀੜ੍ਹੀ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬਾਈ-ਸਟਰੀਮਿੰਗ, ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ।

ਸਥਿਰ · 4GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

NAMAA Saudi TTS

ਸਊਦੀ ਅਰਬੀ ਡਾਇਲੇਕਟ ਨਵਾਂ ਸਟੈਂਡਰਡ ਅਰਬੀ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਮਾਂ- ਬੋਲੀ ਉਚਾਰਨ

ਪਹਿਲਾ ਖੋਲ੍ਹਿਆ ਸਊਦੀ- ਅਰਬੀ TTS । ਚੈਟਰਬਾਕਸ- ਕੁਆਲਟੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਊਦੀ ਭਾਸ਼ਾ ।

ਮੀਡਿਆ · 6GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Darwin TTS

ਬੋਲੀ ਕਲੋਨਿੰਗ ਕ੍ਰਾਸ- ਭਾਸ਼ਾ FFN- ਬਲੈਂਡਡ 4 ਕੋਰ ਭਾਸ਼ਾਵਾਂ Qwen3 ਬੈਕਬੋਨ

FFN ਭਾਰ ਨਾਲ ਕ੍ਰਾਸ- ਮੋਡਲ Qwen3- TTS ਵੇਰੀਐਂਟ, Qwen3- 1. 7B ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਹੁ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਲਈ ਮਿਲਾਇਆ ਗਿਆ ਹੈ ।

ਮੀਡਿਆ · 7GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

MOSS-TTSD

ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ 5 ਸਪੀਕਰ ਤੱਕ 60min ਕੋਹਰੇਂਟ ਆਡੀਓ ਬੋਲੀ ਕਲੋਨਿੰਗ ਪੋਡਕਾਸਟ ਅਨੁਕੂਲਤਾ

ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਜਾਰੀ ਰੱਖਣ ਮਾਡਲ -5ਸਪੀਕਰ ਅਤੇ 60 ਮਿੰਟ ਦੇ ਸਹਿਜ ਆਡੀਓ ਨਾਲ ਪੋਡਕਾਸਟ-ਸਟਾਈਲ ਗੱਲਬਾਤ ਬਣਾਓ।

ਮੀਡਿਆ · 12GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

Ming-Omni TTS

44. 1kHz ਆਉਟਪੁੱਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਈਮੋਸ਼ਨ ਕੰਟਰੋਲ ਡਾਇਲੇਕਟ ਕੰਟਰੋਲ BGM ਜਨਰੇਸ਼ਨ ਕੰਪੈਕਟ 0. 5B

inclusionAI ਤੋਂ ਉੱਚ- ਭਰੋਸੇਯੋਗਤਾ 44. 1kHz ਆਉਟਪੁੱਟ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ ਕੰਪੈਕਟ 0. 5B ਓਮਨੀ- ਮੋਡਲ ਬੋਲੀ ਮਾਡਲ ਹੈ ।

ਮੀਡਿਆ · 3GB VRAM ਕੋਸ਼ਿਸ਼ ਕਰੋ

MOSS-TTS Nano