ਮੁਫਤ AI ਪਾਠ ਤੋਂ ਬੋਲੀComment
33+ ਖੋਲ੍ਹੇ ਸਰੋਤ ਮਾਡਲ, 273+ ਆਵਾਜ਼ਾਂ, 33+ ਭਾਸ਼ਾਵਾਂ । ਕੋਈ ਅਕਾਊਂਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਬੋਲੀ AI ਲਈ ਤੁਹਾਨੂੰ ਜੋ ਵੀ ਲੋੜੀਦਾ ਹੈ
30+ ਟੂਲ ਓਪਨ-ਸੋਰਸ AI ਮਾਡਲਾਂ ਨਾਲ ਚਾਲੂ
33+ AI ਬੋਲੀ ਮਾਡਲ
ਇੱਕ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਦਾ ਸਭ ਤੋਂ ਵਿਆਪਕ ਭੰਡਾਰName
Kokoro ਮੁਫਤ
ਕੋਕੋਰੋ ਇੱਕ 82 ਮਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਵਰਗ ਤੋਂ ਉੱਪਰ ਹੈ। ਇਸ ਦੇ ਛੋਟੇ ਆਕਾਰ ਦੇ ਬਾਵਜੂਦ, ਇਹ ਬਹੁਤ ਹੀ ਕੁਦਰਤੀ ਅਤੇ ਭਾਵਪੂਰਨ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਕੋਕੋਰੋ ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ ਅਤੇ ਕੋਰੀਆਈ ਸਮੇਤ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ। ਇਹ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਤੇਜ਼ ਚੱਲਦਾ ਹੈ - GPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਤੋਂ ਲਗਭਗ 100x ਤੇਜ਼ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ।
ਇਸ ਲਈ ਵਧੀਆ: ਘੱਟੋ- ਘੱਟ ਲੈਂਟੇਸੀ ਨਾਲ ਉੱਚ ਕੁਆਲਟੀ TTS, ਸਟਰੀਮਿੰਗ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
Piper ਮੁਫਤ
ਪਾਈਪਰ ਇੱਕ ਹਲਕਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ ਰਸਸਪੀ ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ VITS ਅਤੇ ਲਾਂਰੀਕਸ ਢਾਂਚੇ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ । ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ CPU ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਜੰਤਰਾਂ, ਘਰ ਆਟੋਮੈਟਿਕ ਅਤੇ ਆਫਲਾਇਨ TTS ਦੀ ਲੋੜ ਵਾਲੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ । 30+ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ 100 ਤੋਂ ਵੱਧ ਆਵਾਜ਼ਾਂ ਨਾਲ, ਪਾਈਪਰ ਇੱਕ ਰਸਬੇਰੀ ਪੀ4 ਉੱਤੇ ਵੀ ਅਸਲੀ- ਸਮੇਂ ਦੀ ਗਤੀ ਨਾਲ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਤੁਰੰਤ ਝਲਕ, ਪਹੁੰਚਯੋਗਤਾ ਅਤੇ ਇੰਬੈੱਡ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
VITS ਮੁਫਤ
VITS (ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਨਰਮਾਈ ਵਧਾਉਣ ਵਾਲੇ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਗਿਆ ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਅਪਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀName
ਮੁਫਤ ਕੋਸ਼ਿਸ
MeloTTS ਮੁਫਤ
MyShell. ai ਵਲੋਂ MeloTTS ਇੱਕ ਬਹੁ- ਭਾਸ਼ਾ TTS ਲਾਇਬਰੇਰੀ ਹੈ, ਜੋ ਕਿ ਅੰਗਰੇਜ਼ੀ (ਅਮਰੀਕੀ, ਬ੍ਰਿਟਿਸ਼, ਭਾਰਤੀ, ਆਸਟਰੇਲੀਆਈ), ਸਪੇਨੀ, ਫਰੈਂਚ, ਚੀਨੀ, ਜਾਪਾਨੀ ਅਤੇ ਕੋਰੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਬਹੁਤ ਤੇਜ਼ ਹੈ, ਕੇਵਲ CPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਗਤੀ ਨਾਲ ਪਾਠ ਪਰੋਸੈਸ ਕਰਦਾ ਹੈ । MeloTTS ਉਤਪਾਦਨ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ CPU ਅਤੇ GPU ਦੋਹਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਉਤਪਾਦਨ ਐਪਲੀਕੇਸ਼ਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼, ਬਹੁ- ਭਾਸ਼ਾ TTS ਦੀ ਲੋੜ ਹੈName
ਮੁਫਤ ਕੋਸ਼ਿਸ
Kani TTS 2 ਮੁਫਤ
Kani- TTS-2 by NineNineSix ਇੱਕ NVIDIA NanoCodec ਨਾਲ Liquid AI LFM2 ਬੈਕਬੋਨ ਉੱਤੇ ਬਣਾਇਆ ਇੱਕ ਅਤਿ- ਹਲਕਾ 400M ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਹੈ । ਇਹ ਕੇਵਲ 3GB VRAM ਵਿੱਚ ਚੱਲਦਾ ਹੈ ਅਤੇ A100 (RTF 0.2) ਉੱਤੇ ~2 ਸੈਕਿੰਡ ਵਿੱਚ ~10 ਸਕਿੰਟ ਬੋਲੀ ਦਿੰਦਾ ਹੈ । ਮੌਜੂਦਾ ਪਬਲਿਕ ਰੀਲੀਜ਼ ਵਿੱਚ ਅੰਗਰੇਜ਼ੀ ਲਈ ਹੀ `kani- tts-2-en` ਚੈੱਕ- ਪੁਆਇੰਟ ਹੈ ਅਤੇ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਲੋੜੀਦੀ ਸਪੀਕਰ- ਇੰਬੈੱਡਿੰਗ ਹੁਕ ਨੂੰ ਐਕਸਪੋਜ਼ਰ ਨਹੀਂ ਕਰਦਾ ਹੈ — ਕਲੋਨਿੰਗ ਲਈ Chatterbox / IndexTTS2 / F5- TTS ਜਾਂ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਲਈ Kokoro / MeloTTS ਵਰਤੋਂ ।
ਇਸ ਲਈ ਵਧੀਆ: ਘੱਟ VRAM ਹਾਰਡਵੇਅਰ ਉੱਤੇ ਤੇਜ਼ ਅੰਗਰੇਜ਼ੀ ਜਨਰੇਸ਼ਨ, ਤੇਜ਼ ਝਲਕ
ਮੁਫਤ ਕੋਸ਼ਿਸ
OuteTTS ਮੁਫਤ
OuteTTS ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਸਮਰੱਥਾਵਾਂ ਨਾਲ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਅਸਲੀ ਢਾਂਚਾ ਸੰਭਾਲਦਾ ਹੈ। ਇਹ ਕਈ ਬੈਕਐਂਡਾਂ ਲਈ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ਅਤੇ Transformers. js ਰਾਹੀਂ ਬਰਾਊਜ਼ਰ ਇੰਫਰਰੇਸ਼ਨ ਵੀ ਸ਼ਾਮਲ ਹੈ। JSON ਵਜੋਂ ਸੰਭਾਲੇ ਗਏ ਸਪੀਕਰ ਪਰੋਫਾਇਲ ਰਾਹੀਂ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ।
ਇਸ ਲਈ ਵਧੀਆ: ਐਂਡ ਡਿਸਪਲੇਅ, ਬਰਾਊਜ਼ਰ ਅਧਾਰਿਤ TTS, ਘੱਟ ਸਰੋਤ ਵਾਤਾਵਰਣ
ਮੁਫਤ ਕੋਸ਼ਿਸ
Pocket TTS ਮੁਫਤ
ਕਿਊਟਾਈ (ਮੋਸ਼ੀ ਦੇ ਨਿਰਮਾਤਾ) ਵਲੋਂ ਪੌਕੇਟ TTS ਇੱਕ ਕੰਪੈਕਟ 100M ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਤੋਂ ਵੀ ਵੱਧ ਹੈ । ਇਹ CPU ਉੱਤੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਚੱਲਦਾ ਹੈ, ਇੱਕ ਆਡੀਓ ਨਮੂਨੇ ਤੋਂ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਅਤੇ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਛੋਟਾ ਮਾਡਲ ਸਾਈਜ਼ ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਅਤੇ ਘੱਟ ਸਰੋਤ ਵਾਤਾਵਰਣ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਹਲਕਾ ਡਿਸਪਲੇਅ, CPU- ਕੇਵਲ ਵਾਤਾਵਰਣ, ਤੇਜ਼ ਬੋਲੀ ਕਲੋਨਿੰਗ
ਮੁਫਤ ਕੋਸ਼ਿਸ
Kitten TTS ਮੁਫਤ
ਕਿੱਟਨ TTS by KittenML ਇੱਕ ਅਤਿ- ਹਲਕਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ONNX ਉੱਤੇ ਬਣਾਇਆ ਗਿਆ ਹੈ । 15M ਤੋਂ 80M ਪੈਰਾਮੀਟਰਾਂ (25- 80 MB ਡਿਸਕ ਉੱਤੇ) ਦੇ ਵੇਰੀਐਂਟ ਨਾਲ, ਇਹ CPU ਉੱਤੇ GPU ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਉੱਚ ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦਾ ਹੈ । 8 ਅੰਦਰੂਨੀ ਬੋਲੀਆਂ, ਅਨੁਕੂਲ ਬੋਲੀ ਗਤੀ ਅਤੇ ਅੰਕ, ਮੁਦਰਾ ਅਤੇ ਇਕਾਈਆਂ ਲਈ ਅੰਦਰੂਨੀ ਟੈਕਸਟ ਪ੍ਰੀ- ਪਰੋਸੈਸਿੰਗ ਹੈ । ਐਡਜਸਟਮੈਂਟ ਅਤੇ ਘੱਟ- ਲਾਈਟਨਸੀ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਆਦਰਸ਼ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਤੇਜ਼ ਹਲਕਾ TTS, ਐਂਡ ਡਿਸਪਲੇਅ, ਘੱਟ- ਲਾਈਟਨਸੀ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
Ming-Omni TTS ਮੁਫਤ
inclusionAI ਵਲੋਂ Ming-omni-tts-0.5B ਇੱਕ ਕੰਪੈਕਟ ਓਮਨੀ-ਮੋਡਲ ਸਪੀਚ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ BailingMM ਦੇ ਘਣ ਬੈਕਬੋਨ ਉੱਤੇ ਪੈਚ-ਬਾਈ-ਪੈਚ ਫਲੋ-ਮੈਚਿੰਗ ਆਡੀਓ ਡੀਕੋਡਰ ਨਾਲ ਬਣਾਇਆ ਗਿਆ ਹੈ । ਇਹ 44.1kHz ਆਉਟਪੁੱਟ (CD ਕੁਆਲਟੀ ਦੇ ਨੇੜੇ) ਦਿੰਦਾ ਹੈ, 3+ ਸਕਿੰਟ ਦੇ ਹਵਾਲੇ ਤੋਂ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਅਤੇ JSON ਨਿਰਦੇਸ਼ਾਂ ਰਾਹੀਂ ਅੰਦਰੂਨੀ ਭਾਵਨਾ / ਬੋਲੀ / BGM ਕੰਟਰੋਲ ਸ਼ਾਮਲ ਹੈ । ਚੀਨੀ ਬੈਂਕਮਾਰਕਾਂ ਉੱਤੇ ਸ਼ਾਨਦਾਰ ਸਥਿਰਤਾ — 0.83% WER ।
ਇਸ ਲਈ ਵਧੀਆ: ਉੱਚ- ਗੁਣਵੱਤਾ ਦੋ- ਭਾਸ਼ਾ ਰਚਨਾ, ਭਾਵਨਾ- ਕੰਟਰੋਲ ਵੋਇਸ ਐਕਸ਼ਨ, ਚੀਨੀ ਆਡੀਓਬੁੱਕ ਸਮੱਗਰੀ
ਮੁਫਤ ਕੋਸ਼ਿਸ
MOSS-TTS Nano ਮੁਫਤ
MOSS-TTS-Nano-100M MOSS-TTS ਪਰਿਵਾਰ ਦਾ OpenMOSS ਦਾ ਕੰਪੈਕਟ 100M-ਪਰਾਮੀਟਰ ਵੇਰੀਐਂਟ ਹੈ, ਜੋ ਕਿ ਦੇਰੀ-ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਸਾਂਝਾ ਕਰਦਾ ਹੈ। 8B ਮਾਡਲ ਦੀ ਉੱਚ ਕੁਆਲਟੀ ਨੂੰ ~80x ਛੋਟੇ ਭਾਰ ਅਤੇ ਦਰਮਿਆਨੇ ਪ੍ਰਤੀ-ਜਾਚ VRAM ਲਈ ਬਦਲਦਾ ਹੈ, ਜੋ ਕਿ ਮੁਫਤ-ਟਾਇਰ ਅਤੇ ਉੱਚ-ਥ੍ਰੂਪੁੱਟ ਡਿਸਪਲੇਅ ਲਈ ਢੁਕਵਾਂ ਹੈ। ਇੱਕੋ 20-ਭਾਸ਼ਾ ਪਹੁੰਚ ਹੈ।
ਇਸ ਲਈ ਵਧੀਆ: ਮੁਫਤ- ਪੱਧਰ TTS, ਉੱਚ- ਮਾਤਰਾ ਉਤਪਾਦਨ, ਘੱਟ- ਲੈਂਟੀਸੀ ਇੰਟਰਐਕਟਿਵ ਵਰਤੋਂ
ਮੁਫਤ ਕੋਸ਼ਿਸ
Bark ਸਟੈਂਡਰਡ
ਟਰਾਂਸਫਾਰਮਰ ਅਧਾਰਿਤ ਪਾਠ- ਤੋਂ- ਆਡੀਓ ਮਾਡਲ, ਜੋ ਕਿ ਅਸਲੀ ਬੋਲੀ, ਸੰਗੀਤ ਅਤੇ ਸਾਊਂਡ ਪਰਭਾਵ ਪੈਦਾ ਕਰਦਾ ਹੈ । Name
ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Bark Small ਸਟੈਂਡਰਡ
ਬਰਕ ਦਾ ਹਲਕਾ ਵਰਜਨ ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਅਤੇ ਘੱਟ ਮੈਮੋਰੀ ਵਰਤੋਂ ਨਾਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice 2 ਸਟੈਂਡਰਡ
ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।
ਡਿਵੈਲਪਰ: Alibaba (Tongyi Lab) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Dia TTS ਸਟੈਂਡਰਡ
ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਪੈਦਾ ਕਰਨ ਵਾਲਾ ਮਾਡਲ, ਜੋ ਕਿ ਸਪੀਕਰ ਦਰਮਿਆਨ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਬਣਾਉਂਦਾ ਹੈ ।
ਡਿਵੈਲਪਰ: Nari Labs · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Parler TTS ਸਟੈਂਡਰਡ
ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਆਪਣੀ ਪਸੰਦ ਦੀ ਆਵਾਜ਼ ਦੱਸੋ ਅਤੇ ਪਾਰਲਰ ਮੇਲ ਖਾਂਦਾ ਬੋਲ ਤਿਆਰ ਕਰੇਗਾ ।
ਡਿਵੈਲਪਰ: Hugging Face · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
IndexTTS-2 ਸਟੈਂਡਰਡ
ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।
ਡਿਵੈਲਪਰ: Index Team · ਲਾਈਸੈਂਸ: Bilibili Model License
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Spark TTS ਸਟੈਂਡਰਡ
ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name
ਡਿਵੈਲਪਰ: SparkAudio · ਲਾਈਸੈਂਸ: CC BY-NC-SA 4.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
GPT-SoVITS ਸਟੈਂਡਰਡ
ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।
ਡਿਵੈਲਪਰ: RVC-Boss · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Orpheus ਸਟੈਂਡਰਡ
100K ਘੰਟੇ ਬੋਲੀ ਡਾਟਾ ਉੱਤੇ ਟਰੇਨ ਕੀਤਾ ਮਨੁੱਖੀ- ਪੱਧਰ ਦਾ ਭਾਵਨਾਤਮਕ TTS ਮਾਡਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Canopy Labs · ਲਾਈਸੈਂਸ: Llama 3.2 Community
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Qwen3 TTS ਸਟੈਂਡਰਡ
ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਪਹਿਲਾਂ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਪਾਠ ਤੋਂ ਆਵਾਜ਼ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Alibaba (Qwen) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
VieNeu-TTS-v2 ਸਟੈਂਡਰਡ
ਵੀਅਤਨਾਮੀ + ਅੰਗਰੇਜ਼ੀ ਕੋਡ- ਸਵਿੱਚਿੰਗ TTS7ਪ੍ਰੀ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ । ਕੇਵਲ CPU, ਕੋਈ GPU ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਡਿਵੈਲਪਰ: Phạm Nguyễn Ngọc Bảo · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Chatterbox Turbo ਸਟੈਂਡਰਡ
ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।
ਡਿਵੈਲਪਰ: Resemble AI · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
VoxCPM ਸਟੈਂਡਰਡ
Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName
ਡਿਵੈਲਪਰ: OpenBMB · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
VibeVoice ਸਟੈਂਡਰਡ
ਪੋਡਕਾਸਟ ਅਤੇ ਆਡੀਓਬੁੱਕਾਂ ਵਰਗੇ ਲੰਬੇ-ਫਾਰਮ ਮਲਟੀ-ਸਪੀਕਰ ਸਮੱਗਰੀ ਲਈ Microsoft ਮਾਡਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Microsoft · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice3 ਸਟੈਂਡਰਡ
ਅਗਲੀ ਪੀੜ੍ਹੀ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬਾਈ-ਸਟਰੀਮਿੰਗ, ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ।
ਡਿਵੈਲਪਰ: Alibaba (FunAudioLLM) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
NAMAA Saudi TTS ਸਟੈਂਡਰਡ
ਪਹਿਲਾ ਖੋਲ੍ਹਿਆ ਸਊਦੀ- ਅਰਬੀ TTS । ਚੈਟਰਬਾਕਸ- ਕੁਆਲਟੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਊਦੀ ਭਾਸ਼ਾ ।
ਡਿਵੈਲਪਰ: NAMAA Space · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Darwin TTS ਸਟੈਂਡਰਡ
FFN ਭਾਰ ਨਾਲ ਕ੍ਰਾਸ- ਮੋਡਲ Qwen3- TTS ਵੇਰੀਐਂਟ, Qwen3- 1. 7B ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਹੁ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਲਈ ਮਿਲਾਇਆ ਗਿਆ ਹੈ ।
ਡਿਵੈਲਪਰ: FINAL-Bench · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
MOSS-TTSD ਸਟੈਂਡਰਡ
ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਜਾਰੀ ਰੱਖਣ ਮਾਡਲ -5ਸਪੀਕਰ ਅਤੇ 60 ਮਿੰਟ ਦੇ ਸਹਿਜ ਆਡੀਓ ਨਾਲ ਪੋਡਕਾਸਟ-ਸਟਾਈਲ ਗੱਲਬਾਤ ਬਣਾਓ।
ਡਿਵੈਲਪਰ: OpenMOSS · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice 2
ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, de, it, es
ਕਲੋਨ ਆਵਾਜ਼
IndexTTS-2
ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
Spark TTS
ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
GPT-SoVITS
ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko
ਕਲੋਨ ਆਵਾਜ਼
Chatterbox
ਰੀਸਿਮਬਿਲ AI ਤੋਂ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਸਟੇਟ-ਆਫ-ਦਿ-ਆਰਟ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਵੌਇਸ ਕਲੋਨਿੰਗ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
Tortoise TTS
ਮਲਟੀ-ਵਾਇਸ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਆਟੋ-ਰਿਗਰੈੱਸਿਵ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਕੁਆਲਟੀ ਉੱਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
OpenVoice
ਸਟਾਈਲ, ਭਾਵਨਾ ਅਤੇ ਅੱਖਰਾਂ ਉੱਤੇ ਗਰਾਨੀਕਲ ਕੰਟਰੋਲ ਨਾਲ ਤੁਰੰਤ ਬੋਲੀ ਕਲੋਨਿੰਗ । Name
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, es
ਕਲੋਨ ਆਵਾਜ਼
VieNeu-TTS-v2
ਵੀਅਤਨਾਮੀ + ਅੰਗਰੇਜ਼ੀ ਕੋਡ- ਸਵਿੱਚਿੰਗ TTS7ਪ੍ਰੀ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ । ਕੇਵਲ CPU, ਕੋਈ GPU ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: vi, en
ਕਲੋਨ ਆਵਾਜ਼
Chatterbox Turbo
ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
VoxCPM
Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
OuteTTS
LLM ਅਧਾਰਿਤ TTS, ਜੋ ਕਿ CPU, GPU, ਜਾਂ ਝਲਕਾਰਾ ਉੱਤੇ llama. cpp ਅਤੇ Transformers. js ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
Pocket TTS
ਇੱਕ ਸੈਂਪਲ ਤੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਕਿਊਟਾਈ ਵਲੋਂ ਹਲਕਾ 100M ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਹੈ । Name
ਭਾਸ਼ਾਵਾਂ: en, fr
ਕਲੋਨ ਆਵਾਜ਼
CosyVoice3
ਅਗਲੀ ਪੀੜ੍ਹੀ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬਾਈ-ਸਟਰੀਮਿੰਗ, ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, de, es, fr, it, ru
ਕਲੋਨ ਆਵਾਜ਼
NAMAA Saudi TTS
ਪਹਿਲਾ ਖੋਲ੍ਹਿਆ ਸਊਦੀ- ਅਰਬੀ TTS । ਚੈਟਰਬਾਕਸ- ਕੁਆਲਟੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਊਦੀ ਭਾਸ਼ਾ ।
ਭਾਸ਼ਾਵਾਂ: ar
ਕਲੋਨ ਆਵਾਜ਼
Darwin TTS
FFN ਭਾਰ ਨਾਲ ਕ੍ਰਾਸ- ਮੋਡਲ Qwen3- TTS ਵੇਰੀਐਂਟ, Qwen3- 1. 7B ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਹੁ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਲਈ ਮਿਲਾਇਆ ਗਿਆ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en, ko, ja, zh
ਕਲੋਨ ਆਵਾਜ਼
MOSS-TTSD
ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਜਾਰੀ ਰੱਖਣ ਮਾਡਲ -5ਸਪੀਕਰ ਅਤੇ 60 ਮਿੰਟ ਦੇ ਸਹਿਜ ਆਡੀਓ ਨਾਲ ਪੋਡਕਾਸਟ-ਸਟਾਈਲ ਗੱਲਬਾਤ ਬਣਾਓ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
Ming-Omni TTS
inclusionAI ਤੋਂ ਉੱਚ- ਭਰੋਸੇਯੋਗਤਾ 44. 1kHz ਆਉਟਪੁੱਟ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ ਕੰਪੈਕਟ 0. 5B ਓਮਨੀ- ਮੋਡਲ ਬੋਲੀ ਮਾਡਲ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
MOSS-TTS Nano
ਛੋਟਾ 100M MOSS-TTS ਵੇਰੀਐਂਟ - ਇੱਕੋ ਢਾਂਚਾ, 80x ਛੋਟਾ, ਮੁਫਤ-ਟਾਇਰ ਲੈਟੇਸੀ।
ਭਾਸ਼ਾਵਾਂ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
ਕਲੋਨ ਆਵਾਜ਼ਡਿਵੈਲਪਰ- ਪਹਿਲਾਂ API
OpenAI- ਅਨੁਕੂਲ REST API । ਇੱਕ ਅੰਤ- ਬਿੰਦੂ, 22+ ਮਾਡਲ । ਰੀਅਲ- ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ ।
- OpenAI- ਅਨੁਕੂਲ ਫਾਰਮੈਟ
- ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ TTS ਸਟਰੀਮਿੰਗ
- ਵੱਡੇ ਕੰਮਾਂ ਲਈ ਬੈਚ ਪਰੋਸੈਸ
- ਵੈੱਬਹੁੱਕ ਨੋਟੀਫਿਕੇਸ਼ਨ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ਸਧਾਰਨ, ਪਾਰਦਰਸ਼ੀ ਕੀਮਤ
ਮੁਫਤ ਸ਼ੁਰੂ ਕਰੋ । ਜਿਵੇਂ ਤੁਸੀਂ ਵਧਦੇ ਹੋ ਸਕੇਲ ਕਰੋ ।
ਮੁਫਤ
15,000 ਅੱਖਰ + 5,000/ਦਿਨ
- ਕੋਕੋਰੋ ਸਮੇਤ7ਮੁਫ਼ਤ ਮਾਡਲ
- 5,000 ਅੱਖਰ ਪ੍ਰਤੀ ਜਨਰੇਸ਼ਨ
- API ਪਹੁੰਚ ਸ਼ਾਮਲ
ਪਰੋ
2,000 ਕਰੈਡਿਟ/ਮਹੀਨਾ
- ਸਟਾਰਟਅੱਪ ਵਿੱਚ ਸਭ
- API ਪਹੁੰਚ
- ਤਰਜੀਹ ਪਰੋਸੈਸਿੰਗ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
ਅਸੀਂ ਕੀ ਸੁਧਾਰ ਕਰ ਸਕਦੇ ਹਾਂ? ਤੁਹਾਡੀ ਟਿੱਪਣੀ ਸਾਨੂੰ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।
AI ਬੋਲੀ ਅੱਜ ਵਰਤੋਂ ਸ਼ੁਰੂ ਕਰੋ
TTS.ai ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਰਚਨਾਕਾਰਾਂ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਕਾਰੋਬਾਰਾਂ ਨਾਲ ਜੁੜੋ