ਮੁਫਤ AI ਪਾਠ ਤੋਂ ਬੋਲੀComment

33+ ਖੋਲ੍ਹੇ ਸਰੋਤ ਮਾਡਲ, 273+ ਆਵਾਜ਼ਾਂ, 33+ ਭਾਸ਼ਾਵਾਂ । ਕੋਈ ਅਕਾਊਂਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।

18K+
ਨਿਰਮਾਤਾ
72K+
ਪੀੜ੍ਹੀਆਂ
33+
AI ਮਾਡਲ
273+
ਆਵਾਜ਼ਾਂ
TTS.ai ਪਸੰਦ ਹੈ? ਆਪਣੇ ਦੋਸਤਾਂ ਨੂੰ ਦੱਸੋ!

ਬੋਲੀ AI ਲਈ ਤੁਹਾਨੂੰ ਜੋ ਵੀ ਲੋੜੀਦਾ ਹੈ

30+ ਟੂਲ ਓਪਨ-ਸੋਰਸ AI ਮਾਡਲਾਂ ਨਾਲ ਚਾਲੂ

33+ AI ਬੋਲੀ ਮਾਡਲ

ਇੱਕ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਦਾ ਸਭ ਤੋਂ ਵਿਆਪਕ ਭੰਡਾਰName

KokoroKokoro ਮੁਫਤ

ਕੋਕੋਰੋ ਇੱਕ 82 ਮਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਵਰਗ ਤੋਂ ਉੱਪਰ ਹੈ। ਇਸ ਦੇ ਛੋਟੇ ਆਕਾਰ ਦੇ ਬਾਵਜੂਦ, ਇਹ ਬਹੁਤ ਹੀ ਕੁਦਰਤੀ ਅਤੇ ਭਾਵਪੂਰਨ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਕੋਕੋਰੋ ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ ਅਤੇ ਕੋਰੀਆਈ ਸਮੇਤ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ। ਇਹ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਤੇਜ਼ ਚੱਲਦਾ ਹੈ - GPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਤੋਂ ਲਗਭਗ 100x ਤੇਜ਼ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ।

ਇਸ ਲਈ ਵਧੀਆ: ਘੱਟੋ- ਘੱਟ ਲੈਂਟੇਸੀ ਨਾਲ ਉੱਚ ਕੁਆਲਟੀ TTS, ਸਟਰੀਮਿੰਗ ਐਪਲੀਕੇਸ਼ਨName

ਮੁਫਤ ਕੋਸ਼ਿਸ

PiperPiper ਮੁਫਤ

ਪਾਈਪਰ ਇੱਕ ਹਲਕਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ ਰਸਸਪੀ ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ VITS ਅਤੇ ਲਾਂਰੀਕਸ ਢਾਂਚੇ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ । ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ CPU ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਜੰਤਰਾਂ, ਘਰ ਆਟੋਮੈਟਿਕ ਅਤੇ ਆਫਲਾਇਨ TTS ਦੀ ਲੋੜ ਵਾਲੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ । 30+ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ 100 ਤੋਂ ਵੱਧ ਆਵਾਜ਼ਾਂ ਨਾਲ, ਪਾਈਪਰ ਇੱਕ ਰਸਬੇਰੀ ਪੀ4 ਉੱਤੇ ਵੀ ਅਸਲੀ- ਸਮੇਂ ਦੀ ਗਤੀ ਨਾਲ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।

ਇਸ ਲਈ ਵਧੀਆ: ਤੁਰੰਤ ਝਲਕ, ਪਹੁੰਚਯੋਗਤਾ ਅਤੇ ਇੰਬੈੱਡ ਐਪਲੀਕੇਸ਼ਨName

ਮੁਫਤ ਕੋਸ਼ਿਸ

VITSVITS ਮੁਫਤ

VITS (ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਨਰਮਾਈ ਵਧਾਉਣ ਵਾਲੇ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਗਿਆ ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਅਪਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।

ਇਸ ਲਈ ਵਧੀਆ: ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀName

ਮੁਫਤ ਕੋਸ਼ਿਸ

MeloTTSMeloTTS ਮੁਫਤ

MyShell. ai ਵਲੋਂ MeloTTS ਇੱਕ ਬਹੁ- ਭਾਸ਼ਾ TTS ਲਾਇਬਰੇਰੀ ਹੈ, ਜੋ ਕਿ ਅੰਗਰੇਜ਼ੀ (ਅਮਰੀਕੀ, ਬ੍ਰਿਟਿਸ਼, ਭਾਰਤੀ, ਆਸਟਰੇਲੀਆਈ), ਸਪੇਨੀ, ਫਰੈਂਚ, ਚੀਨੀ, ਜਾਪਾਨੀ ਅਤੇ ਕੋਰੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਬਹੁਤ ਤੇਜ਼ ਹੈ, ਕੇਵਲ CPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਗਤੀ ਨਾਲ ਪਾਠ ਪਰੋਸੈਸ ਕਰਦਾ ਹੈ । MeloTTS ਉਤਪਾਦਨ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ CPU ਅਤੇ GPU ਦੋਹਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਇਸ ਲਈ ਵਧੀਆ: ਉਤਪਾਦਨ ਐਪਲੀਕੇਸ਼ਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼, ਬਹੁ- ਭਾਸ਼ਾ TTS ਦੀ ਲੋੜ ਹੈName

ਮੁਫਤ ਕੋਸ਼ਿਸ

Kani TTS 2Kani TTS 2 ਮੁਫਤ

Kani- TTS-2 by NineNineSix ਇੱਕ NVIDIA NanoCodec ਨਾਲ Liquid AI LFM2 ਬੈਕਬੋਨ ਉੱਤੇ ਬਣਾਇਆ ਇੱਕ ਅਤਿ- ਹਲਕਾ 400M ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਹੈ । ਇਹ ਕੇਵਲ 3GB VRAM ਵਿੱਚ ਚੱਲਦਾ ਹੈ ਅਤੇ A100 (RTF 0.2) ਉੱਤੇ ~2 ਸੈਕਿੰਡ ਵਿੱਚ ~10 ਸਕਿੰਟ ਬੋਲੀ ਦਿੰਦਾ ਹੈ । ਮੌਜੂਦਾ ਪਬਲਿਕ ਰੀਲੀਜ਼ ਵਿੱਚ ਅੰਗਰੇਜ਼ੀ ਲਈ ਹੀ `kani- tts-2-en` ਚੈੱਕ- ਪੁਆਇੰਟ ਹੈ ਅਤੇ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਲੋੜੀਦੀ ਸਪੀਕਰ- ਇੰਬੈੱਡਿੰਗ ਹੁਕ ਨੂੰ ਐਕਸਪੋਜ਼ਰ ਨਹੀਂ ਕਰਦਾ ਹੈ — ਕਲੋਨਿੰਗ ਲਈ Chatterbox / IndexTTS2 / F5- TTS ਜਾਂ ਗੈਰ- ਅੰਗਰੇਜ਼ੀ ਲਈ Kokoro / MeloTTS ਵਰਤੋਂ ।

ਇਸ ਲਈ ਵਧੀਆ: ਘੱਟ VRAM ਹਾਰਡਵੇਅਰ ਉੱਤੇ ਤੇਜ਼ ਅੰਗਰੇਜ਼ੀ ਜਨਰੇਸ਼ਨ, ਤੇਜ਼ ਝਲਕ

ਮੁਫਤ ਕੋਸ਼ਿਸ

OuteTTSOuteTTS ਮੁਫਤ

OuteTTS ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਸਮਰੱਥਾਵਾਂ ਨਾਲ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਅਸਲੀ ਢਾਂਚਾ ਸੰਭਾਲਦਾ ਹੈ। ਇਹ ਕਈ ਬੈਕਐਂਡਾਂ ਲਈ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ਅਤੇ Transformers. js ਰਾਹੀਂ ਬਰਾਊਜ਼ਰ ਇੰਫਰਰੇਸ਼ਨ ਵੀ ਸ਼ਾਮਲ ਹੈ। JSON ਵਜੋਂ ਸੰਭਾਲੇ ਗਏ ਸਪੀਕਰ ਪਰੋਫਾਇਲ ਰਾਹੀਂ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ।

ਇਸ ਲਈ ਵਧੀਆ: ਐਂਡ ਡਿਸਪਲੇਅ, ਬਰਾਊਜ਼ਰ ਅਧਾਰਿਤ TTS, ਘੱਟ ਸਰੋਤ ਵਾਤਾਵਰਣ

ਮੁਫਤ ਕੋਸ਼ਿਸ

Pocket TTSPocket TTS ਮੁਫਤ

ਕਿਊਟਾਈ (ਮੋਸ਼ੀ ਦੇ ਨਿਰਮਾਤਾ) ਵਲੋਂ ਪੌਕੇਟ TTS ਇੱਕ ਕੰਪੈਕਟ 100M ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਤੋਂ ਵੀ ਵੱਧ ਹੈ । ਇਹ CPU ਉੱਤੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਚੱਲਦਾ ਹੈ, ਇੱਕ ਆਡੀਓ ਨਮੂਨੇ ਤੋਂ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਅਤੇ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਛੋਟਾ ਮਾਡਲ ਸਾਈਜ਼ ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਅਤੇ ਘੱਟ ਸਰੋਤ ਵਾਤਾਵਰਣ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦਾ ਹੈ ।

ਇਸ ਲਈ ਵਧੀਆ: ਹਲਕਾ ਡਿਸਪਲੇਅ, CPU- ਕੇਵਲ ਵਾਤਾਵਰਣ, ਤੇਜ਼ ਬੋਲੀ ਕਲੋਨਿੰਗ

ਮੁਫਤ ਕੋਸ਼ਿਸ

Kitten TTSKitten TTS ਮੁਫਤ

ਕਿੱਟਨ TTS by KittenML ਇੱਕ ਅਤਿ- ਹਲਕਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ONNX ਉੱਤੇ ਬਣਾਇਆ ਗਿਆ ਹੈ । 15M ਤੋਂ 80M ਪੈਰਾਮੀਟਰਾਂ (25- 80 MB ਡਿਸਕ ਉੱਤੇ) ਦੇ ਵੇਰੀਐਂਟ ਨਾਲ, ਇਹ CPU ਉੱਤੇ GPU ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਉੱਚ ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦਾ ਹੈ । 8 ਅੰਦਰੂਨੀ ਬੋਲੀਆਂ, ਅਨੁਕੂਲ ਬੋਲੀ ਗਤੀ ਅਤੇ ਅੰਕ, ਮੁਦਰਾ ਅਤੇ ਇਕਾਈਆਂ ਲਈ ਅੰਦਰੂਨੀ ਟੈਕਸਟ ਪ੍ਰੀ- ਪਰੋਸੈਸਿੰਗ ਹੈ । ਐਡਜਸਟਮੈਂਟ ਅਤੇ ਘੱਟ- ਲਾਈਟਨਸੀ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਆਦਰਸ਼ ਹੈ ।

ਇਸ ਲਈ ਵਧੀਆ: ਤੇਜ਼ ਹਲਕਾ TTS, ਐਂਡ ਡਿਸਪਲੇਅ, ਘੱਟ- ਲਾਈਟਨਸੀ ਐਪਲੀਕੇਸ਼ਨName

ਮੁਫਤ ਕੋਸ਼ਿਸ

Ming-Omni TTSMing-Omni TTS ਮੁਫਤ

inclusionAI ਵਲੋਂ Ming-omni-tts-0.5B ਇੱਕ ਕੰਪੈਕਟ ਓਮਨੀ-ਮੋਡਲ ਸਪੀਚ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ BailingMM ਦੇ ਘਣ ਬੈਕਬੋਨ ਉੱਤੇ ਪੈਚ-ਬਾਈ-ਪੈਚ ਫਲੋ-ਮੈਚਿੰਗ ਆਡੀਓ ਡੀਕੋਡਰ ਨਾਲ ਬਣਾਇਆ ਗਿਆ ਹੈ । ਇਹ 44.1kHz ਆਉਟਪੁੱਟ (CD ਕੁਆਲਟੀ ਦੇ ਨੇੜੇ) ਦਿੰਦਾ ਹੈ, 3+ ਸਕਿੰਟ ਦੇ ਹਵਾਲੇ ਤੋਂ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਅਤੇ JSON ਨਿਰਦੇਸ਼ਾਂ ਰਾਹੀਂ ਅੰਦਰੂਨੀ ਭਾਵਨਾ / ਬੋਲੀ / BGM ਕੰਟਰੋਲ ਸ਼ਾਮਲ ਹੈ । ਚੀਨੀ ਬੈਂਕਮਾਰਕਾਂ ਉੱਤੇ ਸ਼ਾਨਦਾਰ ਸਥਿਰਤਾ — 0.83% WER ।

ਇਸ ਲਈ ਵਧੀਆ: ਉੱਚ- ਗੁਣਵੱਤਾ ਦੋ- ਭਾਸ਼ਾ ਰਚਨਾ, ਭਾਵਨਾ- ਕੰਟਰੋਲ ਵੋਇਸ ਐਕਸ਼ਨ, ਚੀਨੀ ਆਡੀਓਬੁੱਕ ਸਮੱਗਰੀ

ਮੁਫਤ ਕੋਸ਼ਿਸ

MOSS-TTS NanoMOSS-TTS Nano ਮੁਫਤ

MOSS-TTS-Nano-100M MOSS-TTS ਪਰਿਵਾਰ ਦਾ OpenMOSS ਦਾ ਕੰਪੈਕਟ 100M-ਪਰਾਮੀਟਰ ਵੇਰੀਐਂਟ ਹੈ, ਜੋ ਕਿ ਦੇਰੀ-ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਸਾਂਝਾ ਕਰਦਾ ਹੈ। 8B ਮਾਡਲ ਦੀ ਉੱਚ ਕੁਆਲਟੀ ਨੂੰ ~80x ਛੋਟੇ ਭਾਰ ਅਤੇ ਦਰਮਿਆਨੇ ਪ੍ਰਤੀ-ਜਾਚ VRAM ਲਈ ਬਦਲਦਾ ਹੈ, ਜੋ ਕਿ ਮੁਫਤ-ਟਾਇਰ ਅਤੇ ਉੱਚ-ਥ੍ਰੂਪੁੱਟ ਡਿਸਪਲੇਅ ਲਈ ਢੁਕਵਾਂ ਹੈ। ਇੱਕੋ 20-ਭਾਸ਼ਾ ਪਹੁੰਚ ਹੈ।

ਇਸ ਲਈ ਵਧੀਆ: ਮੁਫਤ- ਪੱਧਰ TTS, ਉੱਚ- ਮਾਤਰਾ ਉਤਪਾਦਨ, ਘੱਟ- ਲੈਂਟੀਸੀ ਇੰਟਰਐਕਟਿਵ ਵਰਤੋਂ

ਮੁਫਤ ਕੋਸ਼ਿਸ

BarkBark ਸਟੈਂਡਰਡ

ਟਰਾਂਸਫਾਰਮਰ ਅਧਾਰਿਤ ਪਾਠ- ਤੋਂ- ਆਡੀਓ ਮਾਡਲ, ਜੋ ਕਿ ਅਸਲੀ ਬੋਲੀ, ਸੰਗੀਤ ਅਤੇ ਸਾਊਂਡ ਪਰਭਾਵ ਪੈਦਾ ਕਰਦਾ ਹੈ । Name

ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Bark SmallBark Small ਸਟੈਂਡਰਡ

ਬਰਕ ਦਾ ਹਲਕਾ ਵਰਜਨ ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਅਤੇ ਘੱਟ ਮੈਮੋਰੀ ਵਰਤੋਂ ਨਾਲ ਹੈ ।

ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT

ਕੋਸ਼ਿਸ਼ ਕਰੋ

CosyVoice 2CosyVoice 2 ਸਟੈਂਡਰਡ

ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।

ਡਿਵੈਲਪਰ: Alibaba (Tongyi Lab) · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Dia TTSDia TTS ਸਟੈਂਡਰਡ

ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਪੈਦਾ ਕਰਨ ਵਾਲਾ ਮਾਡਲ, ਜੋ ਕਿ ਸਪੀਕਰ ਦਰਮਿਆਨ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਬਣਾਉਂਦਾ ਹੈ ।

ਡਿਵੈਲਪਰ: Nari Labs · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Parler TTSParler TTS ਸਟੈਂਡਰਡ

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਆਪਣੀ ਪਸੰਦ ਦੀ ਆਵਾਜ਼ ਦੱਸੋ ਅਤੇ ਪਾਰਲਰ ਮੇਲ ਖਾਂਦਾ ਬੋਲ ਤਿਆਰ ਕਰੇਗਾ ।

ਡਿਵੈਲਪਰ: Hugging Face · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

IndexTTS-2IndexTTS-2 ਸਟੈਂਡਰਡ

ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।

ਡਿਵੈਲਪਰ: Index Team · ਲਾਈਸੈਂਸ: Bilibili Model License

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Spark TTSSpark TTS ਸਟੈਂਡਰਡ

ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name

ਡਿਵੈਲਪਰ: SparkAudio · ਲਾਈਸੈਂਸ: CC BY-NC-SA 4.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

GPT-SoVITSGPT-SoVITS ਸਟੈਂਡਰਡ

ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।

ਡਿਵੈਲਪਰ: RVC-Boss · ਲਾਈਸੈਂਸ: MIT

ਕੋਸ਼ਿਸ਼ ਕਰੋ

OrpheusOrpheus ਸਟੈਂਡਰਡ

100K ਘੰਟੇ ਬੋਲੀ ਡਾਟਾ ਉੱਤੇ ਟਰੇਨ ਕੀਤਾ ਮਨੁੱਖੀ- ਪੱਧਰ ਦਾ ਭਾਵਨਾਤਮਕ TTS ਮਾਡਲ ਹੈ ।

ਡਿਵੈਲਪਰ: Canopy Labs · ਲਾਈਸੈਂਸ: Llama 3.2 Community

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Qwen3 TTSQwen3 TTS ਸਟੈਂਡਰਡ

ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਪਹਿਲਾਂ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਪਾਠ ਤੋਂ ਆਵਾਜ਼ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ ।

ਡਿਵੈਲਪਰ: Alibaba (Qwen) · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

VieNeu-TTS-v2VieNeu-TTS-v2 ਸਟੈਂਡਰਡ

ਵੀਅਤਨਾਮੀ + ਅੰਗਰੇਜ਼ੀ ਕੋਡ- ਸਵਿੱਚਿੰਗ TTS7ਪ੍ਰੀ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ । ਕੇਵਲ CPU, ਕੋਈ GPU ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।

ਡਿਵੈਲਪਰ: Phạm Nguyễn Ngọc Bảo · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Chatterbox TurboChatterbox Turbo ਸਟੈਂਡਰਡ

ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।

ਡਿਵੈਲਪਰ: Resemble AI · ਲਾਈਸੈਂਸ: MIT

ਕੋਸ਼ਿਸ਼ ਕਰੋ

VoxCPMVoxCPM ਸਟੈਂਡਰਡ

Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName

ਡਿਵੈਲਪਰ: OpenBMB · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

VibeVoiceVibeVoice ਸਟੈਂਡਰਡ

ਪੋਡਕਾਸਟ ਅਤੇ ਆਡੀਓਬੁੱਕਾਂ ਵਰਗੇ ਲੰਬੇ-ਫਾਰਮ ਮਲਟੀ-ਸਪੀਕਰ ਸਮੱਗਰੀ ਲਈ Microsoft ਮਾਡਲ ਹੈ ।

ਡਿਵੈਲਪਰ: Microsoft · ਲਾਈਸੈਂਸ: MIT

ਕੋਸ਼ਿਸ਼ ਕਰੋ

CosyVoice3CosyVoice3 ਸਟੈਂਡਰਡ

ਅਗਲੀ ਪੀੜ੍ਹੀ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬਾਈ-ਸਟਰੀਮਿੰਗ, ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ।

ਡਿਵੈਲਪਰ: Alibaba (FunAudioLLM) · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

NAMAA Saudi TTSNAMAA Saudi TTS ਸਟੈਂਡਰਡ

ਪਹਿਲਾ ਖੋਲ੍ਹਿਆ ਸਊਦੀ- ਅਰਬੀ TTS । ਚੈਟਰਬਾਕਸ- ਕੁਆਲਟੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਊਦੀ ਭਾਸ਼ਾ ।

ਡਿਵੈਲਪਰ: NAMAA Space · ਲਾਈਸੈਂਸ: MIT

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Darwin TTSDarwin TTS ਸਟੈਂਡਰਡ

FFN ਭਾਰ ਨਾਲ ਕ੍ਰਾਸ- ਮੋਡਲ Qwen3- TTS ਵੇਰੀਐਂਟ, Qwen3- 1. 7B ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਹੁ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਲਈ ਮਿਲਾਇਆ ਗਿਆ ਹੈ ।

ਡਿਵੈਲਪਰ: FINAL-Bench · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

MOSS-TTSDMOSS-TTSD ਸਟੈਂਡਰਡ

ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਜਾਰੀ ਰੱਖਣ ਮਾਡਲ -5ਸਪੀਕਰ ਅਤੇ 60 ਮਿੰਟ ਦੇ ਸਹਿਜ ਆਡੀਓ ਨਾਲ ਪੋਡਕਾਸਟ-ਸਟਾਈਲ ਗੱਲਬਾਤ ਬਣਾਓ।

ਡਿਵੈਲਪਰ: OpenMOSS · ਲਾਈਸੈਂਸ: Apache 2.0

ਕੋਸ਼ਿਸ਼ ਕਰੋ

ChatterboxChatterbox ਪ੍ਰੀਮੀਅਮ

ਰੀਸਿਮਬਿਲ AI ਤੋਂ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਸਟੇਟ-ਆਫ-ਦਿ-ਆਰਟ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਵੌਇਸ ਕਲੋਨਿੰਗ।

ਕੁਆਲਟੀ:

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Tortoise TTSTortoise TTS ਪ੍ਰੀਮੀਅਮ

ਮਲਟੀ-ਵਾਇਸ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਆਟੋ-ਰਿਗਰੈੱਸਿਵ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਕੁਆਲਟੀ ਉੱਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ।

ਕੁਆਲਟੀ:

ਕੋਸ਼ਿਸ਼ ਕਰੋ

StyleTTS 2StyleTTS 2 ਪ੍ਰੀਮੀਅਮ

ਸਟਾਈਲ ਪ੍ਰਸਾਰ ਅਤੇ ਵਿਰੋਧੀ ਟ੍ਰੇਨਿੰਗ ਰਾਹੀਂ ਮਨੁੱਖੀ ਪੱਧਰ ਦਾ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ।

ਕੁਆਲਟੀ:

ਕੋਸ਼ਿਸ਼ ਕਰੋ

OpenVoiceOpenVoice ਪ੍ਰੀਮੀਅਮ

ਸਟਾਈਲ, ਭਾਵਨਾ ਅਤੇ ਅੱਖਰਾਂ ਉੱਤੇ ਗਰਾਨੀਕਲ ਕੰਟਰੋਲ ਨਾਲ ਤੁਰੰਤ ਬੋਲੀ ਕਲੋਨਿੰਗ । Name

ਕੁਆਲਟੀ:

ਕੋਸ਼ਿਸ਼ ਕਰੋ

Sesame CSMSesame CSM ਪ੍ਰੀਮੀਅਮ

ਸੰਵਾਦੀ ਬੋਲੀ ਦਾ ਮਾਡਲ, ਜੋ ਕਿ ਸਹੀ ਸਮੇਂ ਅਤੇ ਭਾਵਨਾ ਨਾਲ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਪੈਦਾ ਕਰਦਾ ਹੈ।

ਕੁਆਲਟੀ:

ਕੋਸ਼ਿਸ਼ ਕਰੋ

CosyVoice 2CosyVoice 2

ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।

ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, de, it, es

ਕਲੋਨ ਆਵਾਜ਼

IndexTTS-2IndexTTS-2

ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।

ਭਾਸ਼ਾਵਾਂ: en, zh

ਕਲੋਨ ਆਵਾਜ਼

Spark TTSSpark TTS

ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name

ਭਾਸ਼ਾਵਾਂ: en, zh

ਕਲੋਨ ਆਵਾਜ਼

GPT-SoVITSGPT-SoVITS

ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।

ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko

ਕਲੋਨ ਆਵਾਜ਼

ChatterboxChatterbox

ਰੀਸਿਮਬਿਲ AI ਤੋਂ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਸਟੇਟ-ਆਫ-ਦਿ-ਆਰਟ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਵੌਇਸ ਕਲੋਨਿੰਗ।

ਭਾਸ਼ਾਵਾਂ: en

ਕਲੋਨ ਆਵਾਜ਼

Tortoise TTSTortoise TTS

ਮਲਟੀ-ਵਾਇਸ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਆਟੋ-ਰਿਗਰੈੱਸਿਵ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਕੁਆਲਟੀ ਉੱਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ।

ਭਾਸ਼ਾਵਾਂ: en

ਕਲੋਨ ਆਵਾਜ਼

OpenVoiceOpenVoice

ਸਟਾਈਲ, ਭਾਵਨਾ ਅਤੇ ਅੱਖਰਾਂ ਉੱਤੇ ਗਰਾਨੀਕਲ ਕੰਟਰੋਲ ਨਾਲ ਤੁਰੰਤ ਬੋਲੀ ਕਲੋਨਿੰਗ । Name

ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, es

ਕਲੋਨ ਆਵਾਜ਼

VieNeu-TTS-v2VieNeu-TTS-v2

ਵੀਅਤਨਾਮੀ + ਅੰਗਰੇਜ਼ੀ ਕੋਡ- ਸਵਿੱਚਿੰਗ TTS7ਪ੍ਰੀ- ਸੈੱਟ ਆਵਾਜ਼ਾਂ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ । ਕੇਵਲ CPU, ਕੋਈ GPU ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।

ਭਾਸ਼ਾਵਾਂ: vi, en

ਕਲੋਨ ਆਵਾਜ਼

Chatterbox TurboChatterbox Turbo

ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।

ਭਾਸ਼ਾਵਾਂ: en

ਕਲੋਨ ਆਵਾਜ਼

VoxCPMVoxCPM

Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName

ਭਾਸ਼ਾਵਾਂ: en, zh

ਕਲੋਨ ਆਵਾਜ਼

OuteTTSOuteTTS

LLM ਅਧਾਰਿਤ TTS, ਜੋ ਕਿ CPU, GPU, ਜਾਂ ਝਲਕਾਰਾ ਉੱਤੇ llama. cpp ਅਤੇ Transformers. js ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ ।

ਭਾਸ਼ਾਵਾਂ: en

ਕਲੋਨ ਆਵਾਜ਼

Pocket TTSPocket TTS

ਇੱਕ ਸੈਂਪਲ ਤੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਕਿਊਟਾਈ ਵਲੋਂ ਹਲਕਾ 100M ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਹੈ । Name

ਭਾਸ਼ਾਵਾਂ: en, fr

ਕਲੋਨ ਆਵਾਜ਼

CosyVoice3CosyVoice3

ਅਗਲੀ ਪੀੜ੍ਹੀ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬਾਈ-ਸਟਰੀਮਿੰਗ, ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ।

ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, de, es, fr, it, ru

ਕਲੋਨ ਆਵਾਜ਼

NAMAA Saudi TTSNAMAA Saudi TTS

ਪਹਿਲਾ ਖੋਲ੍ਹਿਆ ਸਊਦੀ- ਅਰਬੀ TTS । ਚੈਟਰਬਾਕਸ- ਕੁਆਲਟੀ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਸਊਦੀ ਭਾਸ਼ਾ ।

ਭਾਸ਼ਾਵਾਂ: ar

ਕਲੋਨ ਆਵਾਜ਼

Darwin TTSDarwin TTS

FFN ਭਾਰ ਨਾਲ ਕ੍ਰਾਸ- ਮੋਡਲ Qwen3- TTS ਵੇਰੀਐਂਟ, Qwen3- 1. 7B ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਬਹੁ- ਭਾਸ਼ਾ ਕਲੋਨਿੰਗ ਲਈ ਮਿਲਾਇਆ ਗਿਆ ਹੈ ।

ਭਾਸ਼ਾਵਾਂ: en, ko, ja, zh

ਕਲੋਨ ਆਵਾਜ਼

MOSS-TTSDMOSS-TTSD

ਬਹੁ-ਸਪੀਕਰ ਡਾਈਲਾਗ ਜਾਰੀ ਰੱਖਣ ਮਾਡਲ -5ਸਪੀਕਰ ਅਤੇ 60 ਮਿੰਟ ਦੇ ਸਹਿਜ ਆਡੀਓ ਨਾਲ ਪੋਡਕਾਸਟ-ਸਟਾਈਲ ਗੱਲਬਾਤ ਬਣਾਓ।

ਭਾਸ਼ਾਵਾਂ: en, zh

ਕਲੋਨ ਆਵਾਜ਼

Ming-Omni TTSMing-Omni TTS

inclusionAI ਤੋਂ ਉੱਚ- ਭਰੋਸੇਯੋਗਤਾ 44. 1kHz ਆਉਟਪੁੱਟ ਅਤੇ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਨਾਲ ਕੰਪੈਕਟ 0. 5B ਓਮਨੀ- ਮੋਡਲ ਬੋਲੀ ਮਾਡਲ ਹੈ ।

ਭਾਸ਼ਾਵਾਂ: en, zh

ਕਲੋਨ ਆਵਾਜ਼

MOSS-TTS NanoMOSS-TTS Nano

ਛੋਟਾ 100M MOSS-TTS ਵੇਰੀਐਂਟ - ਇੱਕੋ ਢਾਂਚਾ, 80x ਛੋਟਾ, ਮੁਫਤ-ਟਾਇਰ ਲੈਟੇਸੀ।

ਭਾਸ਼ਾਵਾਂ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

ਕਲੋਨ ਆਵਾਜ਼

ਡਿਵੈਲਪਰ- ਪਹਿਲਾਂ API

OpenAI- ਅਨੁਕੂਲ REST API । ਇੱਕ ਅੰਤ- ਬਿੰਦੂ, 22+ ਮਾਡਲ । ਰੀਅਲ- ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ ।

  • OpenAI- ਅਨੁਕੂਲ ਫਾਰਮੈਟ
  • ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ TTS ਸਟਰੀਮਿੰਗ
  • ਵੱਡੇ ਕੰਮਾਂ ਲਈ ਬੈਚ ਪਰੋਸੈਸ
  • ਵੈੱਬਹੁੱਕ ਨੋਟੀਫਿਕੇਸ਼ਨ
API ਡੌਕੂਮੈਂਟ ਵੇਖੋ
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ਸਧਾਰਨ, ਪਾਰਦਰਸ਼ੀ ਕੀਮਤ

ਮੁਫਤ ਸ਼ੁਰੂ ਕਰੋ । ਜਿਵੇਂ ਤੁਸੀਂ ਵਧਦੇ ਹੋ ਸਕੇਲ ਕਰੋ ।

ਮੁਫਤ

$0

15,000 ਅੱਖਰ + 5,000/ਦਿਨ

  • ਕੋਕੋਰੋ ਸਮੇਤ7ਮੁਫ਼ਤ ਮਾਡਲ
  • 5,000 ਅੱਖਰ ਪ੍ਰਤੀ ਜਨਰੇਸ਼ਨ
  • API ਪਹੁੰਚ ਸ਼ਾਮਲ
ਮੁਫਤ ਰਜਿਸਟਰ ਕਰੋ

ਲਾਂਚਰ

$9/ਮਹੀਨਾ

500 ਕਰੈਡਿਟ/ਮਹੀਨਾ

  • ਸਭ 22+ ਮਾਡਲ
  • 100,000 ਅੱਖਰ ਪ੍ਰਤੀ ਜਨਰੇਸ਼ਨ
  • ਬੋਲੀ ਕਲੋਨਿੰਗ
ਸ਼ੁਰੂ ਕਰੋ
ਸਭ ਤੋਂ ਮਸ਼ਹੂਰ

ਪਰੋ

$29/ਮਹੀਨਾ

2,000 ਕਰੈਡਿਟ/ਮਹੀਨਾ

  • ਸਟਾਰਟਅੱਪ ਵਿੱਚ ਸਭ
  • API ਪਹੁੰਚ
  • ਤਰਜੀਹ ਪਰੋਸੈਸਿੰਗ
ਪ੍ਰੋ ਪ੍ਰਾਪਤ ਕਰੋ

ਵਪਾਰ

$99/ਮਹੀਨਾ

10,000 ਕਰੈਡਿਟ/ਮਹੀਨਾ

  • ਪਰੋ ਵਿੱਚ ਸਭ
  • ਬੋਲਟ API
  • ਤਰਜੀਹ ਕਤਾਰ
ਕਾਰੋਬਾਰ ਲਵੋ

ਅੱਖਰ ਪੈਕ ਸਮੇਤ ਸਭ ਯੋਜਨਾਵਾਂ ਵੇਖੋ →

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

TTS.ai ਸਭ ਤੋਂ ਵਿਆਪਕ AI ਬੋਲੀ ਪਲੇਟਫਾਰਮ ਹੈ, ਜੋ ਕਿ 22+ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਮਾਡਲ, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਬੋਲੀ-ਟੂ-ਟੈਕਸਟ ਅਤੇ ਆਡੀਓ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਸਭ ਮਾਡਲ ਓਪਨ ਸਰੋਤ ਹਨ ਅਤੇ ਕੋਈ ਵੀ ਵਿਕਰੇਤਾ ਲਾਕ-ਇਨ ਨਹੀਂ ਹੈ।

ਹਾਂ! TTS.ai ਕੋਕੋਰੋ, ਪਾਈਪਰ, VITS ਅਤੇ MeloTTS ਮਾਡਲਾਂ ਨਾਲ ਮੁਫਤ ਟੈਕਸਟ-ਟੂ-ਸਪੋਰਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਕੋਈ ਖਾਤਾ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ। 15,000 ਮੁਫਤ ਅੱਖਰ ਪ੍ਰਾਪਤ ਕਰਨ ਅਤੇ ਸਭ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਸਾਈਨ ਅਪ ਕਰੋ। ਭੁਗਤਾਨ ਕੀਤੇ ਪਲਾਨ $9/ਮਹੀਨੇ ਤੋਂ ਸ਼ੁਰੂ ਹੁੰਦੇ ਹਨ।

ਗਤੀ ਲਈ ਕੋਕੋਰੋ ਜਾਂ ਪਾਈਪਰ ਵਰਤੋਂ । ਕੁਆਲਟੀ ਲਈ ਕੋਸੀਵਾਇਸ2ਜਾਂ ਸਟਾਈਲTTS2ਪ੍ਰਯੋਗ ਕਰੋ । ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਚੈਟਰਬਾਕਸ ਜਾਂ GPT- ਸੋਵਿਟਸ ਵਰਤੋਂ । ਡਾਈਲਾਗ ਲਈ ਡੀਆ TTS ਵਰਤੋਂ । ਤੁਲਨਾ ਕਰਨ ਲਈ ਇੱਕੋ ਟੈਕਸਟ ਉੱਤੇ ਕਈ ਮਾਡਲਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ ।

ਹਾਂ। TTS, STT, ਬੋਲੀ ਕਲੋਨਿੰਗ ਅਤੇ ਆਡੀਓ ਟੂਲ ਲਈ OpenAI- ਅਨੁਕੂਲ REST API। ਮੁਫਤ ਸਮੇਤ ਹਰੇਕ ਪਲਾਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹੈ, ਜਿਸ ਵਿੱਚ ਦਰ ਲਿਮਟ ਹੈ ਜੋ ਕਿ ਪੱਧਰ ਨਾਲ ਸਕੇਲ ਹੁੰਦੀ ਹੈ (ਮੁਫਤ: 10 req/min, ਲਾਈਟ: 20, ਸਟਾਰਟਰ: 30, ਪਰੋ: 60, ਬਿਜ਼ਨਸ: 300)। tts.ai/api/ ਉੱਤੇ ਡੌਕੂਮੈਂਟੇਸ਼ਨ ਵੇਖੋ।

ਆਵਾਜ਼ ਦੀ ਕੁਆਲਟੀ ਮਾਡਲ ਮੁਤਾਬਕ ਵੱਖਰੀ ਹੁੰਦੀ ਹੈ । ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ ਜਿਵੇਂ ਕਿ ਕੋਸੀਵਾਇਸ2, ਸਟਾਈਲਟੀਟੀਐੱਸ2ਅਤੇ ਚੈਟਰਬਾਕਸ ਕੁਦਰਤੀ ਅਵਾਜ਼ ਅਤੇ ਭਾਵਨਾ ਨਾਲ ਮਨੁੱਖੀ ਕੁਆਲਟੀ ਦੀ ਆਵਾਜ਼ ਪੈਦਾ ਕਰਦੇ ਹਨ । ਮੁਫਤ ਮਾਡਲ ਜਿਵੇਂ ਕਿ ਕੋਕੋਰੋ ਜ਼ਿਆਦਾਤਰ ਵਰਤੋਂ ਲਈ ਵਧੀਆ ਕੁਆਲਟੀ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੇ ਹਨ ।

TTS.ai ਆਪਣੀ ਮਾਡਲ ਲਾਇਬਰੇਰੀ ਵਿੱਚ 30+ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ। ਅੰਗਰੇਜ਼ੀ ਵਿੱਚ ਸਭ ਤੋਂ ਵਿਸ਼ਾਲ ਮਾਡਲ ਸਹਿਯੋਗ ਹੈ, ਪਰ ਮਾਡਲ ਜਿਵੇਂ ਕਿ ਕੋਸੀਵਾਇਸ2ਚਾਈਨੀਜ਼, ਜਪਾਨੀ ਅਤੇ ਕੋਰੀਆਈ ਨੂੰ ਕਵਰ ਕਰਦਾ ਹੈ; GPT-SoVITS ਚਾਈਨੀਜ਼, ਜਪਾਨੀ, ਕੋਰੀਆਈ ਅਤੇ ਅੰਗਰੇਜ਼ੀ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ; ਅਤੇ MeloTTS ਅੰਗਰੇਜ਼ੀ, ਸਪੇਨੀ, ਫਰੈਂਚ, ਚੀਨੀ, ਜਪਾਨੀ ਅਤੇ ਕੋਰੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ।

ਹਾਂ । ਸਭ ਪਰੋਸੈਸ ਸਾਡੇ ਸਮਰਪਿਤ GPU ਸਰਵਰਾਂ ਉੱਤੇ ਹੁੰਦਾ ਹੈ । ਅਸੀਂ ਤੁਹਾਡੇ ਪਾਠ ਇੰਪੁੱਟ ਜਾਂ ਪੈਦਾ ਹੋਏ ਆਡੀਓ ਨੂੰ ਭੇਜਣ ਤੋਂ ਬਾਅਦ ਸੰਭਾਲਦੇ ਨਹੀਂ ਹਾਂ । ਕਲੋਨਿੰਗ ਲਈ ਅੱਪਲੋਡ ਕੀਤੇ ਆਵਾਜ਼ ਨਮੂਨੇ ਸਿਰਫ ਮੌਜੂਦਾ ਸ਼ੈਸ਼ਨ ਲਈ ਹੀ ਵਰਤੇ ਜਾਂਦੇ ਹਨ ਅਤੇ ਰੱਖੇ ਨਹੀਂ ਜਾਂਦੇ ਹਨ । ਅਸੀਂ ਕਦੇ ਵੀ ਤੁਹਾਡਾ ਡਾਟਾ ਤੀਜੀ ਧਿਰ ਨਾਲ ਸਾਂਝਾ ਨਹੀਂ ਕਰਦੇ ਜਾਂ ਮਾਡਲਾਂ ਨੂੰ ਟਰੈਕ ਕਰਨ ਲਈ ਇਸ ਨੂੰ ਨਹੀਂ ਵਰਤਦੇ ।

ਹਾਂ। TTS.ai ਉੱਤੇ ਤਿਆਰ ਸਾਰੇ ਆਡੀਓ ਤੁਹਾਡੇ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਹਨ, ਜਿਸ ਵਿੱਚ ਯੂਟਿਊਬ ਵਿਡੀਓ, ਪੋਡਕਾਸਟ, ਆਡੀਓਬੁੱਕਾਂ, ਐਪਲੀਕੇਸ਼ਨ, ਐਲਾਨਨਾਮੇ ਅਤੇ ਉਤਪਾਦ ਸ਼ਾਮਲ ਹਨ। ਸਾਡੇ ਮਾਡਲ ਓਪਨ ਸਰੋਤ ਹਨ ਅਤੇ ਲਾਈਸੈਂਸ (MIT, Apache 2.0) ਅਧੀਨ ਹਨ। ਕੋਈ ਰਿਆਇਤ ਜਾਂ ਐਟ੍ਰੀਬਿਊਸ਼ਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

TTS.ai ਵੱਧੋ- ਵੱਧ ਕੁਆਲਟੀ ਲਈ ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ WAV ਫਾਰਮੈਟ ਵਿੱਚ ਆਡੀਓ ਬਣਾਉਦਾ ਹੈ । ਤੁਸੀਂ ਸਾਡੇ ਮੁਫਤ ਆਡੀਓ ਕਨਵਰਟਰ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ MP3, FLAC, OGG ਜਾਂ M4A ਵਿੱਚ ਬਦਲ ਸਕਦੇ ਹੋ । API ਤੁਹਾਡੀ ਪਸੰਦ ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ ਨੂੰ ਸਿੱਧਾ ਮੰਗ ਵਿੱਚ ਦੱਸਣ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਇੱਕ ਛੋਟਾ ਆਡੀਓ ਨਮੂਨਾ ਅੱਪਲੋਡ ਕਰੋ (ਘੱਟੋ-ਘੱਟ5ਸਕਿੰਟ) ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਕਲੋਨ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਫਿਰ ਕਿਸੇ ਵੀ ਟੈਕਸਟ ਨੂੰ ਉਸ ਆਡੀਓ ਵਿੱਚ ਬੋਲੀ ਪੈਦਾ ਕਰਨ ਲਈ ਟਾਈਪ ਕਰੋ। ਮਾਡਲ ਜਿਵੇਂ ਕਿ ਚੈਟਰਬਾਕਸ, GPT-SoVITS, ਅਤੇ ਕੋਸੀਵਾਇਸ2ਵਾਕ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹਨ। ਕਲੋਨ ਕੀਤੀ ਆਡੀਓ ਟੋਨ, ਅੱਖਰਾਂ ਅਤੇ ਬੋਲੀ ਸਟਾਈਲ ਨੂੰ ਕੈਪਚਰ ਕਰਦੀ ਹੈ।

ਮੁਫਤ ਮਾਡਲਾਂ (ਕੋਕੋਰੋ, ਪਾਈਪਰ, VITS, MeloTTS) ਲਈ ਕੋਈ ਅਕਾਊਂਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ਅਤੇ ਸ਼ੂਗਰ ਅੱਖਰ ਦੀ ਕੀਮਤ ਸ਼ੂਨਾ ਹੈ। ਸਟੈਂਡਰਡ ਮਾਡਲਾਂ (2,000 ਅੱਖਰ/1K ਇੰਪੁੱਟ) ਵਿੱਚ ਬਾਰਕ, ਕੋਸੀਵਾਇਸ2, F5-TTS ਅਤੇ ਡਾਈਆ ਸ਼ਾਮਲ ਹਨ। ਪ੍ਰੀਮੀਅਮ ਮਾਡਲਾਂ (4,000 ਅੱਖਰ/1K ਇੰਪੁੱਟ) ਵਿੱਚ ਓਪਨਵਾਇਸ, ਚੈਟਰਬਾਕਸ, ਸਟਾਈਲTTS2ਅਤੇ ਟੋਰਟੋਇਸ ਸ਼ਾਮਲ ਹਨ। ਭੁਗਤਾਨ ਕੀਤੇ ਮਾਡਲਾਂ ਆਮ ਤੌਰ ਉੱਤੇ ਉੱਚ ਕੁਆਲਟੀ, ਵਧੇਰੇ ਆਵਾਜ਼ਾਂ ਅਤੇ ਵਾਕ ਕਲੋਨਿੰਗ ਵਰਗੀਆਂ ਹੋਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਪੇਸ਼ ਕਰਦੇ ਹਨ।

ਹਾਂ। API ਪਾਠ ਨੂੰ ਬੋਲੀ ਵਿੱਚ ਬਦਲਣ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਬੈਚ ਪਰੋਸੈਸ ਲਈ ਸਹਾਇਕ ਹੈ। ਕਈ ਮੰਗਾਂ ਭੇਜੋ ਅਤੇ ਕੰਮ UUIDs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਨਤੀਜੇ ਅਸਿਨਕਰੋਨੀਅਸ ਤੌਰ ਉੱਤੇ ਪ੍ਰਾਪਤ ਕਰੋ। ਬਿਜ਼ਨਸ ਪਲਾਨ ($99/mo) ਅਤੇ ਉੱਪਰ ਵਿੱਚ ਤੇਜ਼ ਬੈਚ ਪਰੋਸੈਸ ਲਈ ਤਰਜੀਹੀ ਕਤਾਰ ਪਹੁੰਚ ਸ਼ਾਮਲ ਹੈ। ਆਡੀਓਬੁੱਕ ਉਤਪਾਦਨ, ਕੋਰਸ ਸਮੱਗਰੀ ਅਤੇ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਵੌਇਸ-ਓਵਰ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ਵਧੀਆ ਹੈ।
4.1/5 (42)

ਅਸੀਂ ਕੀ ਸੁਧਾਰ ਕਰ ਸਕਦੇ ਹਾਂ? ਤੁਹਾਡੀ ਟਿੱਪਣੀ ਸਾਨੂੰ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।

AI ਬੋਲੀ ਅੱਜ ਵਰਤੋਂ ਸ਼ੁਰੂ ਕਰੋ

TTS.ai ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਰਚਨਾਕਾਰਾਂ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਕਾਰੋਬਾਰਾਂ ਨਾਲ ਜੁੜੋ