ਮੁਫਤ AI ਪਾਠ ਤੋਂ ਬੋਲੀComment
31+ ਖੋਲ੍ਹੇ ਸਰੋਤ ਮਾਡਲ, 231+ ਆਵਾਜ਼ਾਂ, 34+ ਭਾਸ਼ਾਵਾਂ । ਕੋਈ ਅਕਾਊਂਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਬੋਲੀ AI ਲਈ ਤੁਹਾਨੂੰ ਜੋ ਵੀ ਲੋੜੀਦਾ ਹੈ
30+ ਟੂਲ ਓਪਨ-ਸੋਰਸ AI ਮਾਡਲਾਂ ਨਾਲ ਚਾਲੂ
31+ AI ਬੋਲੀ ਮਾਡਲ
ਇੱਕ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਦਾ ਸਭ ਤੋਂ ਵਿਆਪਕ ਭੰਡਾਰName
Kokoro Free
ਕੋਕੋਰੋ ਇੱਕ 82 ਮਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਵਰਗ ਤੋਂ ਉੱਪਰ ਹੈ। ਇਸ ਦੇ ਛੋਟੇ ਆਕਾਰ ਦੇ ਬਾਵਜੂਦ, ਇਹ ਬਹੁਤ ਹੀ ਕੁਦਰਤੀ ਅਤੇ ਭਾਵਪੂਰਨ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਕੋਕੋਰੋ ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ ਅਤੇ ਕੋਰੀਆਈ ਸਮੇਤ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ। ਇਹ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਤੇਜ਼ ਚੱਲਦਾ ਹੈ - GPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਤੋਂ ਲਗਭਗ 100x ਤੇਜ਼ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ।
ਇਸ ਲਈ ਵਧੀਆ: ਘੱਟੋ- ਘੱਟ ਲੈਂਟੇਸੀ ਨਾਲ ਉੱਚ ਕੁਆਲਟੀ TTS, ਸਟਰੀਮਿੰਗ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
Piper Free
ਪਾਈਪਰ ਇੱਕ ਹਲਕਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ ਰਸਸਪੀ ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ VITS ਅਤੇ ਲਾਂਰੀਕਸ ਢਾਂਚੇ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ । ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ CPU ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਜੰਤਰਾਂ, ਘਰ ਆਟੋਮੈਟਿਕ ਅਤੇ ਆਫਲਾਇਨ TTS ਦੀ ਲੋੜ ਵਾਲੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ । 30+ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ 100 ਤੋਂ ਵੱਧ ਆਵਾਜ਼ਾਂ ਨਾਲ, ਪਾਈਪਰ ਇੱਕ ਰਸਬੇਰੀ ਪੀ4 ਉੱਤੇ ਵੀ ਅਸਲੀ- ਸਮੇਂ ਦੀ ਗਤੀ ਨਾਲ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਤੁਰੰਤ ਝਲਕ, ਪਹੁੰਚਯੋਗਤਾ ਅਤੇ ਇੰਬੈੱਡ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
VITS Free
VITS (ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਨਰਮਾਈ ਵਧਾਉਣ ਵਾਲੇ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਗਿਆ ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਅਪਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀName
ਮੁਫਤ ਕੋਸ਼ਿਸ
MeloTTS Free
MyShell. ai ਵਲੋਂ MeloTTS ਇੱਕ ਬਹੁ- ਭਾਸ਼ਾ TTS ਲਾਇਬਰੇਰੀ ਹੈ, ਜੋ ਕਿ ਅੰਗਰੇਜ਼ੀ (ਅਮਰੀਕੀ, ਬ੍ਰਿਟਿਸ਼, ਭਾਰਤੀ, ਆਸਟਰੇਲੀਆਈ), ਸਪੇਨੀ, ਫਰੈਂਚ, ਚੀਨੀ, ਜਾਪਾਨੀ ਅਤੇ ਕੋਰੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਬਹੁਤ ਤੇਜ਼ ਹੈ, ਕੇਵਲ CPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਗਤੀ ਨਾਲ ਪਾਠ ਪਰੋਸੈਸ ਕਰਦਾ ਹੈ । MeloTTS ਉਤਪਾਦਨ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ CPU ਅਤੇ GPU ਦੋਹਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਉਤਪਾਦਨ ਐਪਲੀਕੇਸ਼ਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼, ਬਹੁ- ਭਾਸ਼ਾ TTS ਦੀ ਲੋੜ ਹੈName
ਮੁਫਤ ਕੋਸ਼ਿਸ
OuteTTS Free
OuteTTS ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਸਮਰੱਥਾਵਾਂ ਨਾਲ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਵਧਾਉਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਅਸਲੀ ਢਾਂਚਾ ਸੰਭਾਲਦਾ ਹੈ। ਇਹ ਕਈ ਬੈਕਐਂਡਾਂ ਲਈ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ llama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ਅਤੇ Transformers. js ਰਾਹੀਂ ਬਰਾਊਜ਼ਰ ਇੰਫਰਰੇਸ਼ਨ ਵੀ ਸ਼ਾਮਲ ਹੈ। JSON ਵਜੋਂ ਸੰਭਾਲੇ ਗਏ ਸਪੀਕਰ ਪਰੋਫਾਇਲ ਰਾਹੀਂ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ।
ਇਸ ਲਈ ਵਧੀਆ: ਐਂਡ ਡਿਸਪਲੇਅ, ਬਰਾਊਜ਼ਰ ਅਧਾਰਿਤ TTS, ਘੱਟ ਸਰੋਤ ਵਾਤਾਵਰਣ
ਮੁਫਤ ਕੋਸ਼ਿਸ
Pocket TTS Free
ਕਿਊਟਾਈ (ਮੋਸ਼ੀ ਦੇ ਨਿਰਮਾਤਾ) ਵਲੋਂ ਪੌਕੇਟ TTS ਇੱਕ ਕੰਪੈਕਟ 100M ਪੈਰਾਮੀਟਰ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਤੋਂ ਵੀ ਵੱਧ ਹੈ । ਇਹ CPU ਉੱਤੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਚੱਲਦਾ ਹੈ, ਇੱਕ ਆਡੀਓ ਨਮੂਨੇ ਤੋਂ ਜ਼ੀਰੋ- ਸ਼ੋਟ ਬੋਲੀ ਕਲੋਨਿੰਗ ਲਈ ਸਹਾਇਕ ਹੈ, ਅਤੇ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਛੋਟਾ ਮਾਡਲ ਸਾਈਜ਼ ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਅਤੇ ਘੱਟ ਸਰੋਤ ਵਾਤਾਵਰਣ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਹਲਕਾ ਡਿਸਪਲੇਅ, CPU- ਕੇਵਲ ਵਾਤਾਵਰਣ, ਤੇਜ਼ ਬੋਲੀ ਕਲੋਨਿੰਗ
ਮੁਫਤ ਕੋਸ਼ਿਸ
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
ਇਸ ਲਈ ਵਧੀਆ: Fast lightweight TTS, edge deployment, low-latency applications
ਮੁਫਤ ਕੋਸ਼ਿਸ
Bark Standard
ਟਰਾਂਸਫਾਰਮਰ ਅਧਾਰਿਤ ਪਾਠ- ਤੋਂ- ਆਡੀਓ ਮਾਡਲ, ਜੋ ਕਿ ਅਸਲੀ ਬੋਲੀ, ਸੰਗੀਤ ਅਤੇ ਸਾਊਂਡ ਪਰਭਾਵ ਪੈਦਾ ਕਰਦਾ ਹੈ । Name
ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Bark Small Standard
ਬਰਕ ਦਾ ਹਲਕਾ ਵਰਜਨ ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਅਤੇ ਘੱਟ ਮੈਮੋਰੀ ਵਰਤੋਂ ਨਾਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice 2 Standard
ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।
ਡਿਵੈਲਪਰ: Alibaba (Tongyi Lab) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Dia TTS Standard
ਬਹੁ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਪੈਦਾ ਕਰਨ ਵਾਲਾ ਮਾਡਲ, ਜੋ ਕਿ ਸਪੀਕਰ ਦਰਮਿਆਨ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਬਣਾਉਂਦਾ ਹੈ ।
ਡਿਵੈਲਪਰ: Nari Labs · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Parler TTS Standard
ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਆਪਣੀ ਪਸੰਦ ਦੀ ਆਵਾਜ਼ ਦੱਸੋ ਅਤੇ ਪਾਰਲਰ ਮੇਲ ਖਾਂਦਾ ਬੋਲ ਤਿਆਰ ਕਰੇਗਾ ।
ਡਿਵੈਲਪਰ: Hugging Face · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
GLM-TTS Standard
ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਅੱਖਰ ਗਲਤੀ ਦਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ।
ਡਿਵੈਲਪਰ: Zhipu AI · ਲਾਈਸੈਂਸ: GLM-4 License
ਕੋਸ਼ਿਸ਼ ਕਰੋ
IndexTTS-2 Standard
ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।
ਡਿਵੈਲਪਰ: Index Team · ਲਾਈਸੈਂਸ: Bilibili Model License
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Spark TTS Standard
ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name
ਡਿਵੈਲਪਰ: SparkAudio · ਲਾਈਸੈਂਸ: CC BY-NC-SA 4.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
GPT-SoVITS Standard
ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।
ਡਿਵੈਲਪਰ: RVC-Boss · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Orpheus Standard
100K ਘੰਟੇ ਬੋਲੀ ਡਾਟਾ ਉੱਤੇ ਟਰੇਨ ਕੀਤਾ ਮਨੁੱਖੀ- ਪੱਧਰ ਦਾ ਭਾਵਨਾਤਮਕ TTS ਮਾਡਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Canopy Labs · ਲਾਈਸੈਂਸ: Llama 3.2 Community
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Qwen3 TTS Standard
ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਪਹਿਲਾਂ-ਸੈੱਟ ਬੋਲੀਆਂ ਅਤੇ ਪਾਠ ਤੋਂ ਬੋਲੀ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ।
ਡਿਵੈਲਪਰ: Alibaba (Qwen) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Chatterbox Turbo Standard
ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।
ਡਿਵੈਲਪਰ: Resemble AI · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Dia 2 Standard
ਮਲਟੀ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਅਤੇ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਸੁਝਾਵਾਂ ਨਾਲ ਸਟਰੀਮ- ਫਰਸਟ ਸੰਵਾਦ TTS ਹੈ ।
ਡਿਵੈਲਪਰ: Nari Labs · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
VoxCPM Standard
Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName
ਡਿਵੈਲਪਰ: OpenBMB · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
TADA Standard
ਟੈਕਸਟ- ਆਡੀਓ ਡਬਲ ਐਲੀਮੈਂਟੇਸ਼ਨ ਨਾਲ ਜ਼ੀਰੋ- ਹਲੂਸੀਨੇਸ਼ਨ TTS, ਤੁਲਨਾਤਮਕ LLM TTS ਨਾਲੋਂ5ਗੁਣਾ ਤੇਜ਼ ਹੈ ।
ਡਿਵੈਲਪਰ: Hume AI · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
VibeVoice Standard
ਪੋਡਕਾਸਟ ਅਤੇ ਆਡੀਓਬੁੱਕਾਂ ਵਰਗੇ ਲੰਬੇ-ਫਾਰਮ ਮਲਟੀ-ਸਪੀਕਰ ਸਮੱਗਰੀ ਲਈ Microsoft ਮਾਡਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Microsoft · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ਡਿਵੈਲਪਰ: Alibaba (FunAudioLLM) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice 2
ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਸਮਾਨਤਾ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੋਡ-ਟਾਈਮ ਨਾਲ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, de, it, es
ਕਲੋਨ ਆਵਾਜ਼
GLM-TTS
ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਅੱਖਰ ਗਲਤੀ ਦਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
IndexTTS-2
ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
Spark TTS
ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
GPT-SoVITS
ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko
ਕਲੋਨ ਆਵਾਜ਼
Chatterbox
ਰੀਸਿਮਬਿਲ AI ਤੋਂ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਸਟੇਟ-ਆਫ-ਦਿ-ਆਰਟ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਵੌਇਸ ਕਲੋਨਿੰਗ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
Tortoise TTS
ਮਲਟੀ-ਵਾਇਸ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਆਟੋ-ਰਿਗਰੈੱਸਿਵ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਕੁਆਲਟੀ ਉੱਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
OpenVoice
ਸਟਾਈਲ, ਭਾਵਨਾ ਅਤੇ ਅੱਖਰਾਂ ਉੱਤੇ ਗਰਾਨੀਕਲ ਕੰਟਰੋਲ ਨਾਲ ਤੁਰੰਤ ਬੋਲੀ ਕਲੋਨਿੰਗ । Name
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, de, es, it
ਕਲੋਨ ਆਵਾਜ਼
Qwen3 TTS
ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਪਹਿਲਾਂ-ਸੈੱਟ ਬੋਲੀਆਂ ਅਤੇ ਪਾਠ ਤੋਂ ਬੋਲੀ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, de, fr, ru, pt, es, it
ਕਲੋਨ ਆਵਾਜ਼
Chatterbox Turbo
ਸਬ-200ms ਲੈਟੇਨਸੀ ਅਤੇ ਹਸਣ, ਖੰਘਣ ਅਤੇ ਹੋਰ ਲਈ ਪੈਰਾਲਿੰਗੁਇਸਟਿਕ ਟੈਗ ਨਾਲ ਤੇਜ਼ ਚੈਟਰਬਾਕਸ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
VoxCPM
Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistencyName
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
OuteTTS
LLM ਅਧਾਰਿਤ TTS, ਜੋ ਕਿ CPU, GPU, ਜਾਂ ਝਲਕਾਰਾ ਉੱਤੇ llama. cpp ਅਤੇ Transformers. js ਰਾਹੀਂ ਚੱਲਦਾ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
Pocket TTS
ਇੱਕ ਸੈਂਪਲ ਤੋਂ ਬੋਲੀ ਕਲੋਨਿੰਗ ਨਾਲ ਕਿਊਟਾਈ ਵਲੋਂ ਹਲਕਾ 100M ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਹੈ । Name
ਭਾਸ਼ਾਵਾਂ: en, fr
ਕਲੋਨ ਆਵਾਜ਼
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, de, es, fr, it, ru
ਕਲੋਨ ਆਵਾਜ਼
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ਭਾਸ਼ਾਵਾਂ: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
ਕਲੋਨ ਆਵਾਜ਼
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼ਡਿਵੈਲਪਰ- ਪਹਿਲਾਂ API
OpenAI- ਅਨੁਕੂਲ REST API । ਇੱਕ ਅੰਤ- ਬਿੰਦੂ, 22+ ਮਾਡਲ । ਰੀਅਲ- ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ ।
- OpenAI- ਅਨੁਕੂਲ ਫਾਰਮੈਟ
- ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ TTS ਸਟਰੀਮਿੰਗ
- ਵੱਡੇ ਕੰਮਾਂ ਲਈ ਬੈਚ ਪਰੋਸੈਸ
- ਵੈੱਬਹੁੱਕ ਨੋਟੀਫਿਕੇਸ਼ਨ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ਸਧਾਰਨ, ਪਾਰਦਰਸ਼ੀ ਕੀਮਤ
ਮੁਫਤ ਸ਼ੁਰੂ ਕਰੋ । ਜਿਵੇਂ ਤੁਸੀਂ ਵਧਦੇ ਹੋ ਸਕੇਲ ਕਰੋ ।
ਮੁਫਤ
15 ਕ੍ਰੈਡਿਟ
- Kokoro, Piper, VITS, MeloTTS
- 500 ਅੱਖਰ ਲਿਮਟ
- 3 ਜਨ/ ਘੰਟਾ (ਕੋਈ ਖਾਤਾ ਨਹੀਂ)
ਪਰੋ
2,000 ਕਰੈਡਿਟ/ਮਹੀਨਾ
- ਸਟਾਰਟਅੱਪ ਵਿੱਚ ਸਭ
- API ਪਹੁੰਚ
- ਤਰਜੀਹ ਪਰੋਸੈਸਿੰਗ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
ਅਸੀਂ ਕੀ ਸੁਧਾਰ ਕਰ ਸਕਦੇ ਹਾਂ? ਤੁਹਾਡੀ ਟਿੱਪਣੀ ਸਾਨੂੰ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।
AI ਬੋਲੀ ਅੱਜ ਵਰਤੋਂ ਸ਼ੁਰੂ ਕਰੋ
TTS.ai ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਰਚਨਾਕਾਰਾਂ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਕਾਰੋਬਾਰਾਂ ਨਾਲ ਜੁੜੋ