ਮੁਫਤ AI ਪਾਠ ਤੋਂ ਬੋਲੀComment
20+ ਖੋਲ੍ਹੇ ਸਰੋਤ ਮਾਡਲ, 107+ ਆਵਾਜ਼ਾਂ, 32+ ਕੋਈ ਅਕਾਊਂਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ ।
ਬੋਲੀ AI ਲਈ ਤੁਹਾਨੂੰ ਜੋ ਵੀ ਲੋੜੀਦਾ ਹੈ
30+ ਟੂਲ ਓਪਨ-ਸੋਰਸ AI ਮਾਡਲਾਂ ਨਾਲ ਚਾਲੂ
20+ AI ਬੋਲੀ ਮਾਡਲ
ਇੱਕ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਦਾ ਸਭ ਤੋਂ ਵਿਆਪਕ ਭੰਡਾਰName
Kokoro Free
ਕੋਕੋਰੋ ਇੱਕ 82 ਮਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ ਆਪਣੇ ਭਾਰ ਕਲਾਸ ਤੋਂ ਉੱਪਰ ਹੈ। ਇਸ ਦੇ ਛੋਟੇ ਸਾਈਜ਼ ਦੇ ਬਾਵਜੂਦ, ਇਹ ਬਹੁਤ ਹੀ ਕੁਦਰਤੀ ਅਤੇ ਸਪੱਸ਼ਟ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਕੋਕੋਰੋ ਅੰਗਰੇਜ਼ੀ, ਜਾਪਾਨੀ, ਚੀਨੀ ਅਤੇ ਕੋਰੀਆਈ ਸਮੇਤ ਕਈ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ। ਇਹ ਅਵਿਸ਼ਵਾਸ਼ਯੋਗ ਤੇਜ਼ ਚੱਲਦਾ ਹੈ - ਇੱਕ GPU ਉੱਤੇ ਰੀਅਲ-ਟਾਈਮ ਨਾਲੋਂ ਲਗਭਗ 100x ਤੇਜ਼ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ।
ਇਸ ਲਈ ਵਧੀਆ: ਘੱਟੋ- ਘੱਟ ਲੇਟਸੀ ਨਾਲ ਉੱਚ ਕੁਆਲਟੀ TTS, ਸਟਰੀਮਿੰਗ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
Piper Free
ਪਾਈਪਰ ਇੱਕ ਹਲਕਾ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਇੰਜਣ ਹੈ, ਜੋ ਕਿ ਰਸਸਪੀ ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ VITS ਅਤੇ ਲਾਂਰੀਕਸ ਢਾਂਚੇ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ । ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ CPU ਉੱਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਐਡਜਸਟਮੈਂਟ ਜੰਤਰਾਂ, ਘਰ ਆਟੋਮੈਟਿਕ ਅਤੇ ਆਫਲਾਇਨ TTS ਦੀ ਲੋੜ ਵਾਲੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ । 30+ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ 100 ਤੋਂ ਵੱਧ ਆਵਾਜ਼ਾਂ ਨਾਲ, ਪਾਈਪਰ ਇੱਕ ਰਸਬੇਰੀ ਪੀ4 ਉੱਤੇ ਵੀ ਅਸਲੀ- ਸਮੇਂ ਦੀ ਗਤੀ ਨਾਲ ਕੁਦਰਤੀ- ਸੁਣਨਯੋਗ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਤੁਰੰਤ ਝਲਕ, ਪਹੁੰਚਯੋਗਤਾ ਅਤੇ ਇੰਬੈੱਡ ਐਪਲੀਕੇਸ਼ਨName
ਮੁਫਤ ਕੋਸ਼ਿਸ
VITS Free
VITS (ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਭਿੰਨਤਾ ਅਨੁਮਾਨ ਨਾਲ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਵਿਭਿੰਨਤਾ ਅਨੁਮਾਨ ਨੂੰ ਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਜਾਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਕੁਦਰਤੀ ਬੋਲੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀName
ਮੁਫਤ ਕੋਸ਼ਿਸ
MeloTTS Free
MyShell. ai ਵਲੋਂ MeloTTS ਇੱਕ ਬਹੁ- ਭਾਸ਼ਾ TTS ਲਾਇਬਰੇਰੀ ਹੈ, ਜੋ ਕਿ ਅੰਗਰੇਜ਼ੀ (ਅਮਰੀਕੀ, ਬ੍ਰਿਟਿਸ਼, ਭਾਰਤੀ, ਆਸਟਰੇਲੀਆਈ), ਸਪੇਨੀ, ਫਰੈਂਚ, ਚੀਨੀ, ਜਾਪਾਨੀ ਅਤੇ ਕੋਰੀਆਈ ਲਈ ਸਹਾਇਕ ਹੈ । ਇਹ ਬਹੁਤ ਤੇਜ਼ ਹੈ, ਕੇਵਲ CPU ਉੱਤੇ ਰੀਅਲ- ਟਾਈਮ ਗਤੀ ਨਾਲ ਪਾਠ ਪਰੋਸੈੱਸ ਕਰਦਾ ਹੈ । MeloTTS ਉਤਪਾਦਨ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ CPU ਅਤੇ GPU ਦੋਹਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।
ਇਸ ਲਈ ਵਧੀਆ: ਉਤਪਾਦਨ ਐਪਲੀਕੇਸ਼ਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼, ਬਹੁ- ਭਾਸ਼ਾ TTS ਦੀ ਲੋੜ ਹੈName
ਮੁਫਤ ਕੋਸ਼ਿਸ
Bark Standard
ਟਰਾਂਸਫਾਰਮਰ ਅਧਾਰਿਤ ਪਾਠ- ਤੋਂ- ਆਡੀਓ ਮਾਡਲ, ਜੋ ਕਿ ਅਸਲੀ ਬੋਲੀ, ਸੰਗੀਤ ਅਤੇ ਸਾਊਂਡ ਪਰਭਾਵ ਪੈਦਾ ਕਰਦਾ ਹੈ । Name
ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Bark Small Standard
ਬਰਕ ਦਾ ਹਲਕਾ ਵਰਜਨ ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਅਤੇ ਘੱਟ ਮੈਮੋਰੀ ਵਰਤੋਂ ਨਾਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Suno · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice 2 Standard
ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਪਰਿਵਾਰਕ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੇਟੈਂਸੀ ਨਾਲ ਹੈ।
ਡਿਵੈਲਪਰ: Alibaba (Tongyi Lab) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Dia TTS Standard
ਮਲਟੀ- ਸਪੀਕਰ ਡਾਈਲਾਗ ਜਨਰੇਸ਼ਨ ਮਾਡਲ, ਜੋ ਕਿ ਸਪੀਕਰ ਦਰਮਿਆਨ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਬਣਾਉਂਦਾ ਹੈ।
ਡਿਵੈਲਪਰ: Nari Labs · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Parler TTS Standard
ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਵਿੱਚ ਆਪਣੀ ਪਸੰਦ ਦੀ ਆਵਾਜ਼ ਦੱਸੋ ਅਤੇ ਪਾਰਲਰ ਮੇਲ ਖਾਂਦਾ ਬੋਲ ਤਿਆਰ ਕਰੇਗਾ ।
ਡਿਵੈਲਪਰ: Hugging Face · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
GLM-TTS Standard
ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਅੱਖਰ ਗਲਤੀ ਦਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ।
ਡਿਵੈਲਪਰ: Zhipu AI · ਲਾਈਸੈਂਸ: GLM-4 License
ਕੋਸ਼ਿਸ਼ ਕਰੋ
IndexTTS-2 Standard
ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।
ਡਿਵੈਲਪਰ: Index Team · ਲਾਈਸੈਂਸ: Bilibili Model License
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Spark TTS Standard
ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name
ਡਿਵੈਲਪਰ: SparkAudio · ਲਾਈਸੈਂਸ: CC BY-NC-SA 4.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
GPT-SoVITS Standard
ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।
ਡਿਵੈਲਪਰ: RVC-Boss · ਲਾਈਸੈਂਸ: MIT
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Orpheus Standard
100K ਘੰਟੇ ਬੋਲੀ ਡਾਟਾ ਉੱਤੇ ਟਰੇਨ ਕੀਤਾ ਮਨੁੱਖੀ- ਪੱਧਰ ਦਾ ਭਾਵਨਾਤਮਕ TTS ਮਾਡਲ ਹੈ ।
ਡਿਵੈਲਪਰ: Canopy Labs · ਲਾਈਸੈਂਸ: Llama 3.2 Community
ਕੋਸ਼ਿਸ਼ ਕਰੋ
Qwen3 TTS Standard
ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਪਹਿਲਾਂ-ਸੈੱਟ ਬੋਲੀਆਂ ਅਤੇ ਪਾਠ ਤੋਂ ਬੋਲੀ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ।
ਡਿਵੈਲਪਰ: Alibaba (Qwen) · ਲਾਈਸੈਂਸ: Apache 2.0
ਕੋਸ਼ਿਸ਼ ਕਰੋ
CosyVoice 2
ਅਲੀਬਾਬਾ ਦਾ ਮਾਪਯੋਗ ਸਟਰੀਮਿੰਗ TTS ਮਨੁੱਖੀ-ਪਰਿਵਾਰਕ ਕੁਦਰਤੀਤਾ ਅਤੇ ਨਜ਼ਦੀਕੀ-ਸ਼ੂਨਾ ਲੇਟੈਂਸੀ ਨਾਲ ਹੈ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, de, it, es
ਕਲੋਨ ਆਵਾਜ਼
GLM-TTS
ਓਪਨ- ਸਰੋਤ TTS ਮਾਡਲਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਅੱਖਰ ਗਲਤੀ ਦਰ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
IndexTTS-2
ਜ਼ੀਰੋ-ਸ਼ੋਟ TTS, ਜਿਸ ਵਿੱਚ ਚੰਗੀ ਤਰ੍ਹਾਂ ਰੇਖਾਂਕਿਤ ਭਾਵਨਾ ਕੰਟਰੋਲ ਅਤੇ ਉੱਚ ਭਾਵਨਾਵਾਂ ਹਨ ।
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
Spark TTS
ਕੰਟਰੋਲਯੋਗ ਭਾਵਨਾ ਅਤੇ ਪੁੱਛਗਿੱਛ ਰਾਹੀਂ ਬੋਲਣ ਸ਼ੈਲੀ ਨਾਲ ਬੋਲੀ ਕਲੋਨਿੰਗ TTS । Name
ਭਾਸ਼ਾਵਾਂ: en, zh
ਕਲੋਨ ਆਵਾਜ਼
GPT-SoVITS
ਕੁਝ-ਸ਼ੋਟਾਂ ਵਾਲੀ ਆਵਾਜ਼ ਕਲੋਨਿੰਗ TTS, ਜੋ ਕਿ ਆਡੀਓ ਦੇ ਸਿਰਫ5ਸਕਿੰਟਾਂ ਤੋਂ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਦੁਹਰਾਉਦੀ ਹੈ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko
ਕਲੋਨ ਆਵਾਜ਼
Chatterbox
ਰੀਸਿਮਬਿਲ AI ਤੋਂ ਭਾਵਨਾ ਕੰਟਰੋਲ ਨਾਲ ਸਟੇਟ-ਆਫ-ਦਿ-ਆਰਟ ਜ਼ੀਰੋ-ਸ਼ੋਟ ਵੌਇਸ ਕਲੋਨਿੰਗ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
Tortoise TTS
ਮਲਟੀ-ਵਾਇਸ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ, ਆਟੋ-ਰਿਗਰੈੱਸਿਵ ਆਰਕੀਟੈਕਚਰ ਨਾਲ ਕੁਆਲਟੀ ਉੱਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ।
ਭਾਸ਼ਾਵਾਂ: en
ਕਲੋਨ ਆਵਾਜ਼
OpenVoice
ਸਟਾਈਲ, ਭਾਵਨਾ ਅਤੇ ਉਚਾਰਨ ਉੱਤੇ ਗਰਾਨੀਕਲ ਕੰਟਰੋਲ ਨਾਲ ਤੁਰੰਤ ਬੋਲੀ ਕਲੋਨਿੰਗName
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, fr, de, es, it
ਕਲੋਨ ਆਵਾਜ਼
Qwen3 TTS
ਅਲੀਬਾਬਾ ਦਾ ਬਹੁ-ਭਾਸ਼ਾ TTS, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਪਹਿਲਾਂ-ਸੈੱਟ ਬੋਲੀਆਂ ਅਤੇ ਪਾਠ ਤੋਂ ਬੋਲੀ ਡਿਜ਼ਾਈਨ ਨਾਲ ਹੈ।
ਭਾਸ਼ਾਵਾਂ: en, zh, ja, ko, de, fr, ru, pt, es, it
ਕਲੋਨ ਆਵਾਜ਼ਡਿਵੈਲਪਰ- ਪਹਿਲਾਂ API
OpenAI- ਅਨੁਕੂਲ REST API । ਇੱਕ ਅੰਤ- ਬਿੰਦੂ, 22+ ਮਾਡਲ । ਰੀਅਲ- ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ ।
- OpenAI- ਅਨੁਕੂਲ ਫਾਰਮੈਟ
- ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ TTS ਸਟਰੀਮਿੰਗ
- ਵੱਡੇ ਕੰਮਾਂ ਲਈ ਬੈਚ ਪਰੋਸੈਸ
- ਵੈੱਬਹੁੱਕ ਨੋਟੀਫਿਕੇਸ਼ਨ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ਸਧਾਰਨ, ਪਾਰਦਰਸ਼ੀ ਕੀਮਤ
ਮੁਫਤ ਸ਼ੁਰੂ ਕਰੋ । ਜਿਵੇਂ ਤੁਸੀਂ ਵਧਦੇ ਹੋ ਸਕੇਲ ਕਰੋ ।
ਮੁਫਤ
15 ਕ੍ਰੈਡਿਟ
- Kokoro, Piper, VITS, MeloTTS
- 500 ਅੱਖਰ ਲਿਮਟ
- 3 ਜਨ/ ਘੰਟਾ (ਕੋਈ ਖਾਤਾ ਨਹੀਂ)
ਪਰੋ
2,000 ਕਰੈਡਿਟ/ਮਹੀਨਾ
- ਸਟਾਰਟਅੱਪ ਵਿੱਚ ਸਭ
- API ਪਹੁੰਚ
- ਤਰਜੀਹ ਪਰੋਸੈਸਿੰਗ
ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ
AI ਬੋਲੀ ਅੱਜ ਵਰਤੋਂ ਸ਼ੁਰੂ ਕਰੋ
TTS.ai ਦੀ ਵਰਤੋਂ ਕਰਦਿਆਂ ਰਚਨਾਕਾਰਾਂ, ਡਿਵੈਲਪਰਾਂ ਅਤੇ ਕਾਰੋਬਾਰਾਂ ਨਾਲ ਜੁੜੋ