VibeVoice

Speaker 1 (Chinese)

ਸਟੈਂਡਰਡ ਚੀਨੀ Neutral VibeVoice

Speaker 1 (Chinese) ਇੱਕ neutral AI ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ VibeVoice ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਨਾਲ ਚੱਲਦੀ ਹੈ । ਇਹ ਸਟੈਂਡਰਡ- ਲੈਵਲ ਆਵਾਜ਼ ਚੀਨੀ ਬੋਲਦੀ ਹੈ ਅਤੇ ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦੀ ਹੈ । ਨੇੜੇ- ਤੁਰੰਤ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਅਤੇ 5/5 ਦੀ ਕੁਆਲਟੀ ਰੇਟਿੰਗ ਨਾਲ Speaker 1 (Chinese) podcasts, dialogues, long-form narration, multi-speaker content ਲਈ ਢੁਕਵਾਂ ਹੈ। VibeVoice ਇੰਜਣ Microsoft under the MIT license ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ । ਮੁੱਖ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ: {ਫੀਚਰ}।

ਰੇਟਿੰਗ ਨਹੀਂ

VibeVoiceਮਾਡਲ ਜਾਣਕਾਰੀ

ਮਾਡਲ VibeVoice
ਡਿਵੈਲਪਰ Microsoft
ਕੁਆਲਟੀ
ਸਪੀਡ ਸਥਿਰ
ਲਾਈਸੈਂਸ MIT
ਕਲੋਨਿੰਗ ਉਪਲੱਬਧ ਨਹੀਂ
ਜਾਨਵਰ ਸਟੈਂਡਰਡ (2 ਕ੍ਰੈਡਿਟ/ 1K ਅੱਖਰ)
ਪੈਰਾਮੀਟਰ 1.5B
ਆਰਕੀਟੈਕਚਰ LLM + DAC
ਟਰੇਨਿੰਗ ਡਾਟਾ 100000 ਘੰਟੇ
ਸਾਲ 2025

ਇਸ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਰਤੋਂ ਕੇਸ Speaker 1 (Chinese)

ਇਸ ਆਵਾਜ਼ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਉੱਤੇ ਅਧਾਰਿਤ ਸਿਫਾਰਸ਼ੀ ਐਪਲੀਕੇਸ਼ਨ

ਆਡੀਓਬੁੱਕਾਂ ਅਤੇ ਗਾਇਨ

Speaker 1 (Chinese) ਨੂੰ ਲੰਬੇ ਫਾਰਮ ਸਮੱਗਰੀ ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਅਤੇ ਸਮੀਕਰਨ ਨਾਲ ਦੱਸਣ ਲਈ ਵਰਤੋਂ ।

ਵਿਡੀਓ ਬੋਲੀ

ਯੂਟਿਊਬ ਵਿਡੀਓਜ਼, ਐਡਸ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸਮੱਗਰੀ ਲਈ ਪੇਸ਼ੇਵਰ ਨਾਂਅ ਸ਼ਾਮਲ ਕਰੋ।

ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ

ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਨਾਲ ਇਹ ਆਵਾਜ਼ ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ, ਸਕਰੀਨ ਰੀਡਰ ਅਤੇ ਪਹੁੰਚਯੋਗ ਟੂਲ ਲਈ ਢੁਕਵੀਂ ਹੈ।

ਪੋਡਕਾਸਟ ਅਤੇ ਬਰਾਡਕਾਸਟ

ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਪੋਡਕਾਸਟ, ਰੇਡੀਓ ਅਤੇ ਪਰੋਫੈਸ਼ਨਲ ਬਰਾਡਕਾਸਟ ਲਈ ਢੁੱਕਵਾਂ ਹੈ ।

ਹੋਰ VibeVoice ਆਵਾਜ਼ਾਂ

ਇੱਕੋ TTS ਮਾਡਲ ਤੋਂ ਹੋਰ ਆਵਾਜ਼ਾਂ

Speaker 1

ਅੰਗਰੇਜ਼ੀ Neutral

Speaker 2

ਅੰਗਰੇਜ਼ੀ Neutral

Speaker 2 (Chinese)

ਚੀਨੀ Neutral

Speaker 3

ਅੰਗਰੇਜ਼ੀ Neutral

Speaker 4

ਅੰਗਰੇਜ਼ੀ Neutral

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

Microsoft ਵਾਇਬਵਾਇਸ ਦੋ ਰੂਪਾਂ ਵਿੱਚ ਆਉਂਦਾ ਹੈ: ਲੰਬੇ-ਫਾਰਮ ਸਮੱਗਰੀ ਲਈ 1.5B ਮਾਡਲ (90 ਮਿੰਟ ਤੱਕ,4ਸਪੀਕਰ) ਅਤੇ ਰੀਅਲਟਾਈਮ 0.5B ਮਾਡਲ ~200ms ਪਹਿਲੀ ਆਡੀਓ ਲਾਈਟਨਸੀ ਨਾਲ ਸਟਰੀਮਿੰਗ ਲਈ। 1.5B ਰੂਪ ਪੋਡਕਾਸਟ ਅਤੇ ਆਡੀਓਬੁੱਕਾਂ ਲਈ ਵਧੀਆ ਹੈ, ਜਿਸ ਵਿੱਚ ਲੰਬੇ ਪਾਸੇ ਉੱਤੇ ਸਪੀਕਰ ਸਥਿਰਤਾ ਹੈ। ਨੋਟ: Microsoft ਨੇ TTS ਕੋਡ ਨੂੰ ਰਿਪੋਜ਼ਟਰੀ ਤੋਂ ਹਟਾ ਦਿੱਤਾ ਹੈ ਅਤੇ ਬਣਾਇਆ ਆਡੀਓ ਵਿੱਚ ਸੁਣਨਯੋਗ AI ਨਾਂਹ-ਪੱਖੀ ਸ਼ਾਮਲ ਹੈ।

ਵਾਇਬਵਾਇਸ ਨੂੰ ਮਾਈਕਰੋਸਾਫਟ ਨੇ ਵਿਕਸਤ ਕੀਤਾ ਸੀ ਅਤੇ ਇਹ MIT (research-only intent) ਲਾਇਸੈਂਸ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਬਣਾਈ ਆਡੀਓ ਦੇ ਵਪਾਰਕ ਵਰਤੋਂ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

ਵਾਇਬ- ਵਾਇਸ 1 ਭਾਸ਼ਾ ਲਈ ਸਹਾਇਕ ਹੈ: ਅੰਗਰੇਜ਼ੀ ।

VibeVoice ਪ੍ਰੀਮੀਅਮ ਟਾਇਰ ਵਿੱਚ ਹੈ - ਪ੍ਰਤੀ 1,000 ਅੱਖਰ4ਕਰੈਡਿਟ ਹਨ । ਤੁਸੀਂ ਪੂਰੀ ਆਡੀਓ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਕਿਸੇ ਵੀ VibeVoice ਆਵਾਜ਼ ਦੀ ਮੁਫਤ ਝਲਕ ਵੇਖ ਸਕਦੇ ਹੋ ।

ਵਾਇਬ- ਵਾਇਸ ਦੀ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਮੱਧਮ ਹੈ । ਪੈਦਾ ਕਰਨ ਲਈ ਟੈਕਸਟ ਲੰਬਾਈ ਉੱਤੇ ਨਿਰਭਰ ਕਰਕੇ ਕੁਝ ਸਕਿੰਟ ਲੱਗਦੇ ਹਨ ।

ਵਾਇਬਵਾਇਸ ਨੂੰ TTS.ai ਉੱਤੇ ਆਡੀਓ ਕੁਆਲਟੀ ਲਈ 5/5 ਰੇਟਿੰਗ ਦਿੱਤੀ ਗਈ ਹੈ। ਇਹ ਸਟੂਡੀਓ-ਗਰੇਡ, ਮਨੁੱਖੀ-ਜੋੜੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ।

ਨਹੀਂ, ਵਾਇਬਵੌਇਸ ਇੱਕ ਨਿਸ਼ਚਿਤ ਸੈੱਟ ਅੰਦਰੂਨੀ ਆਵਾਜ਼ਾਂ ਵਰਤਦਾ ਹੈ। ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ ਕੋਸੀਵੌਇਸ2, GPT-SoVITS ਜਾਂ ਚੈਟਰਬਕਸ ਵਰਗੇ ਮਾਡਲ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ।

ਹਾਂ, VibeVoice ਨੂੰ ਪੋਡਕਾਸਟ, ਆਡੀਓਬੁੱਕਾਂ, ਲੰਬੇ-ਫਾਰਮ ਮਲਟੀ-ਸਪੀਕਰ ਸਮੱਗਰੀ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ । ਇਸ ਦੀਆਂ ਮਲਟੀ-ਸਪੀਕਰ, 90 ਮਿੰਟ ਤੱਕ, ਪੋਡਕਾਸਟ ਬਣਾਉਣ ਸਮਰੱਥਾਵਾਂ ਇਸ ਨੂੰ ਇਸ ਵਰਤੋਂ ਕੇਸ ਲਈ ਇੱਕ ਵਧੀਆ ਚੋਣ ਬਣਾਉਂਦੀਆਂ ਹਨ ।

ਹਾਂ, ਵਾਇਬਵਾਇਸ ਨੂੰ MIT (ਸਿਰਫ ਖੋਜ ਲਈ) ਅਧੀਨ ਲਾਇਸੈਂਸ ਦਿੱਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ। ਵਾਇਬਵਾਇਸ ਆਡੀਓ ਨਾਲ ਬਣਾਈ ਆਡੀਓ ਨੂੰ ਵੀਡਿਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਹਾਂ, TTS.ai ਉੱਤੇ ਸਭ ਆਵਾਜ਼ਾਂ ਵਪਾਰਕ-ਲਾਈਸੈਂਸ ਖੋਲ੍ਹੇ-ਸਰੋਤ ਮਾਡਲ (MIT, Apache 2.0) ਵਰਤਦੀਆਂ ਹਨ। ਬਣਾਇਆ ਆਡੀਓ ਤੁਹਾਡੇ ਲਈ ਹੈ, ਜੋ ਕਿ ਵਿਡੀਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

/api/v1/tts/ ਨੂੰ ਮਾਡਲ ਨਾਂ ਅਤੇ ਬੋਲੀ ID ਨਾਲ POST ਬੇਨਤੀ ਭੇਜੋ । ਪਾਈਥਨ, ਜਾਵਾ ਸਕ੍ਰਿਪਟ, ਗੋ ਅਤੇ cURL ਵਿੱਚ ਕੋਡ ਉਦਾਹਰਣਾਂ ਲਈ ਸਾਡਾ API ਡੌਕੂਮੈਂਟੇਸ਼ਨ ਪੇਜ਼ ਵੇਖੋ ।

ਹਾਂ, ਇੱਕ ਨਮੂਨਾ ਸੁਣਨ ਲਈ ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਚਲਾਓ ਬਟਨ ਨੂੰ ਦਬਾਉ । ਤੁਸੀਂ ਪਾਠ ਤੋਂ ਬੋਲੀ ਸਫ਼ੇ ਉੱਤੇ ਪਸੰਦੀਦਾ ਪਾਠ ਵੀ ਲਿਖ ਸਕਦੇ ਹੋ ਅਤੇ ਕਿਸੇ ਵੀ ਬੋਲੀ ਨਾਲ ਮੁਫ਼ਤ ਝਲਕ ਵੀ ਬਣਾ ਸਕਦੇ ਹੋ ।

ਕੋਸ਼ਿਸ Speaker 1 (Chinese) ਹੁਣ

ਕੋਈ ਵੀ ਟੈਕਸਟ ਲਿਖੋ ਅਤੇ ਸੁਣੋName Speaker 1 (Chinese). ਵਰਤਣ ਲਈ ਮੁਫਤ.