VibeVoice

Speaker 2

സ്റ്റാന്‍ഡേര്‍ഡ് ഇംഗ്ലീഷ്Name Neutral VibeVoice

{നമ്പര്‍} എന്നത് {മൈന്‍ഡര്‍} {മൈല്‍} ടെക്സ്റ്റില്‍ പ്രവര്‍ത്തിപ്പിക്കുന്ന ശബ്ദം. {Language} സംസാരം {Language} നല്‍കുകയും (Shift} Synitis) നല്‍കുകയും ചെയ്യും. അടുത്തതു്- ഇന്‍സ്റ്റന്‍റ് തലമുറയുടെ വേഗതയും ഗുണമേന്മയും {rakeing}/5, Speaker 2-നു് {Set_ }-നു് നന്നായി ചേരുന്നു. {മൈല്‍} എന്‍ജിന്‍ നിര്‍മ്മിച്ചിരിക്കുന്നത് {ഇന്‍ജിനര്‍} കൊണ്ട്, വാണിജ്യ ഉപയോഗത്തില്‍ സുരക്ഷിതമാക്കുന്നു. കീയുടെ കഴിവുകള്‍ : {fences}.

ഇതുവരെ റേറ്ററുകള്‍ ഇല്ല

VibeVoiceമോഡല്‍ വിവരം

മോഡ് VibeVoice
രചയിതാവു് Microsoft
നിലവാരം
വേഗത വേഗത
അനുമതി MIT
ക്ളൈനിങ്ങ് ലഭ്യമല്ല
ടിയെര്‍ സ്റ്റാന്‍ഡേര്‍ഡ് (2 മാര്‍ബിള്‍/1K അക്ഷരങ്ങള്‍)
പരാമീറ്ററുകള്‍ 1.5B
ഭൂമദ്ധ്യരേഖ/ അഗ്രകോടി ഉയര്‍ത്തല്‍ [ENTER] LLM + DAC
പരിശീലന ഡേറ്റാ 100000 മണിക്കൂറുകള്‍
കൊല്ലം 2025

കേസുകള്‍ നല്ല രീതിയില്‍ ഉപയോഗിക്കുക Speaker 2

ഈ ശബ്ദത്തിന്റെ വിശേഷതകളെ അടിസ്ഥാനമാക്കിയുള്ള പ്രയോഗങ്ങള്‍ ശുപാര്‍ശ ചെയ്യുന്നു

ഓഡിയോ പുസ്തകങ്ങളും ശ്രോതസ്സുകളും

സ്വാഭാവികമായ പ്രൊസോഡിയും ഭാവവും ഉള്ള ഉള്ളടക്കത്തെ വിവരിയ്ക്കാന്‍ Speaker 2 ഉപയോഗിയ്ക്കുക.

ചലച്ചിത്രശബ്ദങ്ങള്‍Name

യു. എ⁠സ്‌.

Apps & ആക്സസിബിളിറ്റി

വേഗത്തിലുള്ള തലമുറ യഥാര്‍ത്ഥ സമയ വായനകള്‍, സ്ക്രീന്‍ വായനകള്‍, ആക്സസിബിളിറ്റി ഉപകരണങ്ങള്‍ എന്നിവയ്ക്കു് ഈ ശബ്ദം അനുയോജ്യമാക്കും.

സ്കെയിലുകളും ബ്രാക്കറ്റുകളും

സ്റ്റുഡിയോ-വിഡ്ജെറ്റ്സ്, റേഡിയോ, പ്രൊഫഷണല്‍ പ്രക്ഷേപണങ്ങള്‍ക്ക് അനുയോജ്യമായ ഔട്ട്പുട്ട്.

കൂടുതല്‍ VibeVoice ശബ്ദംകള്‍

ഒരേ TTS മാതൃകയില്‍ നിന്നുള്ള ശബ്ദങ്ങള്‍

Speaker 1

ഇംഗ്ലീഷ്Name Neutral

Speaker 1 (Chinese)

ചൈനീസ്‌ Neutral

Speaker 2 (Chinese)

ചൈനീസ്‌ Neutral

Speaker 3

ഇംഗ്ലീഷ്Name Neutral

Speaker 4

ഇംഗ്ലീഷ്Name Neutral

പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ

Microsofts-നുളള വിബ്യോസ് രണ്ടു രീതിയില്‍ ലഭ്യമാകുന്നു: 1.5B മോഡും (മുഴുവനും 90 മിനിട്ട് വരെയുള്ള വരികള്‍), 1.5-നും (മുഴു ശബ്ദകര്‍ത്താവ്), 1.5-ആം സമയ മാതൃകയും 1.0-ആം ഓഡിയോ അഭ്യാസമുള്ള ആദ്യത്തെ ഓഡിയോ അക്കങ്ങള്‍ നിര്‍മ്മിക്കുന്നു. കുറിപ്പുകാരന്‍ സ്പാക്കില്‍ നിന്നും ശബ്ദകര്‍ഷത്തില്‍ നിന്നും ശബ്ദകര്‍ഷത്തില്‍ നിന്നും മിക്നോട്ടണ്‍ ടിടിഎസ് നിര്‍മ്മിച്ചു്‍ ഉല്‍പാദിപ്പിക്കുന്ന ശബ്ദോപകരണങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്നു.

വിബെവോവിസ് വികസിപ്പിച്ചത് മൈക്രോസോഫ്റ്റ് നിര്‍മ്മിച്ചു. ഉല്‍പ്പാദിപ്പിക്കപ്പെട്ട ഓഡിയോ ഉപയോഗിക്കാന്‍ അനുവദിയ്ക്കുന്ന MIT (search- value) ലൈസന്‍സിന്റെ കീഴിലാണ്.

വിബെവോവിസ് 1 ഭാഷയെ പിന്തുണയ്ക്കുന്നു: ഇംഗ്ലീഷില്‍.

വൈബെവോവിസ്‌ പ്രീമിയം സ്‌ലേറ്ററിലാണ്‌ —⁠ 1,000 അക്ഷരങ്ങൾക്ക് 4 സ്‌ട്രാർഡ്‌.

വിബെവോവിസിന് മിതമായ തലമുറയുടെ വേഗതയുണ്ട്. സാധാരണയായി, പദാവലിയുടെ നീളം അനുസരിച്ച് ചില സെക്കന്‍ഡുകള്‍ എടുക്കുന്നു.

വിബെവോവിസിന് TTS.ai-ല്‍ ഓഡിയോ ഗുണത്തിനു 5/5 ആയി കണക്കാക്കിയിട്ടുണ്ട്. അത് സ്റ്റുഡിയോ ഗ്രേഡ്, മനുഷ്യതരത്തിലുള്ള സംസാരം നല്‍കുന്നു.

ഇല്ല, വിബെവോവിസ് ഒരു നിര്‍മ്മിച്ച ശബ്ദങ്ങള്‍ ഉപയോഗിക്കുന്നു. ശബ്ദത്തില്‍ കൊസിവോയിസ് 2, GPT-SVS അല്ലെങ്കില്‍ ചാറ്റര്‍ട്ടര്‍ബോക്സ് പോലെയുള്ള മോഡലുകള്‍ പരീക്ഷിക്കുക.

അതെ, വൈബെവോവിസ്, പോസ്റ്റ്‌വിറ്റ്സ്, ഓഡിയോപുസ്തകങ്ങള്‍, നീണ്ട മള്‍ട്ടിപ്പിള്‍ സ്പീക്കര്‍ ഉള്ളടക്കങ്ങള്‍ക്ക് പ്രത്യേകം ശുപാര്‍ശ ചെയ്യുന്നു. ഇതിന്റെ മള്‍ട്ടിപ്പിള്‍ സ്പ്രെറ്റര്‍, 90 മിനുട്ടോളം, പോട്ട്‌ടിക് തലമുറയുടെ കഴിവുകള്‍ ഈ ഉപയോഗ കേസിനു വളരെ മികച്ച ഒന്നാക്കുന്നു.

അതെ, വൈബ്‌വെയിസ് ലൈസന്‍സ് ലൈസന്‍സ് ആണ്, വാണിജ്യ ഉപയോഗം അനുവദിക്കുന്ന എം.ടി (അന്വേഷണം- ജാഥ). വീഡിയോകള്‍, പോര്‍ച്ചുഗീസ്‌, ആപ്സ്, കളികള്‍, മറ്റ് ഏതെങ്കിലും വാണിജ്യ പദ്ധതിയില്‍ ശബ്ദങ്ങള്‍ ഉണ്ടാക്കാന്‍ സാധിക്കുന്നു.

അതെ, TTS.ai ലെ എല്ലാ ശബ്ദങ്ങളും വാണിജ്യ വിതരണ സജ്ജീകരണ മോഡലുകള്‍ (MIT, അച്ചാരാട്ട് 2. 0) ഉപയോഗിക്കുന്നു. നിര്‍മ്മിക്കപ്പെട്ട ഓഡിയോ നിങ്ങള്‍ക്ക് വീഡിയോകള്‍, പോസ്റ്റ്‌പോര്‍ട്ട് ആപ്സ്, ആപ്സ്, കളികള്‍, മറ്റ് ഏതെങ്കിലും വാണിജ്യ പ്രയോഗങ്ങള്‍ ഉപയോഗിക്കാനാണു്.

/api/v/ 1/ tts/ ല്‍ മാതൃകയുടെ നാമത്തോടും ശബ്ദത്തിന്റെ ഐഡിയോടും കൂടി ഒരു PAST അഭ്യര്‍ത്ഥന അയക്കുക. പൈത്തണ്‍, ജാവാസ്ക്രിപ്റ്റ്, Go, ക്യുഎസ് എന്നിവയിലുളള ഉദാഹരണങ്ങള്‍ക്കായി ഞങ്ങളുടെ API സഹായക്കുറിപ്പു് താള്‍ കാണുക.

അതെ, മാതൃകകള്‍ കേള്‍ക്കാന്‍ ഈ താളില്‍ കളിക്കുന്നതിനുള്ള ബട്ടണ്‍ ഞൊട്ടുക. സംസാര താളിലെ പദാവലിയില്‍ നിങ്ങള്‍ക്കു് യഥേഷ്ടമായ പദാവലി ടൈപ്പ് ചെയ്യുകയും ഏതെങ്കിലും ശബ്ദത്താല്‍ സ്വതന്ത്രമായ പ്രിവ്യൂ ഉണ്ടാക്കുകയും ചെയ്യാം.

ശ്രമിക്കൂ Speaker 2 ഉടന്‍

ഏതു് വാചകവും ടൈപ്പ് ചെയ്തു് അതു് കേള്‍പ്പിക്കുക Speaker 2. ഉപയോഗിക്കുവാനുളള ഫ്രീ.