ഫ്രീ AI സംസാരത്തിനുള്ള വാചകം
33+ തുറന്ന ഏടുകള്, 273+ ശബ്ദം കേള്ക്കുന്നു, 33+ ഭാഷകള്. അക്കൌണ്ട് ആവശ്യമില്ല.
ശബ്ദത്തിന്റെ ആവശ്യമുള്ളതെല്ലാം
30+ ഉപകരണങ്ങള് ഓപ്പണ്- റിസോഴ്സ് എഐ മോഡില് പ്രവര്ത്തിപ്പിയ്ക്കുന്നുName
33+ AI ശബ്ദ മോഡലുകള്
ഒരു പ്ലാറ്റ്ഫോമിലെ തുറക്കുന്ന ടിടിഎസ് മോഡലുകള്
Kokoro ഫ്രീ
കൊക്കോറോ ഒരു 82 ദശലക്ഷം പരാമീറ്റര് ടെക്സ്റ്റുകള്ക്കുള്ള ടെക്സ്റ്റുകള് ആണ്. തൂക്കത്തില് കൂടുതല് കൂടുന്ന ഒരു ചെറിയ അക്ഷരം ഉണ്ടെങ്കില്, അത് വളരെ സ്വാഭാവികവും വര്ദ്ധിപ്പിക്കുന്ന സംസാരം ഉല്പാദിപ്പിക്കുന്നു. കോക്കോറോ ഇംഗ്ലീഷ്, ജപ്പനീസ്, ചൈനീസ്, കൊറിയന് തുടങ്ങിയ പല ഭാഷകള്ക്കു പിന്തുണ ചെയ്യുന്നു. വളരെ വേഗത്തില് അത് GPU-സമയത്ത് പ്രവര്ത്തിക്കുന്നതിലും വേഗത്തില് പ്രവര്ത്തിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വളരെ കുറഞ്ഞ ലോഞ്ച്, സ്റ്റ്രീം പ്രയോഗങ്ങളുള്ള ഉയര്ന്ന ടിടിഎസ്Name
സ്വതന്ത്രമായി ശ്രമിക്കുക
Piper ഫ്രീ
പിപ്പര്, VITS and Lystempy and Ids and Is and Lystem Strints- ല് നിര്മ്മിച്ച ഭാരം കുറഞ്ഞ ടെക്സ്റ്റ് എഞ്ചിന് ആണ്. ഇതു് പൂര്ണ്ണമായും CPU- യില് പ്രവര്ത്തനസജ്ജമാക്കുന്നു. മോര്ന്ന ഉപകരണങ്ങള്, ഹോം-നൈമാറ്റം, പ്രയോഗങ്ങള്ക്ക് ഓണ്ലിറ്റില് ആവശ്യമുളള ഉപകരണങ്ങള്. 30+-ല് കൂടുതല് ശബ്ദങ്ങള് ഉള്ളതിനാല്, ഒരു റാസ്പെറിബെറി 4-ല് ശബ്ദോപൈന് വേഗതയില്, പാപ്പര് പ്രവര്ത്തിപ്പിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: ത്വരിതപ്പെടുത്തല്, ആക്സസിബിളിറ്റി, എംബഡ് ചെയ്ത പ്രയോഗങ്ങള്
സ്വതന്ത്രമായി ശ്രമിക്കുക
VITS ഫ്രീ
VITS (അന്ത്യ-ഘടകത്തില് നിന്ന് വായിക്കാന് പഠിക്കല്) ഒരു സമാന്തര രീതിയാണ്. അത്, ഇപ്പോഴത്തെ രണ്ട് കേന്ദ്ര മോഡലുകള്ക്കപ്പുറം പ്രകൃതിയിലെ ശബ്ദോപകരണങ്ങള് ഉണ്ടാക്കുന്ന ശബ്ദ രീതിയാണ്. അപ്പോള്, പരമ്പരാഗത പരിവര്ത്തനം, പരമ്പരാഗികമായ പരിശീലന പ്രക്രിയകള്, പ്രകൃതിയില് ശ്രദ്ധേയമായ പുരോഗതി നേടുന്നു.
ഏറ്റവും നല്ല സ്കോര്: സാധാരണ ടെക്സ്റ്റില് നിന്നും സ്വാഭാവികമായ സംയോജകങ്ങളുമായി പ്രവര്ത്തിപ്പിയ്ക്കുക
സ്വതന്ത്രമായി ശ്രമിക്കുക
MeloTTS ഫ്രീ
Mylottts ആണ് ഇംഗ്ലീഷ്, ബ്രിട്ടീഷ്, ബ്രിട്ടീഷ്, ഓസ്ട്രേലിയ, സ്പാനിഷ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന് പിന്തുണയുള്ള ഒരു ബഹുഭാഷാ ലൈബ്രറി. സിപിയു-ടൈം-ടൈം-ടൈം വേഗതക്കു സമീപത്തുള്ള പാഠം വളരെ വേഗത്തില് പ്രവര്ത്തിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വേഗത്തില്, ബഹുഭാഷാ TTS ആവശ്യമുളള പ്രയോഗങ്ങള് ഉല്പാദിപ്പിക്കുന്നു
സ്വതന്ത്രമായി ശ്രമിക്കുക
Kani TTS 2 ഫ്രീ
കനി-TS-2 എന്ന ക്വെറി- എം- എം- എം- എംഎംഒസ്എംഎംഎംഎംഎംഎംഎംഎംഎംസ് മോഡല് ആണ്. ഇത് വെറും 3GB vNAMAM- vood- 10 സെക്കന്ഡുകളില് പ്രവര്ത്തിക്കുന്നതും ഒരു 1002 സെക്കന്ഡുകളില് നിന്ന് 1010 സെക്കന്ഡുകള് ഉല്പാദിപ്പിക്കുന്നതുമാണ്. ഇപ്പോള് പുറത്തുവരുന്ന ഒരു പൊതുവായ ഇംഗ്ലീഷ് - ബീജെന്ഡി-എം-എംഡി-എംസ്-എംഡി-എം-എം-എംഡിടിടിടിടിടിടിടിടിഎംഡി-എംബോഡിഡിഡിഡിഡിഗ് (RLORLORE) എന്ന ശബ്ദത്തെ ശബ്ദങ്ങള് കാണിക്കാന് ആവശ്യമില്ല.
ഏറ്റവും നല്ല സ്കോര്: വേഗത്തിലുള്ള ഇംഗ്ലീഷുകാര്ഡ് ഹാര്ഡ്വെയര്, വേഗത്തിലുള്ള പ്രിവ്യൂകള്
സ്വതന്ത്രമായി ശ്രമിക്കുക
OuteTTS ഫ്രീ
പ്രത്യേക നിര്മ്മാണ കേന്ദ്രം സൂക്ഷിക്കുമ്പോള്, ടെക്സ്റ്റില് നിന്നും ഇന്സ്റ്റാള്സുമായി വലിയ ഭാഷാമാലകള് വിടുന്നു. Lama. Cc/ GPUP (CPU), ഹാന്ഡ് മോണിറ്ററുകള് (എക്സിഎം), എക്എംഎംഎഫ്എഫ്വിവ്യൂ (എക്സി), വിന്യാസുകള് (എക്എഫ്എഫ്എംഎസ്എംഎസ്) എന്നിവ ഉള്പ്പെടെ പല ബാക്കുകള് പിന്തുണയ്ക്കുന്നു. സ്പോണ്സര് പ്രൊഫൈല്സുകള് (ജോണ്സസ്സുകള്) എന്ന രീതിയില് ശബ്ദസജ്ജമാക്കിയുള്ള ശബ്ദകര്മ്മങ്ങള് (ജെസാന്).
ഏറ്റവും നല്ല സ്കോര്: എക്ട്രേറ്റമെന്റ്, ബ്രൌസര്- അടിസ്ഥാനമാക്കിയുള്ള TTS, കുറഞ്ഞ- റിസോഴ്സ് പരിസരം
സ്വതന്ത്രമായി ശ്രമിക്കുക
Pocket TTS ഫ്രീ
ക്യുടി (മോടിയുടെ പ്രതിനിധികള്) പോക്കറ്റ് ടിഎസ് (മോഷിയുടെ പ്രതിനിധികള്) ഒരു കംപ്യൂട്ടര് റെക്കോര്ഡ്- ടെക്സ്- ടെക്സ്റ്റുകള് (കോണ്ക്കാറ്റില് കൂടുതല് തുളച്ചെടുക്കുന്ന ഒരു കംപ്യൂട്ടര് ടെക്സ്- ടെക്സ്- റൈല് അഗ്രമാക്കല്) ആണ്. ഇതു സിപിയുപിയു പ്രവര്ത്തിയ്ക്കു് പ്രാവര്ത്തികമായി പ്രവര്ത്തിപ്പിക്കുന്നു, ഒരു ഓഡിയോ മാതൃകയില് നിന്നും പൂജ്യ- ഹോട്ട്- ഹോട്ട്- ഹോട്ട് വോള് വോള് വോള്ഡിക്കോളുകള് പിന്തുണയ്ക്കുന്നു, സ്വാഭാവികമായ സംസാരങ്ങള് ഉല്പാദിപ്പിക്കുന്നു. ചെറിയ വലുപ്പവും താഴ്ന്ന പരിസ്ഥിതിയും സജ്ജീകരിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: ചെറിയ വലിപ്പം, സിപിയു- ഒറ്റ പരിസ്ഥിതി, വേഗത്തിലുള്ള ശബ്ദമിശ്രണോപാധി
സ്വതന്ത്രമായി ശ്രമിക്കുക
Kitten TTS ഫ്രീ
KetenML- ല് നിര്മ്മിച്ച റ്റൈന് ടിടിഎസ്, ഓനെന്എംഎംഎല് നിര്മ്മിച്ച ക്യുഎം ഡിഫന്സ് (25- 80 എം- ടെര്മിനല്), സിപിയു- 80 പരാമീറ്റര് (diBയില്), സിപിയു- 8- ല് നിര്മ്മിക്കാവുന്ന ശബ്ദങ്ങള് ആവശ്യമില്ലാത്തതിനാല് സിപിയു- എംഎം- ല് ശബ്ദങ്ങള് നല്കുന്നു. വര്ഗ്ഗ- ശബ്ദങ്ങള്ക്കു് മാറ്റം വരുത്തുന്നു, ശബ്ദങ്ങള്, വര്ദ്ധിപ്പിക്കുന്നു, അക്ഷരങ്ങള്ക്കുള്ള മുന്കാഴ്ചകള്, അഗ്രകോടികരണങ്ങള്, അഡ്രചുരചുരുതമായ പ്രയോഗങ്ങള് എന്നിവയ്ക്കു് നല്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വേഗത്തിലുള്ള ടിടിഎസ്, ഇലക്ട്രോണിക്, കുറവുള്ള പ്രയോഗങ്ങള്Name
സ്വതന്ത്രമായി ശ്രമിക്കുക
Ming-Omni TTS ഫ്രീ
Ming- stan- Maty- 0. 5B ആണ് ക്യാപ്- ബാക്ക്- എം- എം- മെഡല് നിര്മ്മിച്ച ഒരു കമ്പ്യൂട്ടര് സംസാര രീതി. ബ്രെയിം- ബൈം- പാത്ത്- പാഞ്ച്- ഡീലിങ് ഡീലര് ഉപയോഗിച്ച് നിര്മ്മിച്ചുള്ള ഒബ്ടൈമല് ആല്ഫോര്ഡ് ആല്ഫില്. റിഫയര് 44.41.44kH (ഏര്ഡ് സിഡിയുടെ ഗുണമേന്ഡി), 3++-ല് നിന്നും ല് നിന്നും പൂജ് - Shift-ല് ശബ്ദം സജ്ജമായുള്ള ശബ്ദത്തെ പിന്തുണയ്ക്കുന്നു. കൂടാതെ /BMEner contronser contrasting ons (cystem), J. JSyston onc. J. stonc. onc.
ഏറ്റവും നല്ല സ്കോര്: ഉയര്ന്ന- ഗുണഗണങ്ങള്, വികാരചിഹ്നങ്ങള്, ശബ്ദങ്ങള് പ്രവര്ത്തനം, ചൈനീസ് ഓഡിയോ ബുക്ക് ഉള്ളടക്കങ്ങള്
സ്വതന്ത്രമായി ശ്രമിക്കുക
MOSS-TTS Nano ഫ്രീ
MOS-TS-NON-100-NOS- ല് ഓപ്പണ് എംഎസ്-എം-പാറാര്ട്ടര് ആണ്, MOS-TS കുടുംബത്തിന്റെ 100- പാര്ട്ടി വര്ഗ്ഗമാറ്റം, ഇടവേളയുടെ നിര്മ്മാണ ഘടന പങ്കിടുന്നു. വ്യാപാരികള്, 180x-ആം ഭാരങ്ങള്ക്കുള്ള 8B മോഡല് മുന്തിയ ഗുണനിലവാരം പങ്കിടുന്നു. ഇത് സ്വതന്ത്രവും ഉയര്ന്ന പ്രൊജക്റ്റും ആയ VRAM-ഉപയോഗങ്ങള്ക്ക് അനുയോജ്യമാക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: സ്വതന്ത്ര TTS, ഉയര്ന്ന വോള്ഡം ഉല്പ്പന്നം, കുറഞ്ഞ ഇന്ററാക്ടീവ് ഉപയോഗം
സ്വതന്ത്രമായി ശ്രമിക്കുക
Bark സ്റ്റാന്ഡേര്ഡ്
സാങ്കേതികമായ സംസാരം, സംഗീതം, സൌന്ദര്യ പ്രഭാവങ്ങള് എന്നിവ ഉല്പാദിപ്പിക്കുന്ന ടെക്സ്റ്റര്- അല്യൂഡോ മോഡല്.
രചയിതാവു്: Suno · അനുമതി: MIT
ശ്രമിക്ക്.
Bark Small സ്റ്റാന്ഡേര്ഡ്
വേഗത്തിൽ ഇന്ഫറസും കുറഞ്ഞ മെമ്മറിയുടെ ഉപയോഗവും ഉള്ള ബാര്ക്കിന്റെ ലൈറ്റര് പതിപ്പു്.
രചയിതാവു്: Suno · അനുമതി: MIT
ശ്രമിക്ക്.
CosyVoice 2 സ്റ്റാന്ഡേര്ഡ്
അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന് പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.
രചയിതാവു്: Alibaba (Tongyi Lab) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Dia TTS സ്റ്റാന്ഡേര്ഡ്
ശബ്ദകര്മ്മികള്ക്കിടയില് സ്വാഭാവികമായ സംവാദങ്ങള് സൃഷ്ടിക്കുന്ന ഒന്നിനൊന്ന് സജ്ജീകരണത്തിനുള്ള ഡയലോഗ് പരമ്പര. Name
രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Parler TTS സ്റ്റാന്ഡേര്ഡ്
നിങ്ങള്ക്ക് സ്വാഭാവിക ഭാഷയിലും പാര്ലറിലും ചേരുന്ന ശബ്ദവും വിവരിക്കുക.
രചയിതാവു്: Hugging Face · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
IndexTTS-2 സ്റ്റാന്ഡേര്ഡ്
നല്ല മാനസിക നിയന്ത്രണവും ഉയര്ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.
രചയിതാവു്: Index Team · അനുമതി: Bilibili Model License
ശ്രമിക്ക്.
Spark TTS സ്റ്റാന്ഡേര്ഡ്
ശബ്ദമിശ്രണോപാധി
രചയിതാവു്: SparkAudio · അനുമതി: CC BY-NC-SA 4.0
ശ്രമിക്ക്.
GPT-SoVITS സ്റ്റാന്ഡേര്ഡ്
വെറും 5 സെക്കന്റില് നിന്ന് ശബ്ദം കേള്ക്കുന്ന ക്ളൈന് ടി. ടി. ടി.
രചയിതാവു്: RVC-Boss · അനുമതി: MIT
ശ്രമിക്ക്.
Orpheus സ്റ്റാന്ഡേര്ഡ്
100K മണിക്കൂര് സംസാര വിവരങ്ങള്ക്ക് പരിശീലനം നല്കി മനുഷ്യ-തലത്തിലെ വികാരാധീന TTS മോഡല്.
രചയിതാവു്: Canopy Labs · അനുമതി: Llama 3.2 Community
ശ്രമിക്ക്.
Qwen3 TTS സ്റ്റാന്ഡേര്ഡ്
അലിബായുടെ ബഹുഭാഷാ TTS യുടെ ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില് നിന്നും രൂപകല്പനയും.
രചയിതാവു്: Alibaba (Qwen) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
VieNeu-TTS-v2 സ്റ്റാന്ഡേര്ഡ്
വിയറ്റ്നാമിസ് + ഇംഗ്ലീഷില് TTS മുന്സെറ്റ് ശബ്ദം അല്ലെങ്കില് ഹോട്ട്- ഹോട്ട് ശബ്ദം ക്ളോപ്പ്. സിപിയു- മാത്രം, GPU ആവശ്യമില്ല.
രചയിതാവു്: Phạm Nguyễn Ngọc Bảo · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Chatterbox Turbo സ്റ്റാന്ഡേര്ഡ്
വേഗത്തില് ചാറ്റര്ബോക്സ്......സബ്-ഡബ്ലിക്കില് സബ്-എംസ്ലെന്സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.
രചയിതാവു്: Resemble AI · അനുമതി: MIT
ശ്രമിക്ക്.
VoxCPM സ്റ്റാന്ഡേര്ഡ്
ടൈക്കന്സര് - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.
രചയിതാവു്: OpenBMB · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
VibeVoice സ്റ്റാന്ഡേര്ഡ്
മൈക്രോസോഫ്റ്റ് മോഡ്യൂളുകള് പോര്ട്ട്സ്, ഓഡിയോ പുസ്തകങ്ങള് പോലുള്ള അനവധി ശബ്ദങ്ങള്ക്കുള്ള മോഡല്.
രചയിതാവു്: Microsoft · അനുമതി: MIT
ശ്രമിക്ക്.
CosyVoice3 സ്റ്റാന്ഡേര്ഡ്
അടുത്ത തലമുറയിലെ TTS, ബൈ-പ്രവാഹം, വികാരങ്ങളുടെ നിയന്ത്രണം, പൂജ്യം ക്ളോറൈന് എന്നിവയുമായി.
രചയിതാവു്: Alibaba (FunAudioLLM) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
NAMAA Saudi TTS സ്റ്റാന്ഡേര്ഡ്
ആദ്യം സൗദി-അറേബ്യൻ ടി.ടി.
രചയിതാവു്: NAMAA Space · അനുമതി: MIT
ശ്രമിക്ക്.
Darwin TTS സ്റ്റാന്ഡേര്ഡ്
ക്രോസ്സ്-മോഡല് ക്വെന്3-TTS ക്വെന്-എഫ്-എഫ്എന് തൂക്കങ്ങള് ക്വെന്3-1-1.7ബി ഭാഷാമാതൃകയില് നിന്ന് മൂര്ച്ചയേറിയ ഒരു വര്ദ്ധനവ്.
രചയിതാവു്: FINAL-Bench · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
MOSS-TTSD സ്റ്റാന്ഡേര്ഡ്
ഒന്നിലധികം ആവര്ത്തന ഡയലോഗ് മോഡല് തുടര്ച്ചയുളള മോഡല് — 5 ಭಾಷಣകാരുമായും 60 മിനിറ്റോളം ശബ്ദകര്ത്താവ് ഓഡിയോയുമായി സംവാദങ്ങള് സൃഷ്ടിക്കുക.
രചയിതാവു്: OpenMOSS · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
CosyVoice 2
അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന് പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.
ഭാഷകള്: en, zh, ja, ko, fr, de, it, es
ശബ്ദം ക്ലോണ് ചെയ്യുക
IndexTTS-2
നല്ല മാനസിക നിയന്ത്രണവും ഉയര്ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
GPT-SoVITS
വെറും 5 സെക്കന്റില് നിന്ന് ശബ്ദം കേള്ക്കുന്ന ക്ളൈന് ടി. ടി. ടി.
ഭാഷകള്: en, zh, ja, ko
ശബ്ദം ക്ലോണ് ചെയ്യുക
Tortoise TTS
മള്ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില് നിന്നും ഗുണമേന്മയില് ഓട്ടോഗ്രസ്ട്രേഷന് കെട്ടിടത്തില് ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
OpenVoice
ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്റെയും നിയന്ത്രണത്തിലുള്ള ഇന്റർനാഷണൽ ശബ്ദം.
ഭാഷകള്: en, zh, ja, ko, fr, es
ശബ്ദം ക്ലോണ് ചെയ്യുക
VieNeu-TTS-v2
വിയറ്റ്നാമിസ് + ഇംഗ്ലീഷില് TTS മുന്സെറ്റ് ശബ്ദം അല്ലെങ്കില് ഹോട്ട്- ഹോട്ട് ശബ്ദം ക്ളോപ്പ്. സിപിയു- മാത്രം, GPU ആവശ്യമില്ല.
ഭാഷകള്: vi, en
ശബ്ദം ക്ലോണ് ചെയ്യുക
Chatterbox Turbo
വേഗത്തില് ചാറ്റര്ബോക്സ്......സബ്-ഡബ്ലിക്കില് സബ്-എംസ്ലെന്സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
VoxCPM
ടൈക്കന്സര് - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
OuteTTS
എംഎം- അടിസ്ഥാനമാക്കിയുള്ള ടിടിഎസ് സിപിയു, ജിപിയു അല്ലെങ്കില് Lamap.cp. andjs.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
Pocket TTS
ഒരു സാമ്പിളില് നിന്നും ശബ്ദമുപയോഗിച്ച് 100എം പരാമീറ്റര് മോഡല്.
ഭാഷകള്: en, fr
ശബ്ദം ക്ലോണ് ചെയ്യുക
CosyVoice3
അടുത്ത തലമുറയിലെ TTS, ബൈ-പ്രവാഹം, വികാരങ്ങളുടെ നിയന്ത്രണം, പൂജ്യം ക്ളോറൈന് എന്നിവയുമായി.
ഭാഷകള്: en, zh, ja, ko, de, es, fr, it, ru
ശബ്ദം ക്ലോണ് ചെയ്യുക
Darwin TTS
ക്രോസ്സ്-മോഡല് ക്വെന്3-TTS ക്വെന്-എഫ്-എഫ്എന് തൂക്കങ്ങള് ക്വെന്3-1-1.7ബി ഭാഷാമാതൃകയില് നിന്ന് മൂര്ച്ചയേറിയ ഒരു വര്ദ്ധനവ്.
ഭാഷകള്: en, ko, ja, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
MOSS-TTSD
ഒന്നിലധികം ആവര്ത്തന ഡയലോഗ് മോഡല് തുടര്ച്ചയുളള മോഡല് — 5 ಭಾಷಣകാരുമായും 60 മിനിറ്റോളം ശബ്ദകര്ത്താവ് ഓഡിയോയുമായി സംവാദങ്ങള് സൃഷ്ടിക്കുക.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
Ming-Omni TTS
Compact 0. 5B- memne- module മോഡല് refidefaultide 44.1ky ഔട്ട്പുട്ട്, പൂജ്യം-shot-shot കണ്സോള്.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
MOSS-TTS Nano
ചെറിയ 100 MOSTS-TS വര്ഗ്ഗം. ഒരേ കെട്ടിടം, 80x ചെറുത്, ഫ്രീ-ടൈന് ലോന്റിസി.
ഭാഷകള്: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
ശബ്ദം ക്ലോണ് ചെയ്യുകരചയിതാവു് - ആദ്യത്തെ API
ഓപ്പണ്AI- യോജിപ്പുള്ള റെസ്റ്റ് API. ഒരു അവസാന പോയിന്റ്, 22+ മോഡലുകള്. ശരിയായ സമയ പ്രയോഗങ്ങള്ക്കുള്ള പിന്തുണ സ്റ്റ്രീമിങ്ങുന്നു.
- ഓപ്പണ്ഐ- ആക്സസിബിളിറ്റി ഫോര്മാറ്റ്
- റിയല് ടൈം ആപ്സിനായി ടിടിഎസ് സ്ട്രീം ചെയ്യുന്നുName
- വലിയ ജോലികള്ക്കുള്ള തുക പ്രവര്ത്തനം
- വെബ് ടാബ് അറിയിപ്പുകള്
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ലളിതമായ, സുതാര്യമായ പ്രകമ്പനംName
സ്വതന്ത്രമായി തുടങ്ങുക. നിങ്ങള് വളരുമ്പോള് വലിപ്പം കൂട്ടുക.
ഫ്രീ
15,000 അക്ഷരങ്ങള് + 5,000/ഡേ
- 7 കോക്കോറോ ഉൾപ്പെടെയുള്ള സ്വതന്ത്ര മോഡലുകൾ
- തലമുറയ്ക്കു 5,000 കഷണങ്ങൾ
- API ലോഗിന് ഉള്പ്പെടുത്തിയിരിക്കുന്നു
ആരംഭകന്
500 ക്രെഡിറ്റ്സ്/മാസം
- എല്ലാ 22+ മോഡലുകള്
- ഒരു തലമുറയില് 1,00,000 അക്ഷരങ്ങള്
- ശബ്ദ ക്ളൈനിങ്ങ്
പ്രൊഫൈല്
2,000 ക്രെഡിറ്റ്സ്/ മാസം
- എല്ലാം തുടങ്ങുമ്പോള്.
- API പ്രവേശിക്കുന്നു
- മുന്ഗണനാ പ്രക്രിയ
വ്യാപാരം
10,000 ക്രെഡിറ്റ്സ്/മാസം
- പ്രൊവറില് എല്ലാം
- മൊത്തം API
- മുന്ഗണനാ റേറ്റര്
പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ
നിങ്ങളുടെ പ്രതികരണം പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ നമ്മെ സഹായിക്കുന്നു.
ഇന്ന് AI ശബ്ദം ഉപയോഗിക്കാന് തുടങ്ങുക
സ്രഷ്ടാക്കളും ഡയറകടറും ബിസിനസ്സുകളും ചേർന്ന് TTS.ai