ഫ്രീ AI സംസാരത്തിനുള്ള വാചകം

33+ തുറന്ന ഏടുകള്‍, 273+ ശബ്ദം കേള്‍ക്കുന്നു, 33+ ഭാഷകള്‍. അക്കൌണ്ട് ആവശ്യമില്ല.

17K+
സൃഷ്ടാവ്
70K+
തലമുറകള്‍
33+
AI മോഡലുകള്‍
273+
ശബ്ദങ്ങള്‍
0/500 അക്ഷരങ്ങള്‍ · തലമുറയിൽ 5,000 പേർക്ക് ഒപ്പിടുക → ഫ്രീ
ടിടിഎസ് സ്‌നേഹിക്കുന്നു, കൂട്ടുകാരോട് പറയൂ!

ശബ്ദത്തിന്‍റെ ആവശ്യമുള്ളതെല്ലാം

30+ ഉപകരണങ്ങള്‍ ഓപ്പണ്‍- റിസോഴ്സ് എഐ മോഡില്‍ പ്രവര്‍ത്തിപ്പിയ്ക്കുന്നുName

33+ AI ശബ്ദ മോഡലുകള്‍

ഒരു പ്ലാറ്റ്ഫോമിലെ തുറക്കുന്ന ടിടിഎസ് മോഡലുകള്‍

KokoroKokoro ഫ്രീ

കൊക്കോറോ ഒരു 82 ദശലക്ഷം പരാമീറ്റര്‍ ടെക്സ്റ്റുകള്‍ക്കുള്ള ടെക്സ്റ്റുകള്‍ ആണ്. തൂക്കത്തില്‍ കൂടുതല്‍ കൂടുന്ന ഒരു ചെറിയ അക്ഷരം ഉണ്ടെങ്കില്‍, അത് വളരെ സ്വാഭാവികവും വര്‍ദ്ധിപ്പിക്കുന്ന സംസാരം ഉല്‍പാദിപ്പിക്കുന്നു. കോക്കോറോ ഇംഗ്ലീഷ്, ജപ്പനീസ്, ചൈനീസ്, കൊറിയന്‍ തുടങ്ങിയ പല ഭാഷകള്‍ക്കു പിന്തുണ ചെയ്യുന്നു. വളരെ വേഗത്തില്‍ അത് GPU-സമയത്ത് പ്രവര്‍ത്തിക്കുന്നതിലും വേഗത്തില്‍ പ്രവര്‍ത്തിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: വളരെ കുറഞ്ഞ ലോഞ്ച്, സ്റ്റ്രീം പ്രയോഗങ്ങളുള്ള ഉയര്‍ന്ന ടിടിഎസ്Name

സ്വതന്ത്രമായി ശ്രമിക്കുക

PiperPiper ഫ്രീ

പിപ്പര്‍, VITS and Lystempy and Ids and Is and Lystem Strints- ല്‍ നിര്‍മ്മിച്ച ഭാരം കുറഞ്ഞ ടെക്സ്റ്റ് എഞ്ചിന്‍ ആണ്. ഇതു് പൂര്‍ണ്ണമായും CPU- യില്‍ പ്രവര്‍ത്തനസജ്ജമാക്കുന്നു. മോര്‍ന്ന ഉപകരണങ്ങള്‍, ഹോം-നൈമാറ്റം, പ്രയോഗങ്ങള്‍ക്ക് ഓണ്‍ലിറ്റില്‍ ആവശ്യമുളള ഉപകരണങ്ങള്‍. 30+-ല്‍ കൂടുതല്‍ ശബ്ദങ്ങള്‍ ഉള്ളതിനാല്‍, ഒരു റാസ്പെറിബെറി 4-ല്‍ ശബ്ദോപൈന്‍ വേഗതയില്‍, പാപ്പര്‍ പ്രവര്‍ത്തിപ്പിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: ത്വരിതപ്പെടുത്തല്‍, ആക്സസിബിളിറ്റി, എംബഡ് ചെയ്ത പ്രയോഗങ്ങള്‍

സ്വതന്ത്രമായി ശ്രമിക്കുക

VITSVITS ഫ്രീ

VITS (അന്ത്യ-ഘടകത്തില്‍ നിന്ന് വായിക്കാന്‍ പഠിക്കല്‍) ഒരു സമാന്തര രീതിയാണ്. അത്, ഇപ്പോഴത്തെ രണ്ട് കേന്ദ്ര മോഡലുകള്‍ക്കപ്പുറം പ്രകൃതിയിലെ ശബ്ദോപകരണങ്ങള്‍ ഉണ്ടാക്കുന്ന ശബ്ദ രീതിയാണ്. അപ്പോള്‍, പരമ്പരാഗത പരിവര്‍ത്തനം, പരമ്പരാഗികമായ പരിശീലന പ്രക്രിയകള്‍, പ്രകൃതിയില്‍ ശ്രദ്ധേയമായ പുരോഗതി നേടുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: സാധാരണ ടെക്സ്റ്റില്‍ നിന്നും സ്വാഭാവികമായ സംയോജകങ്ങളുമായി പ്രവര്‍ത്തിപ്പിയ്ക്കുക

സ്വതന്ത്രമായി ശ്രമിക്കുക

MeloTTSMeloTTS ഫ്രീ

Mylottts ആണ് ഇംഗ്ലീഷ്, ബ്രിട്ടീഷ്, ബ്രിട്ടീഷ്, ഓസ്ട്രേലിയ, സ്പാനിഷ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന് പിന്തുണയുള്ള ഒരു ബഹുഭാഷാ ലൈബ്രറി. സിപിയു-ടൈം-ടൈം-ടൈം വേഗതക്കു സമീപത്തുള്ള പാഠം വളരെ വേഗത്തില്‍ പ്രവര്‍ത്തിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: വേഗത്തില്‍, ബഹുഭാഷാ TTS ആവശ്യമുളള പ്രയോഗങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്നു

സ്വതന്ത്രമായി ശ്രമിക്കുക

Kani TTS 2Kani TTS 2 ഫ്രീ

കനി-TS-2 എന്ന ക്വെറി- എം- എം- എം- എംഎംഒസ്‌എംഎം‌എം‌‌‌എം‌‌‌എം‌‌‌‌എം‌എം‌‌‌‌എം‌‌‌‌‌‌എം‌‌‌‌‌‌‌‌സ്‌ മോഡല്‍ ആണ്. ഇത് വെറും 3GB vNAMAM- vood- 10 സെക്കന്‍ഡുകളില്‍ പ്രവര്‍ത്തിക്കുന്നതും ഒരു 1002 സെക്കന്‍ഡുകളില്‍ നിന്ന് 1010 സെക്കന്‍ഡുകള്‍ ഉല്‍പാദിപ്പിക്കുന്നതുമാണ്. ഇപ്പോള്‍ പുറത്തുവരുന്ന ഒരു പൊതുവായ ഇംഗ്ലീഷ്‌ - ബീജെന്‍ഡി-എം-എംഡി-എംസ്‌-എംഡി-എം-എം-എംഡിടിടിടിടിടിടിടിടിഎംഡി-എംബോഡിഡിഡിഡിഡിഗ് (RLORLORE) എന്ന ശബ്ദത്തെ ശബ്ദങ്ങള്‍ കാണിക്കാന്‍ ആവശ്യമില്ല.

ഏറ്റവും നല്ല സ്കോര്‍: വേഗത്തിലുള്ള ഇംഗ്ലീഷുകാര്‍ഡ് ഹാര്‍ഡ്‌വെയര്‍, വേഗത്തിലുള്ള പ്രിവ്യൂകള്‍

സ്വതന്ത്രമായി ശ്രമിക്കുക

OuteTTSOuteTTS ഫ്രീ

പ്രത്യേ‌‌ക നിര്‍മ്മാണ കേന്ദ്രം സൂക്ഷിക്കുമ്പോള്‍, ടെക്സ്റ്റില്‍ നിന്നും ഇന്‍സ്റ്റാള്‍സുമായി വലിയ ഭാഷാമാലകള്‍ വിടുന്നു. Lama. Cc/ GPUP (CPU), ഹാന്‍ഡ് മോണിറ്ററുകള്‍ (എക്‌സിഎം), എക്‌എംഎംഎഫ്‌എഫ്‌വി‌വ്യൂ (എക്‌സി), വിന്യാസുകള്‍ (എക്‌എഫ്‌എഫ്‌എംഎസ്‌എംഎസ്) എന്നിവ ഉള്‍പ്പെടെ പല ബാക്കുകള്‍ പിന്തുണയ്ക്കുന്നു. സ്പോണ്‍സര്‍ പ്രൊഫൈല്‍സുകള്‍ (ജോണ്‍സസ്സുകള്‍) എന്ന രീതിയില്‍ ശബ്ദസജ്ജമാക്കിയുള്ള ശബ്ദകര്‍മ്മങ്ങള്‍ (ജെസാന്‍).

ഏറ്റവും നല്ല സ്കോര്‍: എക്ട്രേറ്റമെന്റ്, ബ്രൌസര്‍- അടിസ്ഥാനമാക്കിയുള്ള TTS, കുറഞ്ഞ- റിസോഴ്സ് പരിസരം

സ്വതന്ത്രമായി ശ്രമിക്കുക

Pocket TTSPocket TTS ഫ്രീ

ക്യുടി (മോടിയുടെ പ്രതിനിധികള്‍) പോക്കറ്റ് ടിഎസ് (മോഷിയുടെ പ്രതിനിധികള്‍) ഒരു കംപ്യൂട്ടര്‍ റെക്കോര്‍ഡ്- ടെക്സ്- ടെക്സ്റ്റുകള്‍ (കോണ്‍ക്കാറ്റില്‍ കൂടുതല്‍ തുളച്ചെടുക്കുന്ന ഒരു കംപ്യൂട്ടര്‍ ടെക്സ്- ടെക്സ്- റൈല്‍ അഗ്രമാക്കല്‍) ആണ്. ഇതു സിപിയുപിയു പ്രവര്‍ത്തിയ്ക്കു് പ്രാവര്‍ത്തികമായി പ്രവര്‍ത്തിപ്പിക്കുന്നു, ഒരു ഓഡിയോ മാതൃകയില്‍ നിന്നും പൂജ്യ- ഹോട്ട്- ഹോട്ട്- ഹോട്ട് വോള്‍ വോള്‍ വോള്‍ഡിക്കോളുകള്‍ പിന്തുണയ്ക്കുന്നു, സ്വാഭാവികമായ സംസാരങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്നു. ചെറിയ വലുപ്പവും താഴ്ന്ന പരിസ്ഥിതിയും സജ്ജീകരിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: ചെറിയ വലിപ്പം, സിപിയു- ഒറ്റ പരിസ്ഥിതി, വേഗത്തിലുള്ള ശബ്ദമിശ്രണോപാധി

സ്വതന്ത്രമായി ശ്രമിക്കുക

Kitten TTSKitten TTS ഫ്രീ

KetenML- ല്‍ നിര്‍മ്മിച്ച റ്റൈന്‍ ടിടിഎസ്, ഓനെന്‍എംഎംഎല്‍ നിര്‍മ്മിച്ച ക്യുഎം ഡിഫന്‍സ് (25- 80 എം- ടെര്‍മിനല്‍), സിപിയു- 80 പരാമീറ്റര്‍ (diBയില്‍), സിപിയു- 8- ല്‍ നിര്‍മ്മിക്കാവുന്ന ശബ്ദങ്ങള്‍ ആവശ്യമില്ലാത്തതിനാല്‍ സിപിയു- എംഎം- ല്‍ ശബ്ദങ്ങള്‍ നല്‍കുന്നു. വര്‍ഗ്ഗ- ശബ്ദങ്ങള്‍ക്കു് മാറ്റം വരുത്തുന്നു, ശബ്ദങ്ങള്‍, വര്‍ദ്ധിപ്പിക്കുന്നു, അക്ഷരങ്ങള്‍ക്കുള്ള മുന്‍കാഴ്ചകള്‍, അഗ്രകോടികരണങ്ങള്‍, അഡ്രചുരചുരുതമായ പ്രയോഗങ്ങള്‍ എന്നിവയ്ക്കു്‍ നല്‍കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: വേഗത്തിലുള്ള ടിടിഎസ്, ഇലക്ട്രോണിക്, കുറവുള്ള പ്രയോഗങ്ങള്‍Name

സ്വതന്ത്രമായി ശ്രമിക്കുക

Ming-Omni TTSMing-Omni TTS ഫ്രീ

Ming- stan- Maty- 0. 5B ആണ് ക്യാപ്- ബാക്ക്- എം- എം- മെഡല്‍ നിര്‍മ്മിച്ച ഒരു കമ്പ്യൂട്ടര്‍ സംസാര രീതി. ബ്രെയിം- ബൈം- പാത്ത്- പാഞ്ച്- ഡീലിങ് ഡീലര്‍ ഉപയോഗിച്ച് നിര്‍മ്മിച്ചുള്ള ഒബ്ടൈമല്‍ ആല്‍ഫോര്‍ഡ് ആല്‍ഫില്‍. റിഫയര്‍ 44.41.44kH (ഏര്‍ഡ് സിഡിയുടെ ഗുണമേന്‍ഡി), 3++-ല്‍ നിന്നും ല്‍ നിന്നും പൂജ്‍ - Shift-ല്‍ ശബ്ദം സജ്ജമായുള്ള ശബ്ദത്തെ പിന്തുണയ്ക്കുന്നു. കൂടാതെ /BMEner contronser contrasting ons (cystem), J. JSyston onc. J. stonc. onc.

ഏറ്റവും നല്ല സ്കോര്‍: ഉയര്‍ന്ന- ഗുണഗണങ്ങള്‍, വികാരചിഹ്നങ്ങള്‍, ശബ്ദങ്ങള്‍ പ്രവര്‍ത്തനം, ചൈനീസ് ഓഡിയോ ബുക്ക് ഉള്ളടക്കങ്ങള്‍

സ്വതന്ത്രമായി ശ്രമിക്കുക

MOSS-TTS NanoMOSS-TTS Nano ഫ്രീ

MOS-TS-NON-100-NOS- ല്‍ ഓപ്പണ്‍ എംഎസ്-എം-പാറാര്‍ട്ടര്‍ ആണ്, MOS-TS കുടുംബത്തിന്റെ 100- പാര്‍ട്ടി വര്‍ഗ്ഗമാറ്റം, ഇടവേളയുടെ നിര്‍മ്മാണ ഘടന പങ്കിടുന്നു. വ്യാപാരികള്‍, 180x-ആം ഭാരങ്ങള്‍ക്കുള്ള 8B മോഡല്‍ മുന്തിയ ഗുണനിലവാരം പങ്കിടുന്നു. ഇത് സ്വതന്ത്രവും ഉയര്‍ന്ന പ്രൊജക്റ്റും ആയ VRAM-ഉപയോഗങ്ങള്‍ക്ക് അനുയോജ്യമാക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: സ്വതന്ത്ര TTS, ഉയര്‍ന്ന വോള്‍ഡം ഉല്‍പ്പന്നം, കുറഞ്ഞ ഇന്ററാക്ടീവ് ഉപയോഗം

സ്വതന്ത്രമായി ശ്രമിക്കുക

BarkBark സ്റ്റാന്‍ഡേര്‍ഡ്

സാങ്കേതികമായ സംസാരം, സംഗീതം, സൌന്ദര്യ പ്രഭാവങ്ങള്‍ എന്നിവ ഉല്‍പാദിപ്പിക്കുന്ന ടെക്സ്റ്റര്‍- അല്യൂഡോ മോഡല്‍.

രചയിതാവു്: Suno · അനുമതി: MIT

ശ്രമിക്ക്.

Bark SmallBark Small സ്റ്റാന്‍ഡേര്‍ഡ്

വേഗത്തിൽ ഇന്‍ഫറസും കുറഞ്ഞ മെമ്മറിയുടെ ഉപയോഗവും ഉള്ള ബാര്‍ക്കിന്റെ ലൈറ്റര്‍ പതിപ്പു്.

രചയിതാവു്: Suno · അനുമതി: MIT

ശ്രമിക്ക്.

CosyVoice 2CosyVoice 2 സ്റ്റാന്‍ഡേര്‍ഡ്

അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന്‍ പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.

രചയിതാവു്: Alibaba (Tongyi Lab) · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

Dia TTSDia TTS സ്റ്റാന്‍ഡേര്‍ഡ്

ശബ്ദകര്‍മ്മികള്‍ക്കിടയില്‍ സ്വാഭാവികമായ സംവാദങ്ങള്‍ സൃഷ്ടിക്കുന്ന ഒന്നിനൊന്ന് സജ്ജീകരണത്തിനുള്ള ഡയലോഗ് പരമ്പര. Name

രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

Parler TTSParler TTS സ്റ്റാന്‍ഡേര്‍ഡ്

നിങ്ങള്‍ക്ക് സ്വാഭാവിക ഭാഷയിലും പാര്‍ലറിലും ചേരുന്ന ശബ്ദവും വിവരിക്കുക.

രചയിതാവു്: Hugging Face · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

IndexTTS-2IndexTTS-2 സ്റ്റാന്‍ഡേര്‍ഡ്

നല്ല മാനസിക നിയന്ത്രണവും ഉയര്‍ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.

രചയിതാവു്: Index Team · അനുമതി: Bilibili Model License

ശ്രമിക്ക്.

Spark TTSSpark TTS സ്റ്റാന്‍ഡേര്‍ഡ്

ശബ്ദമിശ്രണോപാധി

രചയിതാവു്: SparkAudio · അനുമതി: CC BY-NC-SA 4.0

ശ്രമിക്ക്.

GPT-SoVITSGPT-SoVITS സ്റ്റാന്‍ഡേര്‍ഡ്

വെറും 5 സെക്കന്‍റില്‍ നിന്ന് ശബ്ദം കേള്‍ക്കുന്ന ക്ളൈന്‍ ടി. ടി. ടി.

രചയിതാവു്: RVC-Boss · അനുമതി: MIT

ശ്രമിക്ക്.

OrpheusOrpheus സ്റ്റാന്‍ഡേര്‍ഡ്

100K മണിക്കൂര്‍ സംസാര വിവരങ്ങള്‍ക്ക് പരിശീലനം നല്‍കി മനുഷ്യ-തലത്തിലെ വികാരാധീന TTS മോഡല്‍.

രചയിതാവു്: Canopy Labs · അനുമതി: Llama 3.2 Community

ശ്രമിക്ക്.

Qwen3 TTSQwen3 TTS സ്റ്റാന്‍ഡേര്‍ഡ്

അലിബായുടെ ബഹുഭാഷാ TTS യുടെ ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില്‍ നിന്നും രൂപകല്പനയും.

രചയിതാവു്: Alibaba (Qwen) · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

VieNeu-TTS-v2VieNeu-TTS-v2 സ്റ്റാന്‍ഡേര്‍ഡ്

വിയറ്റ്നാമിസ് + ഇംഗ്ലീഷില്‍ TTS മുന്‍സെറ്റ് ശബ്ദം അല്ലെങ്കില്‍ ഹോട്ട്- ഹോട്ട് ശബ്ദം ക്ളോപ്പ്. സിപിയു- മാത്രം, GPU ആവശ്യമില്ല.

രചയിതാവു്: Phạm Nguyễn Ngọc Bảo · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

Chatterbox TurboChatterbox Turbo സ്റ്റാന്‍ഡേര്‍ഡ്

വേഗത്തില്‍ ചാറ്റര്‍ബോക്സ്......സബ്-ഡബ്ലിക്കില്‍ സബ്-എംസ്‌ലെന്‍സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.

രചയിതാവു്: Resemble AI · അനുമതി: MIT

ശ്രമിക്ക്.

VoxCPMVoxCPM സ്റ്റാന്‍ഡേര്‍ഡ്

ടൈക്കന്‍സര്‍ - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.

രചയിതാവു്: OpenBMB · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

VibeVoiceVibeVoice സ്റ്റാന്‍ഡേര്‍ഡ്

മൈക്രോസോഫ്റ്റ് മോഡ്യൂളുകള്‍ പോര്‍ട്ട്സ്, ഓഡിയോ പുസ്തകങ്ങള്‍ പോലുള്ള അനവധി ശബ്ദങ്ങള്‍ക്കുള്ള മോഡല്‍.

രചയിതാവു്: Microsoft · അനുമതി: MIT

ശ്രമിക്ക്.

CosyVoice3CosyVoice3 സ്റ്റാന്‍ഡേര്‍ഡ്

അടുത്ത തലമുറയിലെ TTS, ബൈ-പ്രവാഹം, വികാരങ്ങളുടെ നിയന്ത്രണം, പൂജ്യം ക്ളോറൈന്‍ എന്നിവയുമായി.

രചയിതാവു്: Alibaba (FunAudioLLM) · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

NAMAA Saudi TTSNAMAA Saudi TTS സ്റ്റാന്‍ഡേര്‍ഡ്

ആദ്യം സൗദി-അറേബ്യൻ ടി.ടി.

രചയിതാവു്: NAMAA Space · അനുമതി: MIT

ശ്രമിക്ക്.

Darwin TTSDarwin TTS സ്റ്റാന്‍ഡേര്‍ഡ്

ക്രോസ്സ്-മോഡല്‍ ക്വെന്‍3-TTS ക്വെന്‍-എഫ്-എഫ്എന്‍ തൂക്കങ്ങള്‍ ക്വെന്‍3-1-1.7ബി ഭാഷാമാതൃകയില്‍ നിന്ന് മൂര്‍ച്ചയേറിയ ഒരു വര്‍ദ്ധനവ്.

രചയിതാവു്: FINAL-Bench · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

MOSS-TTSDMOSS-TTSD സ്റ്റാന്‍ഡേര്‍ഡ്

ഒന്നിലധികം ആവര്‍ത്തന ഡയലോഗ് മോഡല്‍ തുടര്‍ച്ചയുളള മോഡല്‍ — 5 ಭಾಷಣകാരുമായും 60 മിനിറ്റോളം ശബ്ദകര്‍ത്താവ് ഓഡിയോയുമായി സംവാദങ്ങള്‍ സൃഷ്ടിക്കുക.

രചയിതാവു്: OpenMOSS · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

ChatterboxChatterbox പ്രിമിയം

റെസിമുള്‍ 'എ'യില്‍ നിന്നും വികാരാധീനമായ ശബ്ദങ്ങള്‍.

നിലവാരം:

ശ്രമിക്ക്.

Tortoise TTSTortoise TTS പ്രിമിയം

മള്‍ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില്‍ നിന്നും ഗുണമേന്മയില്‍ ഓട്ടോഗ്രസ്ട്രേഷന്‍ കെട്ടിടത്തില്‍ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.

നിലവാരം:

ശ്രമിക്ക്.

StyleTTS 2StyleTTS 2 പ്രിമിയം

ശൈലിയില്‍ ഡിഫ്യൂഷന്‍, അഡ്വാര്‍സല്‍ പരിശീലനം.

നിലവാരം:

ശ്രമിക്ക്.

OpenVoiceOpenVoice പ്രിമിയം

ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്‍റെയും നിയന്ത്രണത്തിലുള്ള ഇന്‍റർനാഷണൽ ശബ്ദം.

നിലവാരം:

ശ്രമിക്ക്.

Sesame CSMSesame CSM പ്രിമിയം

സംഭാഷണത്തിന്‍റെ മാതൃഭാഷ ഉചിതമായ സമയവും വികാരങ്ങളും ഉപയോഗിച്ചുകൊണ്ട് സ്വാഭാവികമായ സംഭാഷണം നടത്തുന്നു.

നിലവാരം:

ശ്രമിക്ക്.

CosyVoice 2CosyVoice 2

അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന്‍ പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.

ഭാഷകള്‍: en, zh, ja, ko, fr, de, it, es

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

IndexTTS-2IndexTTS-2

നല്ല മാനസിക നിയന്ത്രണവും ഉയര്‍ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Spark TTSSpark TTS

ശബ്ദമിശ്രണോപാധി

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

GPT-SoVITSGPT-SoVITS

വെറും 5 സെക്കന്‍റില്‍ നിന്ന് ശബ്ദം കേള്‍ക്കുന്ന ക്ളൈന്‍ ടി. ടി. ടി.

ഭാഷകള്‍: en, zh, ja, ko

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

ChatterboxChatterbox

റെസിമുള്‍ 'എ'യില്‍ നിന്നും വികാരാധീനമായ ശബ്ദങ്ങള്‍.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Tortoise TTSTortoise TTS

മള്‍ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില്‍ നിന്നും ഗുണമേന്മയില്‍ ഓട്ടോഗ്രസ്ട്രേഷന്‍ കെട്ടിടത്തില്‍ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

OpenVoiceOpenVoice

ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്‍റെയും നിയന്ത്രണത്തിലുള്ള ഇന്‍റർനാഷണൽ ശബ്ദം.

ഭാഷകള്‍: en, zh, ja, ko, fr, es

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

VieNeu-TTS-v2VieNeu-TTS-v2

വിയറ്റ്നാമിസ് + ഇംഗ്ലീഷില്‍ TTS മുന്‍സെറ്റ് ശബ്ദം അല്ലെങ്കില്‍ ഹോട്ട്- ഹോട്ട് ശബ്ദം ക്ളോപ്പ്. സിപിയു- മാത്രം, GPU ആവശ്യമില്ല.

ഭാഷകള്‍: vi, en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Chatterbox TurboChatterbox Turbo

വേഗത്തില്‍ ചാറ്റര്‍ബോക്സ്......സബ്-ഡബ്ലിക്കില്‍ സബ്-എംസ്‌ലെന്‍സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

VoxCPMVoxCPM

ടൈക്കന്‍സര്‍ - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

OuteTTSOuteTTS

എംഎം- അടിസ്ഥാനമാക്കിയുള്ള ടിടിഎസ് സിപിയു, ജിപിയു അല്ലെങ്കില്‍ Lamap.cp. andjs.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Pocket TTSPocket TTS

ഒരു സാമ്പിളില്‍ നിന്നും ശബ്ദമുപയോഗിച്ച് 100എം പരാമീറ്റര്‍ മോഡല്‍.

ഭാഷകള്‍: en, fr

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

CosyVoice3CosyVoice3

അടുത്ത തലമുറയിലെ TTS, ബൈ-പ്രവാഹം, വികാരങ്ങളുടെ നിയന്ത്രണം, പൂജ്യം ക്ളോറൈന്‍ എന്നിവയുമായി.

ഭാഷകള്‍: en, zh, ja, ko, de, es, fr, it, ru

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

NAMAA Saudi TTSNAMAA Saudi TTS

ആദ്യം സൗദി-അറേബ്യൻ ടി.ടി.

ഭാഷകള്‍: ar

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Darwin TTSDarwin TTS

ക്രോസ്സ്-മോഡല്‍ ക്വെന്‍3-TTS ക്വെന്‍-എഫ്-എഫ്എന്‍ തൂക്കങ്ങള്‍ ക്വെന്‍3-1-1.7ബി ഭാഷാമാതൃകയില്‍ നിന്ന് മൂര്‍ച്ചയേറിയ ഒരു വര്‍ദ്ധനവ്.

ഭാഷകള്‍: en, ko, ja, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

MOSS-TTSDMOSS-TTSD

ഒന്നിലധികം ആവര്‍ത്തന ഡയലോഗ് മോഡല്‍ തുടര്‍ച്ചയുളള മോഡല്‍ — 5 ಭಾಷಣകാരുമായും 60 മിനിറ്റോളം ശബ്ദകര്‍ത്താവ് ഓഡിയോയുമായി സംവാദങ്ങള്‍ സൃഷ്ടിക്കുക.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Ming-Omni TTSMing-Omni TTS

Compact 0. 5B- memne- module മോഡല്‍ refidefaultide 44.1ky ഔട്ട്പുട്ട്, പൂജ്യം-shot-shot കണ്‍സോള്‍.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

MOSS-TTS NanoMOSS-TTS Nano

ചെറിയ 100 MOSTS-TS വര്‍ഗ്ഗം. ഒരേ കെട്ടിടം, 80x ചെറുത്, ഫ്രീ-ടൈന്‍ ലോന്റിസി.

ഭാഷകള്‍: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

രചയിതാവു് - ആദ്യത്തെ API

ഓപ്പണ്‍AI- യോജിപ്പുള്ള റെസ്റ്റ് API. ഒരു അവസാന പോയിന്റ്, 22+ മോഡലുകള്‍. ശരിയായ സമയ പ്രയോഗങ്ങള്‍ക്കുള്ള പിന്തുണ സ്റ്റ്രീമിങ്ങുന്നു.

  • ഓപ്പണ്‍ഐ- ആക്സസിബിളിറ്റി ഫോര്‍മാറ്റ്
  • റിയല്‍ ടൈം ആപ്സിനായി ടിടിഎസ് സ്ട്രീം ചെയ്യുന്നുName
  • വലിയ ജോലികള്‍ക്കുള്ള തുക പ്രവര്‍ത്തനം
  • വെബ് ടാബ് അറിയിപ്പുകള്‍
API ഡോക്സ് കാണുക
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ലളിതമായ, സുതാര്യമായ പ്രകമ്പനംName

സ്വതന്ത്രമായി തുടങ്ങുക. നിങ്ങള്‍ വളരുമ്പോള്‍ വലിപ്പം കൂട്ടുക.

ഫ്രീ

$0

15,000 അക്ഷരങ്ങള്‍ + 5,000/ഡേ

  • 7 കോക്കോറോ ഉൾപ്പെടെയുള്ള സ്വതന്ത്ര മോഡലുകൾ
  • തലമുറയ്‌ക്കു 5,000 കഷണങ്ങൾ
  • API ലോഗിന്‍ ഉള്‍പ്പെടുത്തിയിരിക്കുന്നു
ഫ്രീ ആയി ഒപ്പ് വയ്ക്കുക

ആരംഭകന്‍

$9/മോ

500 ക്രെഡിറ്റ്സ്/മാസം

  • എല്ലാ 22+ മോഡലുകള്‍
  • ഒരു തലമുറയില്‍ 1,00,000 അക്ഷരങ്ങള്‍
  • ശബ്ദ ക്ളൈനിങ്ങ്
തുടങ്ങുക
ഏറ്റവും പ്രസിദ്ധം

പ്രൊഫൈല്‍

$29/മോ

2,000 ക്രെഡിറ്റ്സ്/ മാസം

  • എല്ലാം തുടങ്ങുമ്പോള്‍.
  • API പ്രവേശിക്കുന്നു
  • മുന്‍ഗണനാ പ്രക്രിയ
പ്രൊഫൈല്‍ ചെയ്യുക

വ്യാപാരം

$99/മോ

10,000 ക്രെഡിറ്റ്സ്/മാസം

  • പ്രൊവറില്‍ എല്ലാം
  • മൊത്തം API
  • മുന്‍ഗണനാ റേറ്റര്‍
വ്യാപാരം നേടുക

ക്യാരക്ടര്‍ പാക്ക് ഉള്‍പ്പെടുന്ന എല്ലാ പദ്ധതികളും കാണുക →

പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ

TTS.ai ആണ് ഏറ്റവും വിപുലമായ AI ശബ്ദം പ്ലാറ്റ്ഫോം, 22+ പദാവലികള്‍ നല്‍കല്‍, ക്ളോണ്‍, ശബ്ദ-text-text, ശബ്ദ-text, ഓഡിയോ ഉപകരണങ്ങള്‍ നല്‍കുന്നത്. എല്ലാ മോഡലുകള്‍ക്കും ഒരു വില്‍പ്പനക്കാരനും ഇല്ല.

അതെ, TTS.ai കൊക്കോറോ, പിപ്പര്‍, വി.റ്റി. വ്ലോടിസ്, മെലോട്ടിസ് മോഡലുകളുമായി ഫ്രീ ടെക്സ്റ്റുകള്‍ നല്‍കുന്നു. ഒരു അക്കൗണ്ടും ആവശ്യമില്ല. 15,000 അക്ഷരങ്ങള്‍ എടുക്കാനും എല്ലാ മോഡലുകളും ലഭ്യമാകുന്നു. പായ്ഡ് പദ്ധതികള്‍ $9/ മാസത്തില്‍ ആരംഭിക്കുന്നു.

വേഗതയ്ക്കു്, കോക്കോറോ അല്ലെങ്കില്‍ പിപ്പര്‍ ഉപയോഗിക്കുക. ഗുണമേന്മയ്ക്കായി, കോസിവ്യൂസ് 2 അല്ലെങ്കില്‍ സ്റ്റൈല്‍ടിടിറ്റ് 2 അല്ലെങ്കില്‍ സ്റ്റൈല്‍ടൈല്‍ ടിടിഎസ് 2 ഉപയോഗിക്കുക. ശബ്ദകഥയോടൈല്‍ ബോക്സ് അല്ലെങ്കില്‍ GPTI- സോവിറ്റുകള്‍ ഉപയോഗിക്കുക. ഡയലോഗിനായി DiTS ഉപയോഗിക്കുക. അതേ പദാവലിയില്‍ പല മോഡലുകള്‍ താരതമ്യപ്പെടുത്താന്‍ ശ്രമിക്കുക.

ടിടിഎസ്, സ്ടിടി, ശബ്ദം, ഓഡിയോ ഉപകരണങ്ങള്‍ എന്നിവക്കുള്ള ഓഡിയോ അക്കങ്ങള്‍. സ്വതന്ത്രമായ എല്ലാ പദ്ധതികളും ഉള്‍പ്പെട്ടിരിക്കുന്നു, ടൈയര്‍ റീക്/ മിന്റര്‍ തോതില്‍ തോതനുസരിച്ചുള്ള നിരക്കുകളും (പൂര്‍വ്വം: 10 req/min, Lint: 20, Litor: 30, Prom: 60, with: 60, Parch: 300. lie on lie lie lication lication /. lie li li li licia/ lipipi/ API.

ശബ്ദത്തിന്‍റെ ഗുണമേന്മ സാങ്കേതികമായി മാറുന്നു. കോസിവ്യൂയിസ് 2, സ്റ്റൈല്‍ടിറ്റ്സ് 2, ചാറ്റ്ടര്‍ബോക്സ് എന്നീ പ്രിമിയം മോഡലുകള്‍ സ്വാഭാവികമായ മനുഷ്യത്വ-സമ്പത്തും വികാരങ്ങളുമായി സവിശേഷമായ സംസാരം സൃഷ്ട്ടിക്കുന്നു. കോക്കോറോ പോലുള്ള സ്വതന്ത്ര മോഡലുകള്‍ കൂടുതല്‍ ഉപയോഗമുള്ള കേസുകള്‍ക്ക് നല്ല ഗുണമേന്മ നല്‍കുന്നു.

TTS.ai ഭാഷകള്‍ അതിന്‍റെ മാതൃകാ ഗ്രന്ഥശാലയില്‍ ലഭ്യമാണ്. പക്ഷേ, ഇംഗ്ലീഷ് ഏറ്റവും വീതിയുള്ള മോഡല്‍ പിന്തുണയുണ്ട്. ചൈനീസ്, ജപ്പാന്‍, ജപ്പാന്‍, കൊറിയന്‍ തുടങ്ങിയ മോഡല്‍മാര്‍ ചൈനീസ്, ചൈനീസ്, കൊറിയന്‍ തുടങ്ങിയ മോഡലുകള്‍; മെലോട്ടിക്സ് ഇംഗ്ലീഷ്, സ്പാനീഷ്, ചൈനീസ്, ചൈനീസ്, ചൈനീസ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന്‍ എന്നിവയെ പിന്തുണയ്ക്കുന്നു.

അതെ. നമ്മുടെ സമീകരിച്ച GPU സര്‍വറുകളില്‍ എല്ലാ പ്രവര്‍ത്തനങ്ങളും സംഭവിക്കുന്നു. ഞങ്ങള്‍ നിങ്ങളുടെ ടെക്സ്റ്റ് ഇന്‍പുട്ടോ അല്ലെങ്കില്‍ നിര്‍മ്മിച്ച ഓഡിയോ അല്ല. ക്ളൈന്‍റെ ശബ്ദ സാമ്പിളുകള്‍ ഇപ്പോഴുള്ള സെഷന് വേണ്ടി മാത്രമാണു് ഉപയോഗിക്കുന്നത്, അവ നിലനിര്‍ത്തപ്പെടുന്നത്. ഞങ്ങള്‍ക്ക് മൂന്നാമത്തെ കക്ഷികളുമായി നിങ്ങളുടെ വിവരങ്ങള്‍ പങ്കിടുകയോ, മോഡല്‍ ചെയ്യാതിരിക്കുകയോ ചെയ്യാതിരിക്കുകയോ ചെയ്യാം.

അതെ, TTS.aiല്‍ നിര്‍മ്മിച്ച എല്ലാ ഓഡിയോയും, യൂട്ടോപ്പ് വീഡിയോകള്‍, ഓഡിയോബുക്കുകള്‍, പരസ്യങ്ങള്‍, പരസ്യങ്ങള്‍, ഉല്‍പ്പന്നങ്ങള്‍ എന്നിവയും ഉള്‍പ്പെടേണ്ടതാണ്. നമ്മുടെ മോഡലുകള്‍ നവീകരണ ലൈസന്‍സിന്റെ (MIT, അഛായ 2.0) കീഴിലാണ്.

WAV ശൈലിയില്‍ ഏറ്റവും കൂടിയ ഗുണമേന്മയായി TTS.ai ഓഡിയോ ഉല്‍പാദിപ്പിക്കുന്നു. നിങ്ങള്‍ക്കു് MP3, FLAC, OG, MGA എന്നിവയ്ക്കു് നമ്മുടെ സ്വതന്ത്ര ഓഡിയോ മാറ്റുന്നതിനുള്ള ഉപകരണം ഉപയോഗിക്കാം. API നിങ്ങളുടെ ഇഷ്ടപ്പെട്ട ഔട്ട്പുട്ടിന്റെ ഫോര്‍മാറ്റ് നേരിട്ട് നല്‍കുന്നു.

ക്ലോണ്‍ ചെയ്യണമെന്നുള്ള ശബ്ദത്തിന്റെ ചെറിയൊരു സാമ്പിള്‍ (5 സെക്കന്‍ഡുകള്‍ക്കകം), ആ ശബ്ദത്തില്‍ സംസാരം ഉല്‍പാദിപ്പിക്കാന്‍ ഏതു് പദാവലിയും ടൈപ്പ് ചെയ്യുക. ചാറ്റര്‍ബോക്സ്, GPT- സോVIS, കോസിവ്യൂ2 വോയിസ് എന്നിവപോലുള്ള മോഡലുകള്‍ ശബ്ദസഞ്ചയത്തെ പിന്തുണയ്ക്കുന്നു. മോണ്‍ലിറ്റഡ് ശബ്ദം കേള്‍ക്കുന്നു, ശൈലിയും സംസാരരീതിയും.

ഫ്രീ മോഡലുകള്‍ (Kocoro, Pyper, VITS, MloTTS, വിലയിടിപ്പില്ലാത്ത അക്ഷരങ്ങള്‍) ബാര്‍ക്ക്/ 1K ഇൻപുട്ടില്‍ (2000 അക്ഷരങ്ങള്‍) ബാര്‍ക്കി/ CSovice 2, F5TTS, DATS എന്നിവ ഉള്‍പ്പെടുത്തുന്ന സ്റ്റാന്‍ഡേര്‍ഡ് മോഡല്‍ മോഡലുകള്‍ (4,000 അക്ഷരങ്ങള്‍) ഓപ്പറേറ്റ്‌Vos, ShiftTTS, ShiftTTS, TostS2 എന്നിവ ഉള്‍പ്പെടുന്നു.

ഉവ്വ്. ശബ്ദത്തിന്റെ വലിയ വോള്യം മാറ്റുന്നതിനുള്ള സജ്ജീകരണത്തെ API പിന്തുണക്കുന്നു. ഡിസൈനല്‍ ആവശ്യങ്ങള്‍ സമര്‍പ്പിക്കുക, പുനര്‍നിര്‍മ്മിക്കുക UUPURS ഉപയോഗിച്ച് അനുയോജ്യമായ ഫലങ്ങള്‍ ലഭ്യമാക്കുക. ബിസിനസ് പദ്ധതിയില്‍ നിന്നും വളരെ മുന്‍ഗണനയും ഉള്‍പ്പെടുത്തുന്നു ($99/mm). വേഗത്തിലുള്ള സജ്ജീകരണപരിപാട് നിര്‍മ്മാണത്തിനു് മുന്‍ഗണനയും ഉള്‍പ്പെടുത്തുന്നു. ഓഡിയോബുക്ക് ഉല്‍പാദനത്തിന്, ഉള്ളടക്കം, വലിയ റെക്കോര്‍ഡ്‌വെര്‍ഡ്‌വെയര്‍ എക്സ്പ്ലേയറുകള്‍ എന്നിവയ്ക്കു് അനുബന്ധിച്ചു.
4.1/5 (42)

നിങ്ങളുടെ പ്രതികരണം പ്രശ്‌നങ്ങൾ പരിഹരിക്കാൻ നമ്മെ സഹായിക്കുന്നു.

ഇന്ന് AI ശബ്ദം ഉപയോഗിക്കാന്‍ തുടങ്ങുക

സ്രഷ്ടാക്കളും ഡയറകടറും ബിസിനസ്സുകളും ചേർന്ന് TTS.ai