ഫ്രീ AI സംസാരത്തിനുള്ള വാചകം

82M പരാമീറ്ററുകള്‍ അള്‍ട്ര- വേഗത്തില്‍ ശബ്ദങ്ങൾ മള്‍ട്ടിപ്പിള്‍ സ്റ്റ്രീമിനുള്ള പിന്തുണ

ലൈറ്റ് ഭാരം 82M പരാമീറ്റര്‍ മോഡല്‍ സ്റ്റുഡിയോ- സാംസ്കാരിക സംസാരം ലഭ്യമാക്കുന്ന രീതി.

വേഗത · 1.5GB VRAM ശ്രമിക്ക്.

Piper

സിപിയു- സൌഹൃദം ഓഫ്‌ലൈന്‍ സാധ്യമാണു് 100+ ശബ്ദങ്ങള്‍ 35+ ഭാഷകള്‍Name എസ്എസ്എംഎല്‍ പിന്തുണ

സംസാര സിസ്റ്റത്തിന് വേണ്ടിയുള്ള ഒരു വേഗത്തില്‍, പ്രാദേശിക നാഡീ പാഠങ്ങള്‍ റാസ്പിബെറി പൈക്കും ചേര്‍ന്ന ഉപകരണങ്ങള്‍ക്കും നല്‍കി.

വേഗത · 0 (CPU only) VRAM ശ്രമിക്ക്.

VITS

അവസാന-ഘടകത്തില്‍ നിന്നും സിന്‍റ്റാസിസ് നാച്ചുറല്‍ പ്രൊജക്ട് വേഗത്തില്‍ അനവധി സംസാരകര്‍

അഡ്വാര്‍ഡില്‍ നിന്നും അവസാനം വരെയുള്ള ടെക്സ്റ്റില്‍ നിന്നും വായിക്കാന്‍ പഠിക്കുന്ന ആധികാരിക വ്യതിയാനപരിപാടിയുള്ള ഓട്ടോമാറ്റിക് എന്‍കോഡര്‍.

വേഗത · 1GB VRAM ശ്രമിക്ക്.

MeloTTS

സിപിയു- പ്രാവര്‍ത്തികമാക്കല്‍ മള്‍ട്ടിപ്പിള്‍ അനവധി ആവര്‍ത്തനങ്ങള്‍ പ്രവര്‍ത്തനസജ്ജം കുറഞ്ഞ ലാറ്റന്‍സി

ഏറ്റവും വര്‍ദ്ധിച്ച ബഹുഭാഷാ പാഠങ്ങള്‍ സിപിയു- യില്‍ ഏറ്റവും എളുപ്പത്തില്‍ പ്രവര്‍ത്തിക്കുന്ന സിപിയു- ല്‍ നിന്നും വായിക്കാന്‍.

വേഗത · 0.5GB (GPU optional) VRAM ശ്രമിക്ക്.

Bark

ശബ്ദ പ്രഭാവങ്ങള്‍ ചിരി/തുറക്കുക സംഗീതത്തിന്റെ ഉല്‍പ്പന്നംName 100+ സംസാരകര്‍ മള്‍ട്ടിപ്പിള്‍

സാങ്കേതികമായ സംസാരം, സംഗീതം, സൌന്ദര്യ പ്രഭാവങ്ങള്‍ എന്നിവ ഉല്‍പാദിപ്പിക്കുന്ന ടെക്സ്റ്റര്‍- അല്യൂഡോ മോഡല്‍.

പതുക്കെ · 5GB VRAM ശ്രമിക്ക്.

Bark Small

ഇളം ഭാരം ഫുള്‍ ബാര്‍ക്കിനെക്കാള്‍ വേഗത്തില്‍ ഹൃദയസ്‌പർശിയായ സംസാരം മള്‍ട്ടിപ്പിള്‍

വേഗത്തിൽ ഇന്‍ഫറസും കുറഞ്ഞ മെമ്മറിയുടെ ഉപയോഗവും ഉള്ള ബാര്‍ക്കിന്റെ ലൈറ്റര്‍ പതിപ്പു്.

ഇടത്തരം · 2GB VRAM ശ്രമിക്ക്.

CosyVoice 2

സ്ട്രീമിങ് സീറോ- ഹോട്ട് ക്ലോണ്‍ ക്രോസ്സ്- ഇനം കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം മനുഷ്യ-പങ്കാളി

അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന്‍ പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.

Dia TTS

മള്‍ട്ടി- സ്പ്രെറ്റര്‍ ഡയലോഗ് ഉല്‍പാദിപ്പിക്കുന്നുComment നാച്ചുറല്‍ തിരിച്ചു് കടക്കുക വൈകാരികമായ ഭാവം 160ബി പരാമീറ്ററുകള്‍

ശബ്ദകര്‍മ്മികള്‍ക്കിടയില്‍ സ്വാഭാവികമായ സംവാദങ്ങള്‍ സൃഷ്ടിക്കുന്ന ഒന്നിനൊന്ന് സജ്ജീകരണത്തിനുള്ള ഡയലോഗ് പരമ്പര. Name

Parler TTS

ശബ്ദവിവരണം സാധാരണ ഭാഷാ നിയന്ത്രണം മാറ്റാവുന്ന ശബ്ദസൃഷ്ടി ശബ്ദങ്ങള്‍ വേണ്ട

നിങ്ങള്‍ക്ക് സ്വാഭാവിക ഭാഷയിലും പാര്‍ലറിലും ചേരുന്ന ശബ്ദവും വിവരിക്കുക.

Indic Parler TTS

11 ഇന്ത്യൻ ഭാഷകൾ ശബ്ദവിവരണം സാധാരണ ഭാഷാ നിയന്ത്രണം സ്ഥിരോത്സാഹം ഇന്‍റിക്കേഷന്‍ ഉച്ചാരണം

8+ ഇന്ത്യന്‍ ഭാഷകള്‍ക്ക് വേണ്ടിയുള്ള ഉയര്‍ന്ന സംസാരം പ്രകൃതിയിലുള്ള ശബ്ദ നിയന്ത്രണമുള്ളതാണ്.

പതുക്കെ · 8GB VRAM ശ്രമിക്ക്.

KhanomTan TTS

തായ്‌ ടിടിസ്‌ അനവധി സംസാരകര്‍ നിങ്ങളുടെ ടിടിഎസ് കെട്ടിടം വാണിജ്യ-സുരക്ഷിത ലൈസന്‍സ്

തായി-ആദ്യം ടെക്സ്റ്റില്‍ സംസാരിക്കാന്‍ ഒരു ശബ്ദമുണ്ട്.

വേഗത · 2GB VRAM ശ്രമിക്ക്.

IndexTTS-2

കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം സീറോ- ഹോട്ട് എമുലേറ്റര്‍ വെക്ടര്‍സ് ക്രിയാത്മകമായ സംസാരം നല്ല നിയന്ത്രിത നിയന്ത്രണം

നല്ല മാനസിക നിയന്ത്രണവും ഉയര്‍ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.

Spark TTS

ശബ്ദമിശ്രണോപാധി കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം ശൈലിയുടെ നിയന്ത്രണം ഉറപ്പ് വരുത്തല്‍ പ്രാവര്‍ത്തികമാക്കുക 5- സെക്കന്റ് ക്ളൈന്‍

ശബ്ദമിശ്രണോപാധി

GPT-SoVITS

5- സെക്കന്റ് ക്ളൈന്‍ പാട്ടുപാടുന്ന ശബ്ദം അല്പം-ചുറ്റില്‍ പഠിക്കല്‍ വളരെ വിശ്വസ്‌തത ക്രോസ്സ്- ഇനം

വെറും 5 സെക്കന്‍റില്‍ നിന്ന് ശബ്ദം കേള്‍ക്കുന്ന ക്ളൈന്‍ ടി.

പതുക്കെ · 6GB VRAM ശ്രമിക്ക്.

Orpheus

മനുഷ്യന്റെ തലച്ചോറിന്‍റെ വികാരം 100K മണിക്കൂര്‍ പരിശീലനം സാധാരണ മർമപ്രധാനമായ ക്രിയാത്മകമായ സംസാരം

100K മണിക്കൂര്‍ സംസാര വിവരങ്ങള്‍ക്ക് പരിശീലനം നല്‍കി മനുഷ്യ-തലത്തിലെ വികാരാധീന TTS മോഡല്‍.

Chatterbox

സീറോ- ഹോട്ട് ക്ലോണ്‍ കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം വളരെ വിശ്വസ്‌തത ശൈലി കൈമാറ്റം ഒറ്റ സാമ്പിള്‍ ക്ളൈന്‍സ്

റെസിമുള്‍ 'എ'യില്‍ നിന്നും വികാരാധീനമായ ശബ്ദങ്ങള്‍.

Tortoise TTS

ഏറ്റവും കൂടിയ ഗുണമേന്മ മള്‍ട്ടി- റേഡിയന്‍ ഡാല്‍-ഇ കെട്ടിടം ശബ്ദമിശ്രണോപാധി സ്വയം സൂക്ഷിക്കല്‍

മള്‍ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില്‍ നിന്നും ഗുണമേന്മയില്‍ ഓട്ടോഗ്രസ്ട്രേഷന്‍ കെട്ടിടത്തില്‍ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.

പതുക്കെ · 8GB VRAM ശ്രമിക്ക്.

StyleTTS 2

മനുഷ്യന്റെ നില ഫൈല്‍ ഡിഫ്യൂഷന്‍ നിയമപരമായ പരിശീലനം നാച്ചുറല്‍ വ്യ‌‌ത്യ‌‌സ്‌ വളരെ വിശ്വസ്‌തത

ശൈലിയില്‍ ഡിഫ്യൂഷന്‍, അഡ്വാര്‍സല്‍ പരിശീലനം.

OpenVoice

ഇന്‍സ്റ്റന്റ് ക്ലോണ്‍usa. kgm ശബ്ദം മാറ്റുന്നു കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം കണ്‍ട്രോള്‍ കണ്ട്രോള്‍ മള്‍ട്ടിപ്പിള്‍

ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്‍റെയും നിയന്ത്രണത്തിലുള്ള ഇന്‍റർനാഷണൽ ശബ്ദം.

Qwen3 TTS

9 പ്രാരംഭ ശബ്ദങ്ങൾ പദാവലിയില്‍ നിന്നു് ശബ്ദ ഘടന കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം 10 ഭാഷകള്‍

അലിബായുടെ ബഹുഭാഷാ TTS യുടെ ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില്‍ നിന്നും രൂപകല്പനയും.

ഇടത്തരം · 7GB VRAM ശ്രമിക്ക്.

VieNeu-TTS-v2

7 പ്രാവര്‍ത്തികമാക്കിയ ശബ്ദങ്ങള്‍ (NOM + തെക്കന്‍ ഉച്ചാരണം) എന്‍-വി കോഡ്-ചുവപ്പ് ശബ്ദമിശ്രണോപാധി (3- 5 കുറിപ്പ്) പോര്‍ട്ട്‌പോര്‍ട്ട് / മള്‍ട്ടിപ്പിള്‍ സ്പ്രെര്‍ പിന്തുണ CPU- മാത്രമേ - ജിപിയു ആവശ്യമില്ല

വിയറ്റ്നാമിസ് + ഇംഗ്ലീഷില്‍ TTS മുന്‍സെറ്റ് ശബ്ദം അല്ലെങ്കില്‍ ഹോട്ട്- ഹോട്ട് ശബ്ദം ക്ളോപ്പ്. സിപിയു- മാത്രം, GPU ആവശ്യമില്ല.

വേഗത · CPU VRAM ശ്രമിക്ക്.

Sesame CSM

വര്‍ത്തമാനം സാധാരണ സമയം പ്രവര്‍ത്തിപ്പിയ്ക്കുക പുറകോട്ട് ചാനല്‍ 1ബി പരാമീറ്ററുകള്‍

സംഭാഷണത്തിന്‍റെ മാതൃഭാഷ ഉചിതമായ സമയവും വികാരങ്ങളും ഉപയോഗിച്ചുകൊണ്ട് സ്വാഭാവികമായ സംഭാഷണം നടത്തുന്നു.

പതുക്കെ · 8GB VRAM ശ്രമിക്ക്.

Chatterbox Turbo

സബ്- ഡസ്കിന്‍സ് ലോണ്‍സി പാരനലിക്വിറ്റിക് തൊങ്ങല്‍ 6x യഥാര്‍ത്ഥ സമയം ശബ്ദമിശ്രണോപാധി ജലാംശം

വേഗത്തില്‍ ചാറ്റര്‍ബോക്സ്..സബ്-ഡബ്ലിക്കില്‍ സബ്-എംസ്‌ലെന്‍സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.

വേഗത · 2GB VRAM ശ്രമിക്ക്.

VoxCPM

44.1khz ഓഡിയോ ടോക്കന്‍സി- ഫ്രീName ക്രോസ്സ്- ഇയല്‍ ക്ളൈന്‍new- zealand. kgm സന്ദര്‍ഭ- നിരീക്ഷകന്‍ ലോറ ഫുള്‍- ഇന്‍റിങ്

ടൈക്കന്‍സര്‍ - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.

വേഗത · 4GB VRAM ശ്രമിക്ക്.

Kani TTS 2

3GB VRAM അള്‍ട്ര- വേഗത്തില്‍ ഇളം ഭാരം നാനോകോഡെക് ഫ്രീ

അള്‍ട്രയുടെ ഭാരം 400M ഇംഗ്ലീഷ് ടിടിഎസ് മോഡല്‍ വെറും 3GB VRAM യില്‍ ആണ് പ്രവര്‍ത്തിക്കുന്നത്.

വേഗത · 3GB VRAM ശ്രമിക്ക്.

OuteTTS

സിപിയു ഇന്‍ഫറന്‍സ് ബ്രൌസര്‍ ഇന്‍ഫറന്‍സ് അനവധി ബാക്കെന്‍ഡുകള്‍ ശബ്ദകര്‍ത്താവിന്റെ പ്രൊഫൈലുകള്‍

എംഎം- അടിസ്ഥാനമാക്കിയുള്ള ടിടിഎസ് സിപിയു, ജിപിയു അല്ലെങ്കില്‍ Lamap.cp. andjs.

പതുക്കെ · 2GB VRAM ശ്രമിക്ക്.

VibeVoice

മള്‍ട്ടി- സ്പ്രെറ്റര്‍ 90 മിനിട്ട് വരെ പോസ്റ്റ്‌കാര്‍ഡ് ഉല്‍പാദിപ്പിക്കുന്നു സ്പീക്കര്‍ സ്ഥിരത 200ms സ്റ്റ്രീമിങ്

മൈക്രോസോഫ്റ്റ് മോഡ്യൂളുകള്‍ പോര്‍ട്ട്സ്, ഓഡിയോ പുസ്തകങ്ങള്‍ പോലുള്ള അനവധി ശബ്ദങ്ങള്‍ക്കുള്ള മോഡല്‍.

വേഗത · 4GB VRAM ശ്രമിക്ക്.

Pocket TTS

100എം പരാമീറ്ററുകള്‍ സിപിയു ഇന്‍ഫറന്‍സ് ശബ്ദമിശ്രണോപാധി ഒറ്റ- സാമ്പില്‍ ക്ളോറന്‍ എഡ്ജ്- സജ്ജീകരണം

ഒരു സാമ്പിളില്‍ നിന്നും ശബ്ദമുപയോഗിച്ച് 100എം പരാമീറ്റര്‍ മോഡല്‍.

വേഗത · 1GB VRAM ശ്രമിക്ക്.

Kitten TTS

സിപിയു- മാത്രമുള്ള ഇന്‍ഫറന്‍സി 80എം. ബി മോഡലിന്റെ വലിപ്പം 8 നിർമിച്ച ശബ്ദങ്ങൾ വേഗതയുടെ നിയന്ത്രണം ONX- അടിസ്ഥാനപരമായ 24kHz ഔട്ട്പുട്ട്

80 എം.ഐ.എം.ഐ.എം.ഇല്ലാതെ സിപിയു പ്രവര്‍ത്തിക്കുന്നുണ്ട്.

വേഗത · 0GB VRAM ശ്രമിക്ക്.

CosyVoice3

രണ്ടു- ദിശയിലാക്കല്‍ കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം ശബ്ദമിശ്രണോപാധി വേഗത/വൂള്‍ഡ് നിയന്ത്രണം താഴെ പറയുന്ന നിര്‍ദ്ദേശം

അടുത്ത തലമുറയിലെ TTS, ബൈ-പ്രവാഹം, വികാരങ്ങളുടെ നിയന്ത്രണം, പൂജ്യം ക്ളോറൈന്‍ എന്നിവയുമായി.

വേഗത · 4GB VRAM ശ്രമിക്ക്.

NAMAA Saudi TTS

സൌദി അറബി ഭാഷName ആധുനിക സ്റ്റാന്‍ഡേര്‍ഡ് അറബി സീറോ- ഹോട്ട് ശബ്ദം ക്ളൈന്‍ കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം ലോക്കല്‍ ഉച്ചാരണം

ആദ്യം സൗദി-അറേബ്യൻ ടി.ടി.

ഇടത്തരം · 6GB VRAM ശ്രമിക്ക്.

Darwin TTS

ശബ്ദമിശ്രണോപാധി ക്രോസ്സ്- ഇനം എഫ്എഫ്എന്‍- ബ്ലഡ്ഡ് 4 കോർ ഭാഷകൾ ക്വെന്‍3 നെറ്റ്‌വര്‍ക്ക്Name

ക്രോസ്സ്-മോഡല്‍ ക്വെന്‍3-TTS ക്വെന്‍-എഫ്-എഫ്എന്‍ തൂക്കങ്ങള്‍ ക്വെന്‍3-1-1.7ബി ഭാഷാമാതൃകയില്‍ നിന്ന് മൂര്‍ച്ചയേറിയ ഒരു വര്‍ദ്ധനവ്.

ഇടത്തരം · 7GB VRAM ശ്രമിക്ക്.

MOSS-TTSD

ഒന്നിലധികം ശബ്ദകര്‍ത്താവ് ഡയലോഗ് 5 പ്രഭാഷകർ വരെ 60 മില്ല് ക്യാരക്ടര്‍ ഓഡിയോ ശബ്ദമിശ്രണോപാധി പോളിഷ്-പ്രോഗ്രൈസ്ഡ്

ഒന്നിലധികം ആവര്‍ത്തന ഡയലോഗ് മോഡല്‍ തുടര്‍ച്ചയുളള മോഡല്‍ — 5 ಭಾಷಣകാരുമായും 60 മിനിറ്റോളം ശബ്ദകര്‍ത്താവ് ഓഡിയോയുമായി സംവാദങ്ങള്‍ സൃഷ്ടിക്കുക.

ഇടത്തരം · 12GB VRAM ശ്രമിക്ക്.

Ming-Omni TTS

44.1khjz ഔട്ട്പുട്ട് ശബ്ദമിശ്രണോപാധി കമ്പ്യൂട്ടര്‍ നിയന്ത്രണം ഡയലക്ടര്‍ നിയന്ത്രണം ബിജിഎം തലമുറ കോംപൌണ്ട് CRLB

Compact 0. 5B- memne- module മോഡല്‍ refidefaultide 44.1ky ഔട്ട്പുട്ട്, പൂജ്യം-shot-shot കണ്‍സോള്‍.

ഇടത്തരം · 3GB VRAM ശ്രമിക്ക്.

MOSS-TTS Nano