ഫ്രീ AI സംസാരത്തിനുള്ള വാചകം
20+ തുറന്ന ഏടുകള്, 107+ ശബ്ദം കേള്ക്കുന്നു, 32+ ഭാഷകള്. അക്കൌണ്ട് ആവശ്യമില്ല.
ശബ്ദത്തിന്റെ ആവശ്യമുള്ളതെല്ലാം
30+ ഉപകരണങ്ങള് ഓപ്പണ്- റിസോഴ്സ് എഐ മോഡില് പ്രവര്ത്തിപ്പിയ്ക്കുന്നുName
20+ AI ശബ്ദ മോഡലുകള്
ഒരു പ്ലാറ്റ്ഫോമിലെ തുറക്കുന്ന ടിടിഎസ് മോഡലുകള്
Kokoro Free
കൊക്കോറോ ഒരു 82 ദശലക്ഷം പരാമീറ്റര് ടെക്സ്റ്റുകള്ക്കുള്ള ടെക്സ്റ്റുകള് ആണ്. തൂക്കത്തില് കൂടുതല് കൂടുന്ന ഒരു ചെറിയ അക്ഷരം ഉണ്ടെങ്കില്, അത് വളരെ സ്വാഭാവികവും വര്ദ്ധിപ്പിക്കുന്ന സംസാരം ഉല്പാദിപ്പിക്കുന്നു. കോക്കോറോ ഇംഗ്ലീഷ്, ജപ്പനീസ്, ചൈനീസ്, കൊറിയന് തുടങ്ങിയ പല ഭാഷകള്ക്കു പിന്തുണ ചെയ്യുന്നു. വളരെ വേഗത്തില് അത് GPU-സമയത്ത് പ്രവര്ത്തിക്കുന്നതിലും വേഗത്തില് പ്രവര്ത്തിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വളരെ കുറഞ്ഞ ലോഞ്ച്, സ്റ്റ്രീം പ്രയോഗങ്ങളുള്ള ഉയര്ന്ന ടിടിഎസ്Name
സ്വതന്ത്രമായി ശ്രമിക്കുക
Piper Free
പിപ്പര്, VITS and Lystempy and Ids and Is and Lystem Strints- ല് നിര്മ്മിച്ച ഭാരം കുറഞ്ഞ ടെക്സ്റ്റ് എഞ്ചിന് ആണ്. ഇതു് പൂര്ണ്ണമായും CPU- യില് പ്രവര്ത്തനസജ്ജമാക്കുന്നു. മോര്ന്ന ഉപകരണങ്ങള്, ഹോം-നൈമാറ്റം, പ്രയോഗങ്ങള്ക്ക് ഓണ്ലിറ്റില് ആവശ്യമുളള ഉപകരണങ്ങള്. 30+-ല് കൂടുതല് ശബ്ദങ്ങള് ഉള്ളതിനാല്, ഒരു റാസ്പെറിബെറി 4-ല് ശബ്ദോപൈന് വേഗതയില്, പാപ്പര് പ്രവര്ത്തിപ്പിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: ത്വരിതപ്പെടുത്തല്, ആക്സസിബിളിറ്റി, എംബഡ് ചെയ്ത പ്രയോഗങ്ങള്
സ്വതന്ത്രമായി ശ്രമിക്കുക
VITS Free
VITS (അന്ത്യ-ഘടകത്തില് നിന്ന് വായിക്കാന് പഠിക്കല്) ഒരു സമാന്തര രീതിയാണ്. അത്, ഇപ്പോഴത്തെ രണ്ട് കേന്ദ്ര മോഡലുകള്ക്കപ്പുറം പ്രകൃതിയിലെ ശബ്ദോപകരണങ്ങള് ഉണ്ടാക്കുന്ന ശബ്ദ രീതിയാണ്. അപ്പോള്, പരമ്പരാഗത പരിവര്ത്തനം, പരമ്പരാഗികമായ പരിശീലന പ്രക്രിയകള്, പ്രകൃതിയില് ശ്രദ്ധേയമായ പുരോഗതി നേടുന്നു.
ഏറ്റവും നല്ല സ്കോര്: സാധാരണ ടെക്സ്റ്റില് നിന്നും സ്വാഭാവികമായ സംയോജകങ്ങളുമായി പ്രവര്ത്തിപ്പിയ്ക്കുക
സ്വതന്ത്രമായി ശ്രമിക്കുക
MeloTTS Free
Mylottts ആണ് ഇംഗ്ലീഷ്, ബ്രിട്ടീഷ്, ബ്രിട്ടീഷ്, ഓസ്ട്രേലിയ, സ്പാനിഷ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന് പിന്തുണയുള്ള ഒരു ബഹുഭാഷാ ലൈബ്രറി. സിപിയു-ടൈം-ടൈം-ടൈം വേഗതക്കു സമീപത്തുള്ള പാഠം വളരെ വേഗത്തില് പ്രവര്ത്തിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വേഗത്തില്, ബഹുഭാഷാ TTS ആവശ്യമുളള പ്രയോഗങ്ങള് ഉല്പാദിപ്പിക്കുന്നു
സ്വതന്ത്രമായി ശ്രമിക്കുക
Bark Standard
സാങ്കേതികമായ സംസാരം, സംഗീതം, സൌന്ദര്യ പ്രഭാവങ്ങള് എന്നിവ ഉല്പാദിപ്പിക്കുന്ന ടെക്സ്റ്റര്- അല്യൂഡോ മോഡല്.
രചയിതാവു്: Suno · അനുമതി: MIT
ശ്രമിക്ക്.
Bark Small Standard
വേഗത്തിൽ ഇന്ഫറസും കുറഞ്ഞ മെമ്മറിയുടെ ഉപയോഗവും ഉള്ള ബാര്ക്കിന്റെ ലൈറ്റര് പതിപ്പു്.
രചയിതാവു്: Suno · അനുമതി: MIT
ശ്രമിക്ക്.
CosyVoice 2 Standard
അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന് പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.
രചയിതാവു്: Alibaba (Tongyi Lab) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Dia TTS Standard
ശബ്ദകര്മ്മികള്ക്കിടയില് സ്വാഭാവികമായ സംവാദങ്ങള് സൃഷ്ടിക്കുന്ന ഒന്നിനൊന്ന് സജ്ജീകരണത്തിനുള്ള ഡയലോഗ് പരമ്പര. Name
രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Parler TTS Standard
നിങ്ങള്ക്ക് സ്വാഭാവിക ഭാഷയിലും പാര്ലറിലും ചേരുന്ന ശബ്ദവും വിവരിക്കുക.
രചയിതാവു്: Hugging Face · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
GLM-TTS Standard
തുറന്ന ടിടിഎസ് മോഡലുകള്ക്കു് താഴെയുള്ള അക്ഷരങ്ങളുടെ പിശകിന്റെ നിരക്കില് പ്രാവര്ത്തികമാക്കുന്നു.
രചയിതാവു്: Zhipu AI · അനുമതി: GLM-4 License
ശ്രമിക്ക്.
IndexTTS-2 Standard
നല്ല മാനസിക നിയന്ത്രണവും ഉയര്ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.
രചയിതാവു്: Index Team · അനുമതി: Bilibili Model License
ശ്രമിക്ക്.
GPT-SoVITS Standard
വെറും 5 സെക്കന്റില് നിന്ന് ശബ്ദം കേള്ക്കുന്ന ക്ളൈന് ടി. ടി. ടി.
രചയിതാവു്: RVC-Boss · അനുമതി: MIT
ശ്രമിക്ക്.
Orpheus Standard
100K മണിക്കൂര് സംസാര വിവരങ്ങള്ക്ക് പരിശീലനം നല്കി മനുഷ്യ-തലത്തിലെ വികാരാധീന TTS മോഡല്.
രചയിതാവു്: Canopy Labs · അനുമതി: Llama 3.2 Community
ശ്രമിക്ക്.
Qwen3 TTS Standard
അലിബായുടെ ബഹുഭാഷാ TTS, ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില് നിന്നും ശബ്ദ ഘടനയും കൊണ്ട്.
രചയിതാവു്: Alibaba (Qwen) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
CosyVoice 2
അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന് പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.
ഭാഷകള്: en, zh, ja, ko, fr, de, it, es
ശബ്ദം ക്ലോണ് ചെയ്യുക
GLM-TTS
തുറന്ന ടിടിഎസ് മോഡലുകള്ക്കു് താഴെയുള്ള അക്ഷരങ്ങളുടെ പിശകിന്റെ നിരക്കില് പ്രാവര്ത്തികമാക്കുന്നു.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
IndexTTS-2
നല്ല മാനസിക നിയന്ത്രണവും ഉയര്ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
GPT-SoVITS
വെറും 5 സെക്കന്റില് നിന്ന് ശബ്ദം കേള്ക്കുന്ന ക്ളൈന് ടി. ടി. ടി.
ഭാഷകള്: en, zh, ja, ko
ശബ്ദം ക്ലോണ് ചെയ്യുക
Tortoise TTS
മള്ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില് നിന്നും ഗുണമേന്മയില് ഓട്ടോഗ്രസ്ട്രേഷന് കെട്ടിടത്തില് ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
OpenVoice
ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്റെയും നിയന്ത്രണത്തിലുള്ള ഇന്റർനാഷണൽ ശബ്ദം.
ഭാഷകള്: en, zh, ja, ko, fr, de, es, it
ശബ്ദം ക്ലോണ് ചെയ്യുക
Qwen3 TTS
അലിബായുടെ ബഹുഭാഷാ TTS, ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില് നിന്നും ശബ്ദ ഘടനയും കൊണ്ട്.
ഭാഷകള്: en, zh, ja, ko, de, fr, ru, pt, es, it
ശബ്ദം ക്ലോണ് ചെയ്യുകരചയിതാവു് - ആദ്യത്തെ API
ഓപ്പണ്AI- യോജിപ്പുള്ള റെസ്റ്റ് API. ഒരു അവസാന പോയിന്റ്, 22+ മോഡലുകള്. ശരിയായ സമയ പ്രയോഗങ്ങള്ക്കുള്ള പിന്തുണ സ്റ്റ്രീമിങ്ങുന്നു.
- ഓപ്പണ്ഐ- ആക്സസിബിളിറ്റി ഫോര്മാറ്റ്
- റിയല് ടൈം ആപ്സിനായി ടിടിഎസ് സ്ട്രീം ചെയ്യുന്നുName
- വലിയ ജോലികള്ക്കുള്ള തുക പ്രവര്ത്തനം
- വെബ് ടാബ് അറിയിപ്പുകള്
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ലളിതമായ, സുതാര്യമായ പ്രകമ്പനംName
സ്വതന്ത്രമായി തുടങ്ങുക. നിങ്ങള് വളരുമ്പോള് വലിപ്പം കൂട്ടുക.
ഫ്രീ
15 ക്രെഡിറ്റ്സ്
- Kokoro, Piper, VITS, MeloTTS
- 500 അക്ഷരങ്ങളുടെ പരിധി
- 3 ജിന്/ മണിക്കൂര് (അക്കൌണ്ട് ഇല്ല)
ആരംഭകന്
500 ക്രെഡിറ്റ്സ്/മാസം
- എല്ലാ 22+ മോഡലുകള്
- 100,000 chars per generation
- ശബ്ദ ക്ളൈനിങ്ങ്
പ്രൊഫൈല്
2,000 ക്രെഡിറ്റ്സ്/ മാസം
- എല്ലാം തുടങ്ങുമ്പോള്.
- API പ്രവേശിക്കുന്നു
- മുന്ഗണനാ പ്രക്രിയ
വ്യാപാരം
10,000 ക്രെഡിറ്റ്സ്/മാസം
- പ്രൊവറില് എല്ലാം
- മൊത്തം API
- മുന്ഗണനാ റേറ്റര്
പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ
ഇന്ന് AI ശബ്ദം ഉപയോഗിക്കാന് തുടങ്ങുക
സ്രഷ്ടാക്കളും ഡയറകടറും ബിസിനസ്സുകളും ചേർന്ന് TTS.ai