ഫ്രീ AI സംസാരത്തിനുള്ള വാചകം
31+ തുറന്ന ഏടുകള്, 231+ ശബ്ദം കേള്ക്കുന്നു, 34+ ഭാഷകള്. അക്കൌണ്ട് ആവശ്യമില്ല.
ശബ്ദത്തിന്റെ ആവശ്യമുള്ളതെല്ലാം
30+ ഉപകരണങ്ങള് ഓപ്പണ്- റിസോഴ്സ് എഐ മോഡില് പ്രവര്ത്തിപ്പിയ്ക്കുന്നുName
31+ AI ശബ്ദ മോഡലുകള്
ഒരു പ്ലാറ്റ്ഫോമിലെ തുറക്കുന്ന ടിടിഎസ് മോഡലുകള്
Kokoro Free
കൊക്കോറോ ഒരു 82 ദശലക്ഷം പരാമീറ്റര് ടെക്സ്റ്റുകള്ക്കുള്ള ടെക്സ്റ്റുകള് ആണ്. തൂക്കത്തില് കൂടുതല് കൂടുന്ന ഒരു ചെറിയ അക്ഷരം ഉണ്ടെങ്കില്, അത് വളരെ സ്വാഭാവികവും വര്ദ്ധിപ്പിക്കുന്ന സംസാരം ഉല്പാദിപ്പിക്കുന്നു. കോക്കോറോ ഇംഗ്ലീഷ്, ജപ്പനീസ്, ചൈനീസ്, കൊറിയന് തുടങ്ങിയ പല ഭാഷകള്ക്കു പിന്തുണ ചെയ്യുന്നു. വളരെ വേഗത്തില് അത് GPU-സമയത്ത് പ്രവര്ത്തിക്കുന്നതിലും വേഗത്തില് പ്രവര്ത്തിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വളരെ കുറഞ്ഞ ലോഞ്ച്, സ്റ്റ്രീം പ്രയോഗങ്ങളുള്ള ഉയര്ന്ന ടിടിഎസ്Name
സ്വതന്ത്രമായി ശ്രമിക്കുക
Piper Free
പിപ്പര്, VITS and Lystempy and Ids and Is and Lystem Strints- ല് നിര്മ്മിച്ച ഭാരം കുറഞ്ഞ ടെക്സ്റ്റ് എഞ്ചിന് ആണ്. ഇതു് പൂര്ണ്ണമായും CPU- യില് പ്രവര്ത്തനസജ്ജമാക്കുന്നു. മോര്ന്ന ഉപകരണങ്ങള്, ഹോം-നൈമാറ്റം, പ്രയോഗങ്ങള്ക്ക് ഓണ്ലിറ്റില് ആവശ്യമുളള ഉപകരണങ്ങള്. 30+-ല് കൂടുതല് ശബ്ദങ്ങള് ഉള്ളതിനാല്, ഒരു റാസ്പെറിബെറി 4-ല് ശബ്ദോപൈന് വേഗതയില്, പാപ്പര് പ്രവര്ത്തിപ്പിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: ത്വരിതപ്പെടുത്തല്, ആക്സസിബിളിറ്റി, എംബഡ് ചെയ്ത പ്രയോഗങ്ങള്
സ്വതന്ത്രമായി ശ്രമിക്കുക
VITS Free
VITS (അന്ത്യ-ഘടകത്തില് നിന്ന് വായിക്കാന് പഠിക്കല്) ഒരു സമാന്തര രീതിയാണ്. അത്, ഇപ്പോഴത്തെ രണ്ട് കേന്ദ്ര മോഡലുകള്ക്കപ്പുറം പ്രകൃതിയിലെ ശബ്ദോപകരണങ്ങള് ഉണ്ടാക്കുന്ന ശബ്ദ രീതിയാണ്. അപ്പോള്, പരമ്പരാഗത പരിവര്ത്തനം, പരമ്പരാഗികമായ പരിശീലന പ്രക്രിയകള്, പ്രകൃതിയില് ശ്രദ്ധേയമായ പുരോഗതി നേടുന്നു.
ഏറ്റവും നല്ല സ്കോര്: സാധാരണ ടെക്സ്റ്റില് നിന്നും സ്വാഭാവികമായ സംയോജകങ്ങളുമായി പ്രവര്ത്തിപ്പിയ്ക്കുക
സ്വതന്ത്രമായി ശ്രമിക്കുക
MeloTTS Free
Mylottts ആണ് ഇംഗ്ലീഷ്, ബ്രിട്ടീഷ്, ബ്രിട്ടീഷ്, ഓസ്ട്രേലിയ, സ്പാനിഷ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന് പിന്തുണയുള്ള ഒരു ബഹുഭാഷാ ലൈബ്രറി. സിപിയു-ടൈം-ടൈം-ടൈം വേഗതക്കു സമീപത്തുള്ള പാഠം വളരെ വേഗത്തില് പ്രവര്ത്തിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: വേഗത്തില്, ബഹുഭാഷാ TTS ആവശ്യമുളള പ്രയോഗങ്ങള് ഉല്പാദിപ്പിക്കുന്നു
സ്വതന്ത്രമായി ശ്രമിക്കുക
OuteTTS Free
പ്രത്യേക നിര്മ്മാണ കേന്ദ്രം സൂക്ഷിക്കുമ്പോള്, ടെക്സ്റ്റില് നിന്നും ഇന്സ്റ്റാള്സുമായി വലിയ ഭാഷാമാലകള് വിടുന്നു. Lama. Cc/ GPUP (CPU), ഹാന്ഡ് മോണിറ്ററുകള് (എക്സിഎം), എക്എംഎംഎഫ്എഫ്വിവ്യൂ (എക്സി), വിന്യാസുകള് (എക്എഫ്എഫ്എംഎസ്എംഎസ്) എന്നിവ ഉള്പ്പെടെ പല ബാക്കുകള് പിന്തുണയ്ക്കുന്നു. സ്പോണ്സര് പ്രൊഫൈല്സുകള് (ജോണ്സസ്സുകള്) എന്ന രീതിയില് ശബ്ദസജ്ജമാക്കിയുള്ള ശബ്ദകര്മ്മങ്ങള് (ജെസാന്).
ഏറ്റവും നല്ല സ്കോര്: എക്ട്രേറ്റമെന്റ്, ബ്രൌസര്- അടിസ്ഥാനമാക്കിയുള്ള TTS, കുറഞ്ഞ- റിസോഴ്സ് പരിസരം
സ്വതന്ത്രമായി ശ്രമിക്കുക
Pocket TTS Free
ക്യുടി (മോടിയുടെ പ്രതിനിധികള്) പോക്കറ്റ് ടിഎസ് (മോഷിയുടെ പ്രതിനിധികള്) ഒരു കംപ്യൂട്ടര് റെക്കോര്ഡ്- ടെക്സ്- ടെക്സ്റ്റുകള് (കോണ്ക്കാറ്റില് കൂടുതല് തുളച്ചെടുക്കുന്ന ഒരു കംപ്യൂട്ടര് ടെക്സ്- ടെക്സ്- റൈല് അഗ്രമാക്കല്) ആണ്. ഇതു സിപിയുപിയു പ്രവര്ത്തിയ്ക്കു് പ്രാവര്ത്തികമായി പ്രവര്ത്തിപ്പിക്കുന്നു, ഒരു ഓഡിയോ മാതൃകയില് നിന്നും പൂജ്യ- ഹോട്ട്- ഹോട്ട്- ഹോട്ട് വോള് വോള് വോള്ഡിക്കോളുകള് പിന്തുണയ്ക്കുന്നു, സ്വാഭാവികമായ സംസാരങ്ങള് ഉല്പാദിപ്പിക്കുന്നു. ചെറിയ വലുപ്പവും താഴ്ന്ന പരിസ്ഥിതിയും സജ്ജീകരിക്കുന്നു.
ഏറ്റവും നല്ല സ്കോര്: ചെറിയ വലിപ്പം, സിപിയു- ഒറ്റ പരിസ്ഥിതി, വേഗത്തിലുള്ള ശബ്ദമിശ്രണോപാധി
സ്വതന്ത്രമായി ശ്രമിക്കുക
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
ഏറ്റവും നല്ല സ്കോര്: Fast lightweight TTS, edge deployment, low-latency applications
സ്വതന്ത്രമായി ശ്രമിക്കുക
Bark Standard
സാങ്കേതികമായ സംസാരം, സംഗീതം, സൌന്ദര്യ പ്രഭാവങ്ങള് എന്നിവ ഉല്പാദിപ്പിക്കുന്ന ടെക്സ്റ്റര്- അല്യൂഡോ മോഡല്.
രചയിതാവു്: Suno · അനുമതി: MIT
ശ്രമിക്ക്.
Bark Small Standard
വേഗത്തിൽ ഇന്ഫറസും കുറഞ്ഞ മെമ്മറിയുടെ ഉപയോഗവും ഉള്ള ബാര്ക്കിന്റെ ലൈറ്റര് പതിപ്പു്.
രചയിതാവു്: Suno · അനുമതി: MIT
ശ്രമിക്ക്.
CosyVoice 2 Standard
അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന് പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.
രചയിതാവു്: Alibaba (Tongyi Lab) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Dia TTS Standard
ശബ്ദകര്മ്മികള്ക്കിടയില് സ്വാഭാവികമായ സംവാദങ്ങള് സൃഷ്ടിക്കുന്ന ഒന്നിനൊന്ന് സജ്ജീകരണത്തിനുള്ള ഡയലോഗ് പരമ്പര. Name
രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Parler TTS Standard
നിങ്ങള്ക്ക് സ്വാഭാവിക ഭാഷയിലും പാര്ലറിലും ചേരുന്ന ശബ്ദവും വിവരിക്കുക.
രചയിതാവു്: Hugging Face · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
GLM-TTS Standard
തുറന്ന ടിടിഎസ് മോഡലുകള്ക്കു് താഴെയുള്ള അക്ഷരങ്ങളുടെ പിശകിന്റെ നിരക്കില് പ്രാവര്ത്തികമാക്കുന്നു.
രചയിതാവു്: Zhipu AI · അനുമതി: GLM-4 License
ശ്രമിക്ക്.
IndexTTS-2 Standard
നല്ല മാനസിക നിയന്ത്രണവും ഉയര്ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.
രചയിതാവു്: Index Team · അനുമതി: Bilibili Model License
ശ്രമിക്ക്.
GPT-SoVITS Standard
വെറും 5 സെക്കന്റില് നിന്ന് ശബ്ദം കേള്ക്കുന്ന ക്ളൈന് ടി. ടി. ടി.
രചയിതാവു്: RVC-Boss · അനുമതി: MIT
ശ്രമിക്ക്.
Orpheus Standard
100K മണിക്കൂര് സംസാര വിവരങ്ങള്ക്ക് പരിശീലനം നല്കി മനുഷ്യ-തലത്തിലെ വികാരാധീന TTS മോഡല്.
രചയിതാവു്: Canopy Labs · അനുമതി: Llama 3.2 Community
ശ്രമിക്ക്.
Qwen3 TTS Standard
അലിബായുടെ ബഹുഭാഷാ TTS, ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില് നിന്നും ശബ്ദ ഘടനയും കൊണ്ട്.
രചയിതാവു്: Alibaba (Qwen) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
Chatterbox Turbo Standard
വേഗത്തില് ചാറ്റര്ബോക്സ്......സബ്-ഡബ്ലിക്കില് സബ്-എംസ്ലെന്സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.
രചയിതാവു്: Resemble AI · അനുമതി: MIT
ശ്രമിക്ക്.
Dia 2 Standard
ഒന്നിലധികം സ്ട്രീമിങ് വര്ത്തമാനം നല്കുന്ന ടീവികള് മള്ട്ടി-എഞ്ചര് ഡയലോഗും പനിഗ്നിക് ക്കളും ചേര്ക്കുന്നു.
രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
VoxCPM Standard
ടൈക്കന്സര് - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.
രചയിതാവു്: OpenBMB · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
TADA Standard
എല്.എം ടി.ടി.എക്കാള് വേഗത്തില്.. എല്.എം ടി.ടി.
രചയിതാവു്: Hume AI · അനുമതി: MIT
ശ്രമിക്ക്.
VibeVoice Standard
മൈക്രോസോഫ്റ്റ് മോഡ്യൂളുകള് പോര്ട്ട്സ്, ഓഡിയോ പുസ്തകങ്ങള് പോലുള്ള അനവധി ശബ്ദങ്ങള്ക്കുള്ള മോഡല്.
രചയിതാവു്: Microsoft · അനുമതി: MIT
ശ്രമിക്ക്.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
രചയിതാവു്: Alibaba (FunAudioLLM) · അനുമതി: Apache 2.0
ശ്രമിക്ക്.
CosyVoice 2
അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന് പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.
ഭാഷകള്: en, zh, ja, ko, fr, de, it, es
ശബ്ദം ക്ലോണ് ചെയ്യുക
GLM-TTS
തുറന്ന ടിടിഎസ് മോഡലുകള്ക്കു് താഴെയുള്ള അക്ഷരങ്ങളുടെ പിശകിന്റെ നിരക്കില് പ്രാവര്ത്തികമാക്കുന്നു.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
IndexTTS-2
നല്ല മാനസിക നിയന്ത്രണവും ഉയര്ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
GPT-SoVITS
വെറും 5 സെക്കന്റില് നിന്ന് ശബ്ദം കേള്ക്കുന്ന ക്ളൈന് ടി. ടി. ടി.
ഭാഷകള്: en, zh, ja, ko
ശബ്ദം ക്ലോണ് ചെയ്യുക
Tortoise TTS
മള്ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില് നിന്നും ഗുണമേന്മയില് ഓട്ടോഗ്രസ്ട്രേഷന് കെട്ടിടത്തില് ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
OpenVoice
ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്റെയും നിയന്ത്രണത്തിലുള്ള ഇന്റർനാഷണൽ ശബ്ദം.
ഭാഷകള്: en, zh, ja, ko, fr, de, es, it
ശബ്ദം ക്ലോണ് ചെയ്യുക
Qwen3 TTS
അലിബായുടെ ബഹുഭാഷാ TTS, ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില് നിന്നും ശബ്ദ ഘടനയും കൊണ്ട്.
ഭാഷകള്: en, zh, ja, ko, de, fr, ru, pt, es, it
ശബ്ദം ക്ലോണ് ചെയ്യുക
Chatterbox Turbo
വേഗത്തില് ചാറ്റര്ബോക്സ്......സബ്-ഡബ്ലിക്കില് സബ്-എംസ്ലെന്സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
VoxCPM
ടൈക്കന്സര് - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുക
OuteTTS
എംഎം- അടിസ്ഥാനമാക്കിയുള്ള ടിടിഎസ് സിപിയു, ജിപിയു അല്ലെങ്കില് Lamap.cp. andjs.
ഭാഷകള്: en
ശബ്ദം ക്ലോണ് ചെയ്യുക
Pocket TTS
ഒരു സാമ്പിളില് നിന്നും ശബ്ദമുപയോഗിച്ച് 100എം പരാമീറ്റര് മോഡല്.
ഭാഷകള്: en, fr
ശബ്ദം ക്ലോണ് ചെയ്യുക
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ഭാഷകള്: en, zh, ja, ko, de, es, fr, it, ru
ശബ്ദം ക്ലോണ് ചെയ്യുക
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ഭാഷകള്: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
ശബ്ദം ക്ലോണ് ചെയ്യുക
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ഭാഷകള്: en, zh
ശബ്ദം ക്ലോണ് ചെയ്യുകരചയിതാവു് - ആദ്യത്തെ API
ഓപ്പണ്AI- യോജിപ്പുള്ള റെസ്റ്റ് API. ഒരു അവസാന പോയിന്റ്, 22+ മോഡലുകള്. ശരിയായ സമയ പ്രയോഗങ്ങള്ക്കുള്ള പിന്തുണ സ്റ്റ്രീമിങ്ങുന്നു.
- ഓപ്പണ്ഐ- ആക്സസിബിളിറ്റി ഫോര്മാറ്റ്
- റിയല് ടൈം ആപ്സിനായി ടിടിഎസ് സ്ട്രീം ചെയ്യുന്നുName
- വലിയ ജോലികള്ക്കുള്ള തുക പ്രവര്ത്തനം
- വെബ് ടാബ് അറിയിപ്പുകള്
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ലളിതമായ, സുതാര്യമായ പ്രകമ്പനംName
സ്വതന്ത്രമായി തുടങ്ങുക. നിങ്ങള് വളരുമ്പോള് വലിപ്പം കൂട്ടുക.
ഫ്രീ
15 ക്രെഡിറ്റ്സ്
- Kokoro, Piper, VITS, MeloTTS
- 500 അക്ഷരങ്ങളുടെ പരിധി
- 3 ജിന്/ മണിക്കൂര് (അക്കൌണ്ട് ഇല്ല)
ആരംഭകന്
500 ക്രെഡിറ്റ്സ്/മാസം
- എല്ലാ 22+ മോഡലുകള്
- ഒരു തലമുറയില് 1,00,000 അക്ഷരങ്ങള്
- ശബ്ദ ക്ളൈനിങ്ങ്
പ്രൊഫൈല്
2,000 ക്രെഡിറ്റ്സ്/ മാസം
- എല്ലാം തുടങ്ങുമ്പോള്.
- API പ്രവേശിക്കുന്നു
- മുന്ഗണനാ പ്രക്രിയ
വ്യാപാരം
10,000 ക്രെഡിറ്റ്സ്/മാസം
- പ്രൊവറില് എല്ലാം
- മൊത്തം API
- മുന്ഗണനാ റേറ്റര്
പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ
നിങ്ങളുടെ പ്രതികരണം പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ നമ്മെ സഹായിക്കുന്നു.
ഇന്ന് AI ശബ്ദം ഉപയോഗിക്കാന് തുടങ്ങുക
സ്രഷ്ടാക്കളും ഡയറകടറും ബിസിനസ്സുകളും ചേർന്ന് TTS.ai