ഫ്രീ AI സംസാരത്തിനുള്ള വാചകം

31+ തുറന്ന ഏടുകള്‍, 231+ ശബ്ദം കേള്‍ക്കുന്നു, 34+ ഭാഷകള്‍. അക്കൌണ്ട് ആവശ്യമില്ല.

8K+
സൃഷ്ടാവ്
30K+
തലമുറകള്‍
31+
AI മോഡലുകള്‍
231+
ശബ്ദങ്ങള്‍
0/500 അക്ഷരങ്ങള്‍ · Sign up for 5,000 per generation → ഫ്രീ
ടിടിഎസ് സ്‌നേഹിക്കുന്നു, കൂട്ടുകാരോട് പറയൂ!

ശബ്ദത്തിന്‍റെ ആവശ്യമുള്ളതെല്ലാം

30+ ഉപകരണങ്ങള്‍ ഓപ്പണ്‍- റിസോഴ്സ് എഐ മോഡില്‍ പ്രവര്‍ത്തിപ്പിയ്ക്കുന്നുName

31+ AI ശബ്ദ മോഡലുകള്‍

ഒരു പ്ലാറ്റ്ഫോമിലെ തുറക്കുന്ന ടിടിഎസ് മോഡലുകള്‍

KokoroKokoro Free

കൊക്കോറോ ഒരു 82 ദശലക്ഷം പരാമീറ്റര്‍ ടെക്സ്റ്റുകള്‍ക്കുള്ള ടെക്സ്റ്റുകള്‍ ആണ്. തൂക്കത്തില്‍ കൂടുതല്‍ കൂടുന്ന ഒരു ചെറിയ അക്ഷരം ഉണ്ടെങ്കില്‍, അത് വളരെ സ്വാഭാവികവും വര്‍ദ്ധിപ്പിക്കുന്ന സംസാരം ഉല്‍പാദിപ്പിക്കുന്നു. കോക്കോറോ ഇംഗ്ലീഷ്, ജപ്പനീസ്, ചൈനീസ്, കൊറിയന്‍ തുടങ്ങിയ പല ഭാഷകള്‍ക്കു പിന്തുണ ചെയ്യുന്നു. വളരെ വേഗത്തില്‍ അത് GPU-സമയത്ത് പ്രവര്‍ത്തിക്കുന്നതിലും വേഗത്തില്‍ പ്രവര്‍ത്തിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: വളരെ കുറഞ്ഞ ലോഞ്ച്, സ്റ്റ്രീം പ്രയോഗങ്ങളുള്ള ഉയര്‍ന്ന ടിടിഎസ്Name

സ്വതന്ത്രമായി ശ്രമിക്കുക

PiperPiper Free

പിപ്പര്‍, VITS and Lystempy and Ids and Is and Lystem Strints- ല്‍ നിര്‍മ്മിച്ച ഭാരം കുറഞ്ഞ ടെക്സ്റ്റ് എഞ്ചിന്‍ ആണ്. ഇതു് പൂര്‍ണ്ണമായും CPU- യില്‍ പ്രവര്‍ത്തനസജ്ജമാക്കുന്നു. മോര്‍ന്ന ഉപകരണങ്ങള്‍, ഹോം-നൈമാറ്റം, പ്രയോഗങ്ങള്‍ക്ക് ഓണ്‍ലിറ്റില്‍ ആവശ്യമുളള ഉപകരണങ്ങള്‍. 30+-ല്‍ കൂടുതല്‍ ശബ്ദങ്ങള്‍ ഉള്ളതിനാല്‍, ഒരു റാസ്പെറിബെറി 4-ല്‍ ശബ്ദോപൈന്‍ വേഗതയില്‍, പാപ്പര്‍ പ്രവര്‍ത്തിപ്പിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: ത്വരിതപ്പെടുത്തല്‍, ആക്സസിബിളിറ്റി, എംബഡ് ചെയ്ത പ്രയോഗങ്ങള്‍

സ്വതന്ത്രമായി ശ്രമിക്കുക

VITSVITS Free

VITS (അന്ത്യ-ഘടകത്തില്‍ നിന്ന് വായിക്കാന്‍ പഠിക്കല്‍) ഒരു സമാന്തര രീതിയാണ്. അത്, ഇപ്പോഴത്തെ രണ്ട് കേന്ദ്ര മോഡലുകള്‍ക്കപ്പുറം പ്രകൃതിയിലെ ശബ്ദോപകരണങ്ങള്‍ ഉണ്ടാക്കുന്ന ശബ്ദ രീതിയാണ്. അപ്പോള്‍, പരമ്പരാഗത പരിവര്‍ത്തനം, പരമ്പരാഗികമായ പരിശീലന പ്രക്രിയകള്‍, പ്രകൃതിയില്‍ ശ്രദ്ധേയമായ പുരോഗതി നേടുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: സാധാരണ ടെക്സ്റ്റില്‍ നിന്നും സ്വാഭാവികമായ സംയോജകങ്ങളുമായി പ്രവര്‍ത്തിപ്പിയ്ക്കുക

സ്വതന്ത്രമായി ശ്രമിക്കുക

MeloTTSMeloTTS Free

Mylottts ആണ് ഇംഗ്ലീഷ്, ബ്രിട്ടീഷ്, ബ്രിട്ടീഷ്, ഓസ്ട്രേലിയ, സ്പാനിഷ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന് പിന്തുണയുള്ള ഒരു ബഹുഭാഷാ ലൈബ്രറി. സിപിയു-ടൈം-ടൈം-ടൈം വേഗതക്കു സമീപത്തുള്ള പാഠം വളരെ വേഗത്തില്‍ പ്രവര്‍ത്തിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: വേഗത്തില്‍, ബഹുഭാഷാ TTS ആവശ്യമുളള പ്രയോഗങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്നു

സ്വതന്ത്രമായി ശ്രമിക്കുക

OuteTTSOuteTTS Free

പ്രത്യേ‌‌ക നിര്‍മ്മാണ കേന്ദ്രം സൂക്ഷിക്കുമ്പോള്‍, ടെക്സ്റ്റില്‍ നിന്നും ഇന്‍സ്റ്റാള്‍സുമായി വലിയ ഭാഷാമാലകള്‍ വിടുന്നു. Lama. Cc/ GPUP (CPU), ഹാന്‍ഡ് മോണിറ്ററുകള്‍ (എക്‌സിഎം), എക്‌എംഎംഎഫ്‌എഫ്‌വി‌വ്യൂ (എക്‌സി), വിന്യാസുകള്‍ (എക്‌എഫ്‌എഫ്‌എംഎസ്‌എംഎസ്) എന്നിവ ഉള്‍പ്പെടെ പല ബാക്കുകള്‍ പിന്തുണയ്ക്കുന്നു. സ്പോണ്‍സര്‍ പ്രൊഫൈല്‍സുകള്‍ (ജോണ്‍സസ്സുകള്‍) എന്ന രീതിയില്‍ ശബ്ദസജ്ജമാക്കിയുള്ള ശബ്ദകര്‍മ്മങ്ങള്‍ (ജെസാന്‍).

ഏറ്റവും നല്ല സ്കോര്‍: എക്ട്രേറ്റമെന്റ്, ബ്രൌസര്‍- അടിസ്ഥാനമാക്കിയുള്ള TTS, കുറഞ്ഞ- റിസോഴ്സ് പരിസരം

സ്വതന്ത്രമായി ശ്രമിക്കുക

Pocket TTSPocket TTS Free

ക്യുടി (മോടിയുടെ പ്രതിനിധികള്‍) പോക്കറ്റ് ടിഎസ് (മോഷിയുടെ പ്രതിനിധികള്‍) ഒരു കംപ്യൂട്ടര്‍ റെക്കോര്‍ഡ്- ടെക്സ്- ടെക്സ്റ്റുകള്‍ (കോണ്‍ക്കാറ്റില്‍ കൂടുതല്‍ തുളച്ചെടുക്കുന്ന ഒരു കംപ്യൂട്ടര്‍ ടെക്സ്- ടെക്സ്- റൈല്‍ അഗ്രമാക്കല്‍) ആണ്. ഇതു സിപിയുപിയു പ്രവര്‍ത്തിയ്ക്കു് പ്രാവര്‍ത്തികമായി പ്രവര്‍ത്തിപ്പിക്കുന്നു, ഒരു ഓഡിയോ മാതൃകയില്‍ നിന്നും പൂജ്യ- ഹോട്ട്- ഹോട്ട്- ഹോട്ട് വോള്‍ വോള്‍ വോള്‍ഡിക്കോളുകള്‍ പിന്തുണയ്ക്കുന്നു, സ്വാഭാവികമായ സംസാരങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്നു. ചെറിയ വലുപ്പവും താഴ്ന്ന പരിസ്ഥിതിയും സജ്ജീകരിക്കുന്നു.

ഏറ്റവും നല്ല സ്കോര്‍: ചെറിയ വലിപ്പം, സിപിയു- ഒറ്റ പരിസ്ഥിതി, വേഗത്തിലുള്ള ശബ്ദമിശ്രണോപാധി

സ്വതന്ത്രമായി ശ്രമിക്കുക

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

ഏറ്റവും നല്ല സ്കോര്‍: Fast lightweight TTS, edge deployment, low-latency applications

സ്വതന്ത്രമായി ശ്രമിക്കുക

BarkBark Standard

സാങ്കേതികമായ സംസാരം, സംഗീതം, സൌന്ദര്യ പ്രഭാവങ്ങള്‍ എന്നിവ ഉല്‍പാദിപ്പിക്കുന്ന ടെക്സ്റ്റര്‍- അല്യൂഡോ മോഡല്‍.

രചയിതാവു്: Suno · അനുമതി: MIT

ശ്രമിക്ക്.

Bark SmallBark Small Standard

വേഗത്തിൽ ഇന്‍ഫറസും കുറഞ്ഞ മെമ്മറിയുടെ ഉപയോഗവും ഉള്ള ബാര്‍ക്കിന്റെ ലൈറ്റര്‍ പതിപ്പു്.

രചയിതാവു്: Suno · അനുമതി: MIT

ശ്രമിക്ക്.

CosyVoice 2CosyVoice 2 Standard

അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന്‍ പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.

രചയിതാവു്: Alibaba (Tongyi Lab) · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

Dia TTSDia TTS Standard

ശബ്ദകര്‍മ്മികള്‍ക്കിടയില്‍ സ്വാഭാവികമായ സംവാദങ്ങള്‍ സൃഷ്ടിക്കുന്ന ഒന്നിനൊന്ന് സജ്ജീകരണത്തിനുള്ള ഡയലോഗ് പരമ്പര. Name

രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

Parler TTSParler TTS Standard

നിങ്ങള്‍ക്ക് സ്വാഭാവിക ഭാഷയിലും പാര്‍ലറിലും ചേരുന്ന ശബ്ദവും വിവരിക്കുക.

രചയിതാവു്: Hugging Face · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

GLM-TTSGLM-TTS Standard

തുറന്ന ടിടിഎസ് മോഡലുകള്‍ക്കു് താഴെയുള്ള അക്ഷരങ്ങളുടെ പിശകിന്റെ നിരക്കില്‍ പ്രാവര്‍ത്തികമാക്കുന്നു.

രചയിതാവു്: Zhipu AI · അനുമതി: GLM-4 License

ശ്രമിക്ക്.

IndexTTS-2IndexTTS-2 Standard

നല്ല മാനസിക നിയന്ത്രണവും ഉയര്‍ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.

രചയിതാവു്: Index Team · അനുമതി: Bilibili Model License

ശ്രമിക്ക്.

Spark TTSSpark TTS Standard

ശബ്ദമിശ്രണോപാധി

രചയിതാവു്: SparkAudio · അനുമതി: CC BY-NC-SA 4.0

ശ്രമിക്ക്.

GPT-SoVITSGPT-SoVITS Standard

വെറും 5 സെക്കന്‍റില്‍ നിന്ന് ശബ്ദം കേള്‍ക്കുന്ന ക്ളൈന്‍ ടി. ടി. ടി.

രചയിതാവു്: RVC-Boss · അനുമതി: MIT

ശ്രമിക്ക്.

OrpheusOrpheus Standard

100K മണിക്കൂര്‍ സംസാര വിവരങ്ങള്‍ക്ക് പരിശീലനം നല്‍കി മനുഷ്യ-തലത്തിലെ വികാരാധീന TTS മോഡല്‍.

രചയിതാവു്: Canopy Labs · അനുമതി: Llama 3.2 Community

ശ്രമിക്ക്.

Qwen3 TTSQwen3 TTS Standard

അലിബായുടെ ബഹുഭാഷാ TTS, ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില്‍ നിന്നും ശബ്ദ ഘടനയും കൊണ്ട്.

രചയിതാവു്: Alibaba (Qwen) · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

Chatterbox TurboChatterbox Turbo Standard

വേഗത്തില്‍ ചാറ്റര്‍ബോക്സ്......സബ്-ഡബ്ലിക്കില്‍ സബ്-എംസ്‌ലെന്‍സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.

രചയിതാവു്: Resemble AI · അനുമതി: MIT

ശ്രമിക്ക്.

Dia 2Dia 2 Standard

ഒന്നിലധികം സ്ട്രീമിങ് വര്‍ത്തമാനം നല്‍കുന്ന ടീവികള്‍ മള്‍ട്ടി-എഞ്ചര്‍ ഡയലോഗും പനിഗ്നിക് ക്കളും ചേര്‍ക്കുന്നു.

രചയിതാവു്: Nari Labs · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

VoxCPMVoxCPM Standard

ടൈക്കന്‍സര്‍ - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.

രചയിതാവു്: OpenBMB · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

TADATADA Standard

എല്‍.എം ടി.ടി.എക്കാള്‍ വേഗത്തില്‍.. എല്‍.എം ടി.ടി.

രചയിതാവു്: Hume AI · അനുമതി: MIT

ശ്രമിക്ക്.

VibeVoiceVibeVoice Standard

മൈക്രോസോഫ്റ്റ് മോഡ്യൂളുകള്‍ പോര്‍ട്ട്സ്, ഓഡിയോ പുസ്തകങ്ങള്‍ പോലുള്ള അനവധി ശബ്ദങ്ങള്‍ക്കുള്ള മോഡല്‍.

രചയിതാവു്: Microsoft · അനുമതി: MIT

ശ്രമിക്ക്.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

രചയിതാവു്: Alibaba (FunAudioLLM) · അനുമതി: Apache 2.0

ശ്രമിക്ക്.

ChatterboxChatterbox Premium

റെസിമുള്‍ 'എ'യില്‍ നിന്നും വികാരാധീനമായ ശബ്ദങ്ങള്‍.

നിലവാരം:

ശ്രമിക്ക്.

Tortoise TTSTortoise TTS Premium

മള്‍ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില്‍ നിന്നും ഗുണമേന്മയില്‍ ഓട്ടോഗ്രസ്ട്രേഷന്‍ കെട്ടിടത്തില്‍ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.

നിലവാരം:

ശ്രമിക്ക്.

StyleTTS 2StyleTTS 2 Premium

ശൈലിയില്‍ ഡിഫ്യൂഷന്‍, അഡ്വാര്‍സല്‍ പരിശീലനം.

നിലവാരം:

ശ്രമിക്ക്.

OpenVoiceOpenVoice Premium

ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്‍റെയും നിയന്ത്രണത്തിലുള്ള ഇന്‍റർനാഷണൽ ശബ്ദം.

നിലവാരം:

ശ്രമിക്ക്.

Sesame CSMSesame CSM Premium

സംഭാഷണത്തിന്‍റെ മാതൃഭാഷ ഉചിതമായ സമയവും വികാരങ്ങളും ഉപയോഗിച്ചുകൊണ്ട് സ്വാഭാവികമായ സംഭാഷണം നടത്തുന്നു.

നിലവാരം:

ശ്രമിക്ക്.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

നിലവാരം:

ശ്രമിക്ക്.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

നിലവാരം:

ശ്രമിക്ക്.

CosyVoice 2CosyVoice 2

അലിബാബയുടെ "ടിടിഎസ്" (TTS) യുടെ സ്പർശിപ്പിക്കാന്‍ പറ്റുന്ന പ്രസന്നമായ പ്രകൃതിയും, വളരെ അടുത്തുള്ള ഭൂമദ്ധ്യരേഖയും.

ഭാഷകള്‍: en, zh, ja, ko, fr, de, it, es

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

GLM-TTSGLM-TTS

തുറന്ന ടിടിഎസ് മോഡലുകള്‍ക്കു് താഴെയുള്ള അക്ഷരങ്ങളുടെ പിശകിന്റെ നിരക്കില്‍ പ്രാവര്‍ത്തികമാക്കുന്നു.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

IndexTTS-2IndexTTS-2

നല്ല മാനസിക നിയന്ത്രണവും ഉയര്‍ന്ന ശബ്ദവും ഉള്ള സീറോ-സ്റ്റോട്ട് ടി.എസ്.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Spark TTSSpark TTS

ശബ്ദമിശ്രണോപാധി

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

GPT-SoVITSGPT-SoVITS

വെറും 5 സെക്കന്‍റില്‍ നിന്ന് ശബ്ദം കേള്‍ക്കുന്ന ക്ളൈന്‍ ടി. ടി. ടി.

ഭാഷകള്‍: en, zh, ja, ko

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

ChatterboxChatterbox

റെസിമുള്‍ 'എ'യില്‍ നിന്നും വികാരാധീനമായ ശബ്ദങ്ങള്‍.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Tortoise TTSTortoise TTS

മള്‍ട്ടി- മെസ്സേജ് ടെക്സ്റ്റില്‍ നിന്നും ഗുണമേന്മയില്‍ ഓട്ടോഗ്രസ്ട്രേഷന്‍ കെട്ടിടത്തില്‍ ശ്രദ്ധ കേന്ദ്രീകരിച്ചു.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

OpenVoiceOpenVoice

ഹീമോഗ്ലോബിൻ സ്റ്റൈലുകളുടെയും വികാരങ്ങളുടെയും ഉച്ചാരണത്തിന്‍റെയും നിയന്ത്രണത്തിലുള്ള ഇന്‍റർനാഷണൽ ശബ്ദം.

ഭാഷകള്‍: en, zh, ja, ko, fr, de, es, it

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Qwen3 TTSQwen3 TTS

അലിബായുടെ ബഹുഭാഷാ TTS, ശബ്ദവും ശബ്ദവും ടെക്സ്റ്റില്‍ നിന്നും ശബ്ദ ഘടനയും കൊണ്ട്.

ഭാഷകള്‍: en, zh, ja, ko, de, fr, ru, pt, es, it

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Chatterbox TurboChatterbox Turbo

വേഗത്തില്‍ ചാറ്റര്‍ബോക്സ്......സബ്-ഡബ്ലിക്കില്‍ സബ്-എംസ്‌ലെന്‍സിയും പനിഗ്ലിനറിക് റിബ്യൂട്ടറിസും.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

VoxCPMVoxCPM

ടൈക്കന്‍സര്‍ - ഫ്രീ ടിടിഎസ് ഓഡിയോ ഉണ്ടാക്കുന്നത് 44.1khz ഓഡിയോയുമായി സാങ്കേതിക-പത്രികയുമായി.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

OuteTTSOuteTTS

എംഎം- അടിസ്ഥാനമാക്കിയുള്ള ടിടിഎസ് സിപിയു, ജിപിയു അല്ലെങ്കില്‍ Lamap.cp. andjs.

ഭാഷകള്‍: en

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

Pocket TTSPocket TTS

ഒരു സാമ്പിളില്‍ നിന്നും ശബ്ദമുപയോഗിച്ച് 100എം പരാമീറ്റര്‍ മോഡല്‍.

ഭാഷകള്‍: en, fr

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ഭാഷകള്‍: en, zh, ja, ko, de, es, fr, it, ru

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ഭാഷകള്‍: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ഭാഷകള്‍: en, zh

ശബ്ദം ക്ലോണ്‍ ചെയ്യുക

രചയിതാവു് - ആദ്യത്തെ API

ഓപ്പണ്‍AI- യോജിപ്പുള്ള റെസ്റ്റ് API. ഒരു അവസാന പോയിന്റ്, 22+ മോഡലുകള്‍. ശരിയായ സമയ പ്രയോഗങ്ങള്‍ക്കുള്ള പിന്തുണ സ്റ്റ്രീമിങ്ങുന്നു.

  • ഓപ്പണ്‍ഐ- ആക്സസിബിളിറ്റി ഫോര്‍മാറ്റ്
  • റിയല്‍ ടൈം ആപ്സിനായി ടിടിഎസ് സ്ട്രീം ചെയ്യുന്നുName
  • വലിയ ജോലികള്‍ക്കുള്ള തുക പ്രവര്‍ത്തനം
  • വെബ് ടാബ് അറിയിപ്പുകള്‍
API ഡോക്സ് കാണുക
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ലളിതമായ, സുതാര്യമായ പ്രകമ്പനംName

സ്വതന്ത്രമായി തുടങ്ങുക. നിങ്ങള്‍ വളരുമ്പോള്‍ വലിപ്പം കൂട്ടുക.

ഫ്രീ

$0

15 ക്രെഡിറ്റ്സ്

  • Kokoro, Piper, VITS, MeloTTS
  • 500 അക്ഷരങ്ങളുടെ പരിധി
  • 3 ജിന്‍/ മണിക്കൂര്‍ (അക്കൌണ്ട് ഇല്ല)
ഫ്രീ ആയി ഒപ്പ് വയ്ക്കുക

ആരംഭകന്‍

$9/മോ

500 ക്രെഡിറ്റ്സ്/മാസം

  • എല്ലാ 22+ മോഡലുകള്‍
  • ഒരു തലമുറയില്‍ 1,00,000 അക്ഷരങ്ങള്‍
  • ശബ്ദ ക്ളൈനിങ്ങ്
തുടങ്ങുക
ഏറ്റവും പ്രസിദ്ധം

പ്രൊഫൈല്‍

$29/മോ

2,000 ക്രെഡിറ്റ്സ്/ മാസം

  • എല്ലാം തുടങ്ങുമ്പോള്‍.
  • API പ്രവേശിക്കുന്നു
  • മുന്‍ഗണനാ പ്രക്രിയ
പ്രൊഫൈല്‍ ചെയ്യുക

വ്യാപാരം

$99/മോ

10,000 ക്രെഡിറ്റ്സ്/മാസം

  • പ്രൊവറില്‍ എല്ലാം
  • മൊത്തം API
  • മുന്‍ഗണനാ റേറ്റര്‍
വ്യാപാരം നേടുക

ക്യാരക്ടര്‍ പാക്ക് ഉള്‍പ്പെടുന്ന എല്ലാ പദ്ധതികളും കാണുക →

പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ

TTS.ai ആണ് ഏറ്റവും വിപുലമായ AI ശബ്ദം പ്ലാറ്റ്ഫോം, 22+ പദാവലികള്‍ നല്‍കല്‍, ക്ളോണ്‍, ശബ്ദ-text-text, ശബ്ദ-text, ഓഡിയോ ഉപകരണങ്ങള്‍ നല്‍കുന്നത്. എല്ലാ മോഡലുകള്‍ക്കും ഒരു വില്‍പ്പനക്കാരനും ഇല്ല.

അതെ, TTS.ai കൊക്കോറോ, പിപ്പര്‍, വി.റ്റി. വ്ലോടിസ്, മെലോട്ടിസ് മോഡലുകളുമായി ഫ്രീ ടെക്സ്റ്റുകള്‍ നല്‍കുന്നു. ഒരു അക്കൗണ്ടും ആവശ്യമില്ല. 15,000 അക്ഷരങ്ങള്‍ എടുക്കാനും എല്ലാ മോഡലുകളും ലഭ്യമാകുന്നു. പായ്ഡ് പദ്ധതികള്‍ $9/ മാസത്തില്‍ ആരംഭിക്കുന്നു.

വേഗതയ്ക്കു്, കോക്കോറോ അല്ലെങ്കില്‍ പിപ്പര്‍ ഉപയോഗിക്കുക. ഗുണമേന്മയ്ക്കായി, കോസിവ്യൂസ് 2 അല്ലെങ്കില്‍ സ്റ്റൈല്‍ടിടിറ്റ് 2 അല്ലെങ്കില്‍ സ്റ്റൈല്‍ടൈല്‍ ടിടിഎസ് 2 ഉപയോഗിക്കുക. ശബ്ദകഥയോടൈല്‍ ബോക്സ് അല്ലെങ്കില്‍ GPTI- സോവിറ്റുകള്‍ ഉപയോഗിക്കുക. ഡയലോഗിനായി DiTS ഉപയോഗിക്കുക. അതേ പദാവലിയില്‍ പല മോഡലുകള്‍ താരതമ്യപ്പെടുത്താന്‍ ശ്രമിക്കുക.

ടിടിഎസ്, സ്ടിടിടി, ശബ്ദം, ഓഡിയോ ഉപകരണങ്ങള്‍ എന്നിവയ്ക്കായി ഓപ്പണ്‍ ആക്റ്റീവ് ആപിപിയും. പ്രോ ($29/ മോ), എസ്‌പി ($99/ മൊ) പദ്ധതികളും ലഭ്യമാണു്. ts/api- ല്‍ രേഖകള്‍ കാണുക.

ശബ്ദത്തിന്‍റെ ഗുണമേന്മ സാങ്കേതികമായി മാറുന്നു. കോസിവ്യൂയിസ് 2, സ്റ്റൈല്‍ടിറ്റ്സ് 2, ചാറ്റ്ടര്‍ബോക്സ് എന്നീ പ്രിമിയം മോഡലുകള്‍ സ്വാഭാവികമായ മനുഷ്യത്വ-സമ്പത്തും വികാരങ്ങളുമായി സവിശേഷമായ സംസാരം സൃഷ്ട്ടിക്കുന്നു. കോക്കോറോ പോലുള്ള സ്വതന്ത്ര മോഡലുകള്‍ കൂടുതല്‍ ഉപയോഗമുള്ള കേസുകള്‍ക്ക് നല്ല ഗുണമേന്മ നല്‍കുന്നു.

TTS.ai ഭാഷകള്‍ അതിന്‍റെ മാതൃകാ ഗ്രന്ഥശാലയില്‍ ലഭ്യമാണ്. പക്ഷേ, ഇംഗ്ലീഷ് ഏറ്റവും വീതിയുള്ള മോഡല്‍ പിന്തുണയുണ്ട്. ചൈനീസ്, ജപ്പാന്‍, ജപ്പാന്‍, കൊറിയന്‍ തുടങ്ങിയ മോഡല്‍മാര്‍ ചൈനീസ്, ചൈനീസ്, കൊറിയന്‍ തുടങ്ങിയ മോഡലുകള്‍; മെലോട്ടിക്സ് ഇംഗ്ലീഷ്, സ്പാനീഷ്, ചൈനീസ്, ചൈനീസ്, ചൈനീസ്, ചൈനീസ്, ചൈനീസ്, കൊറിയന്‍ എന്നിവയെ പിന്തുണയ്ക്കുന്നു.

അതെ. നമ്മുടെ സമീകരിച്ച GPU സര്‍വറുകളില്‍ എല്ലാ പ്രവര്‍ത്തനങ്ങളും സംഭവിക്കുന്നു. ഞങ്ങള്‍ നിങ്ങളുടെ ടെക്സ്റ്റ് ഇന്‍പുട്ടോ അല്ലെങ്കില്‍ നിര്‍മ്മിച്ച ഓഡിയോ അല്ല. ക്ളൈന്‍റെ ശബ്ദ സാമ്പിളുകള്‍ ഇപ്പോഴുള്ള സെഷന് വേണ്ടി മാത്രമാണു് ഉപയോഗിക്കുന്നത്, അവ നിലനിര്‍ത്തപ്പെടുന്നത്. ഞങ്ങള്‍ക്ക് മൂന്നാമത്തെ കക്ഷികളുമായി നിങ്ങളുടെ വിവരങ്ങള്‍ പങ്കിടുകയോ, മോഡല്‍ ചെയ്യാതിരിക്കുകയോ ചെയ്യാതിരിക്കുകയോ ചെയ്യാം.

അതെ, TTS.aiല്‍ നിര്‍മ്മിച്ച എല്ലാ ഓഡിയോയും, യൂട്ടോപ്പ് വീഡിയോകള്‍, ഓഡിയോബുക്കുകള്‍, പരസ്യങ്ങള്‍, പരസ്യങ്ങള്‍, ഉല്‍പ്പന്നങ്ങള്‍ എന്നിവയും ഉള്‍പ്പെടേണ്ടതാണ്. നമ്മുടെ മോഡലുകള്‍ നവീകരണ ലൈസന്‍സിന്റെ (MIT, അഛായ 2.0) കീഴിലാണ്.

WAV ശൈലിയില്‍ ഏറ്റവും കൂടിയ ഗുണമേന്മയായി TTS.ai ഓഡിയോ ഉല്‍പാദിപ്പിക്കുന്നു. നിങ്ങള്‍ക്കു് MP3, FLAC, OG, MGA എന്നിവയ്ക്കു് നമ്മുടെ സ്വതന്ത്ര ഓഡിയോ മാറ്റുന്നതിനുള്ള ഉപകരണം ഉപയോഗിക്കാം. API നിങ്ങളുടെ ഇഷ്ടപ്പെട്ട ഔട്ട്പുട്ടിന്റെ ഫോര്‍മാറ്റ് നേരിട്ട് നല്‍കുന്നു.

ക്ലോണ്‍ ചെയ്യണമെന്നുള്ള ശബ്ദത്തിന്റെ ചെറിയൊരു സാമ്പിള്‍ (5 സെക്കന്‍ഡുകള്‍ക്കകം), ആ ശബ്ദത്തില്‍ സംസാരം ഉല്‍പാദിപ്പിക്കാന്‍ ഏതു് പദാവലിയും ടൈപ്പ് ചെയ്യുക. ചാറ്റര്‍ബോക്സ്, GPT- സോVIS, കോസിവ്യൂ2 വോയിസ് എന്നിവപോലുള്ള മോഡലുകള്‍ ശബ്ദസഞ്ചയത്തെ പിന്തുണയ്ക്കുന്നു. മോണ്‍ലിറ്റഡ് ശബ്ദം കേള്‍ക്കുന്നു, ശൈലിയും സംസാരരീതിയും.

ഫ്രീ മോഡലുകള്‍ (Kocoro, Pyper, VITS, MloTTS, വിലയിടിപ്പില്ലാത്ത അക്ഷരങ്ങള്‍) ബാര്‍ക്ക്/ 1K ഇൻപുട്ടില്‍ (2000 അക്ഷരങ്ങള്‍) ബാര്‍ക്കി/ CSovice 2, F5TTS, DATS എന്നിവ ഉള്‍പ്പെടുത്തുന്ന സ്റ്റാന്‍ഡേര്‍ഡ് മോഡല്‍ മോഡലുകള്‍ (4,000 അക്ഷരങ്ങള്‍) ഓപ്പറേറ്റ്‌Vos, ShiftTTS, ShiftTTS, TostS2 എന്നിവ ഉള്‍പ്പെടുന്നു.

ഉവ്വ്. ശബ്ദത്തിനുള്ള വലിയ വോള്യം മാറ്റുന്നതിനുള്ള എപിഐ സജ്ജീകരണത്തെ API പിന്തുണക്കുന്നു. ജോലിയുപയോഗിച്ചു് അനവധി ആവശ്യങ്ങള്‍ സമര്‍പ്പിക്കുക. PROM പദ്ധതികള്‍ അനുയോജ്യമാക്കുന്നു. PROM ($99/mm) വേഗത്തിലുള്ള സജ്ജീകരണത്തിനുള്ള മുന്‍ഗണന ഉള്‍‌ക്കൊള്ളുന്നു. ശബ്ദപുസ്തകത്തിന്റെ ഉല്‍പാദനത്തിനും, റെക്കോര്‍ഡ്- വലിയ ശബ്ദ പദ്ധതികള്‍ക്കും അനുയോജകമായി അനുയോജ്യിക്കുന്നു.
4.1/5 (21)

നിങ്ങളുടെ പ്രതികരണം പ്രശ്‌നങ്ങൾ പരിഹരിക്കാൻ നമ്മെ സഹായിക്കുന്നു.

ഇന്ന് AI ശബ്ദം ഉപയോഗിക്കാന്‍ തുടങ്ങുക

സ്രഷ്ടാക്കളും ഡയറകടറും ബിസിനസ്സുകളും ചേർന്ന് TTS.ai