ఫ్రీ ఎI మాట్లాడటానికి వచనం
33+ ఓపెన్ సోర్సు మోడల్, 273+ ధ్వనులు, 33+ భాషలు. ఏ ఖాతా అవసరములేదు.
స్వరం AI
30+ పనిముట్లను ఓపెన్- నెట్ ఎఐ మోడల్తో చేతనంచేసినవిName
33+ II వాయిస్ మోడల్లు
ఒక ప్లాట్ఫాం లో ఓపెన్ సోర్సు-రూట్ TTS మోడల్ యొక్క అత్యంత అధిక సేకరణ సేకరణName
Kokoro ఖాళీ
కొకోరో ఒక 82 మిలియన్ డిగ్రీ- స్కేప్ మోడల్, అది బరువున్న తరగతి కంటే బాగా గుద్దుతుంది. అది ఎంతో పరిమాణంలో ఉన్నప్పటికీ, అది ఎంతో సహజ మరియు వ్యాసమునే తయారుచేస్తుంది. కోకోరో ఇంగ్లీషు, జపనీస్, చైనీస్, మరియు కొరియాలతోపాటు అనేక భాషలకు మద్దతిస్తుంది. అవాస్తనంగా GPU-நேரం కంటే వేగంగా నడుపుతుంది. ఇది GPU-நேரం కంటే వేగంతో నడుపుతుంది.
మీకు ఉత్తమ: కనీసజాబిత, థంబ్నెయిల్స్ తో అధిక TTSName
ఉచిత ప్రయత్నించండి
Piper ఖాళీ
Piపర్ అనేది VITS మరియు Lycsnx భవనాలను రూపొందించిన చలనచిత్రమైన టెక్స్ట్ ఇంజన్. ఇది పూర్తిగా CPUపై నడుపుతుంది, toft పరికరాలు, హోమ్ మెటామానిక్ మరియు అనువర్తనములు అవసరం. 100 కంటే ఎక్కువ సౌలభ్యంతో, రాస్పెర్-తెరింగ్ టైపుల న నిజమైన థింగ్స్ను 4 కంటె ఎక్కువ కంటె ఎక్కువ థింగ్స్పానింగ్ - థంపై కూడా థింగ్ను అందించు
మీకు ఉత్తమ: త్వరిత ముందస్తు వీక్షణం, యాక్సెస్బిలిటి, మరియు ఎంబెడెడ్ అనువర్తనములు
ఉచిత ప్రయత్నించండి
VITS ఖాళీ
VITS (విస్పష్టంగా చివరి నుండి ముగింపు వచనం మాట్లాడటానికి) సమాంతరంగా ముగింపు TTS వుద్ఘాతం. అది ప్రస్తుత రెండు వేదికల కంటే ఎక్కువ సహజమైన ఆడియో మోడల్ ఉత్పత్తి చేస్తుంది. మరియు సాధారణ సమ్మేళనాలు మరియు సమ్మేళన తదుపరి శిక్షణను పెంచుతుంది, సహజంగా ప్రగతి సాధిస్తుంది.
మీకు ఉత్తమ: సహజ ప్రొజెక్ట్ తో సాదారణ- ప్రొఫైల్ పాఠము- లొ
ఉచిత ప్రయత్నించండి
MeloTTS ఖాళీ
MEloTTS ను ఉపయోగించుట కోసం మరియు GPUferce కోసం రూపొందించబడింది.
మీకు ఉత్తమ: అనువర్తనములకు వేగవంతమైన, బహుభాషా TTS అవసరం
ఉచిత ప్రయత్నించండి
Kani TTS 2 ఖాళీ
Cany-TS-2 అనేది అత్యల్ప- కొడ్- కొడ్- కొడ్ స్పీకర్స్ల కొరకు అత్యద్భుతమైన 400 LFM2 మాడ్రిడ్ను NVIIIIA NOCKCONతో నిర్మించిన ప్రదర్శన. అది కేవలం 3GRAMAM లో నడుస్తున్న మరియు 1802 (RT2) సెకన్లు (RTF2) లో భాషను తెలుస్తోంది. ప్రస్తుతం విడుదల చేస్తున్న ఇంగ్లీషు- బర్నిక్- బర్నిక్- 2- 2- ట్రెడ్ - లు (RTTD- QED- లు) ను తీసివేయడం లేదు మరియు స్పాట్బాక్స్ కోసం వుడ్బాల్బాక్స్ కోసం వుడ్బాక్స్ను ఉపయోగిస్తారు.
మీకు ఉత్తమ: తక్కువ VRAM హార్డ్వేర్ న ఫాస్ట్ వుపదర్శనములు
ఉచిత ప్రయత్నించండి
OuteTTS ఖాళీ
Lama.c/ GPUU (CPU), HCOP ముఖచిత్ర మార్పులను (ఎక్లాస్), ExLOV2, Volm. ofs. Jjs. స్ప్రెటర్ ప్రొఫక్టర్స్ ద్వారా దాచబడిన సౌలభ్యతల ద్వారా సౌలభ్యాలను మరియు స్ప్రెషర్ ప్రొఫైల్లను కూడా ఇది మద్దతిస్తుంది.
మీకు ఉత్తమ: ఎగ్జిక్యూటిటివ్, బ్రౌజర్ ఆధారిత TTS, తక్కువ- ట్రాసెస్
ఉచిత ప్రయత్నించండి
Pocket TTS ఖాళీ
Kauuti (mishi యొక్క రూపకల్పనలు) పోకట్TS అనేది కౌంట్బాక్స్ (మోషీ యొక్క రూపకల్పనలు) కౌంటీడి- టెస్టింగ్- లోకి లొంగుతుంది. అది సిపిఎంవై- గోప్యతా న సామర్ధ్యాన్ని బలపరుస్తుంది, ఒకే ఆడియో మాదిరినుండి సున్నిత- స్ట్రింగ్ను మ్యాచ్పాండర్ - సౌలభ్యతకు తో చేస్తుంది. చిన్న మోడల్ పరిమాణం ఇది థింగ్కు మరియు తక్కువ షెడ్యూల్స్మెంట్లకు అనుకూలమైనది చేస్తుంది.
మీకు ఉత్తమ: లైట్ స్థూలకాయత, CPU- మాత్రమే వాతావరణాలు, శీఘ్ర వాయిస్క్రటిక్
ఉచిత ప్రయత్నించండి
Kitten TTS ఖాళీ
KetenML ద్వారా కిట్న్ టిటిస్ అపరిమిత టెక్స్ట్- నిర్మితమైన టెక్స్ట్ మోడల్. vels (25- 80 రాగిల్ నడుము) తో, GPU నిర్మితం నృత్యం గల సిపిఎంకు (CPU), GPU వర్తైన వేగం రాచని వేగంలేని వేగం, మరియు సంఖ్యలకు, మరియు డిజైన్పలభద్రతలను, మరియు నిర్మిత-నిర్మితమైన అనువర్తనములకు.
మీకు ఉత్తమ: వేగవంతమైన TTS, అంచు దృవీకరణ, తక్కువ- ప్రమేయమైన అనువర్తనములు
ఉచిత ప్రయత్నించండి
Ming-Omni TTS ఖాళీ
Mings- ston- 5B - 0. 5B అనేది Bacti- bymoth- password- pask- passwder తో నిర్మించబడిన కాంపాక్ట్ Withing Wither- by- back- baseracker తో వుద్దేశించిన కాంపాక్ట్ Wither- baserack- bases (ఆడియో- Pask- pask- pather) తో. డిజైన్ అవుట్పేజీ (ఆడి- by- by- by- basesog), 3+ రెఫైల్మెంట్ల నుంచి 0- betware- basesmand J. J. JSON- stongnicksets (cling), J. stongmandmoc. J. stordmank- by)
మీకు ఉత్తమ: హై - డైలాగ్ రూపకల్పన, భావోద్వేగ- స్మారక పదకోశం పని, చైనీస్ ఆడియోపుస్తక సారము
ఉచిత ప్రయత్నించండి
MOSS-TTS Nano ఖాళీ
MOSS-NO-NO-100 MOS యొక్క ఒప్పందం MOS-parent మాంత్రికులు, తక్షణం-trans సమైక్య భవనాన్ని భాగస్వామ్యం. వర్తకులు, ~80x యొక్క శిఖరాగ్ర నాణ్యత యొక్క 8B మాదిరి యొక్క శిఖరాఖండం మరియు గణితాత్మకమైన VRAM ను అది ఉచిత మరియు అధిక ప్రయొపత్తులకు తగినది చేస్తుంది.
మీకు ఉత్తమ: ఉచిత TTS, అధిక- ప్రొఫైల్ ఉద్భవం, తక్కువ- ప్రొఫైల్ వుపయోగం
ఉచిత ప్రయత్నించండి
Bark ప్రామాణిక
వాస్తవ భాష, సంగీతం, సౌండ్ ప్రభావాలు ఉత్పన్నం చేసే వచన ఆధారిత టెక్స్చర్- ఎడిటివో మోడల్.
డెవలపర్: Suno · లైసెన్స్: MIT
ప్రయత్నించు
Bark Small ప్రామాణిక
వేగవంతమైన మరియు తక్కువ మెమరీ వుపయోగంతో బార్కె యొక్క లైటర్ వర్షన్.
డెవలపర్: Suno · లైసెన్స్: MIT
ప్రయత్నించు
CosyVoice 2 ప్రామాణిక
Alibba యొక్క scapting TTS సంపత్తి మానవ సహజ మరియు సమీపమైన మరియు దగ్గరగా-తొలెంట్సీ.
డెవలపర్: Alibaba (Tongyi Lab) · లైసెన్స్: Apache 2.0
ప్రయత్నించు
Dia TTS ప్రామాణిక
చాలా- సంప్రదింపు డైలాగ్ వుద్భవం ప్రసంగీకులు మధ్య సహజ సంభాషణలను ఉత్పత్తి ఇది. Name
డెవలపర్: Nari Labs · లైసెన్స్: Apache 2.0
ప్రయత్నించు
Parler TTS ప్రామాణిక
మీరు ప్రకృతి భాషలో కావాలనుకుంటున్న స్వరం మరియు పార్పర్ సరిపోలిన సంభాషణను ఉత్పన్నం చేయండి.
డెవలపర్: Hugging Face · లైసెన్స్: Apache 2.0
ప్రయత్నించు
IndexTTS-2 ప్రామాణిక
జరిమానా-shoo-హోట్ TS మంచి-తెరపిన భావోద్వేగ నియంత్రణ మరియు అధిక స్పృహ.
డెవలపర్: Index Team · లైసెన్స్: Bilibili Model License
ప్రయత్నించు
Spark TTS ప్రామాణిక
స్పీకర్ డిజైన్లు, స్పెషల్లు
డెవలపర్: SparkAudio · లైసెన్స్: CC BY-NC-SA 4.0
ప్రయత్నించు
GPT-SoVITS ప్రామాణిక
కేవలం 5 సెకన్ల నుండి ఏ స్వరం ప్రసారం క్లోనింగ్ టీట్స్ కొద్దిగా.
డెవలపర్: RVC-Boss · లైసెన్స్: MIT
ప్రయత్నించు
Orpheus ప్రామాణిక
మానవ స్థాయి భావోద్వేగ TTS మోడల్ 100K ప్రసంగపు దత్తాంశం న శిక్షణ.
డెవలపర్: Canopy Labs · లైసెన్స్: Llama 3.2 Community
ప్రయత్నించు
Qwen3 TTS ప్రామాణిక
మెటాడేటా నుండి స్వరం మరియు స్వర రూపం తో అలైబా యొక్క బహుభాషా TTS
డెవలపర్: Alibaba (Qwen) · లైసెన్స్: Apache 2.0
ప్రయత్నించు
VieNeu-TTS-v2 ప్రామాణిక
వియత్నామీస్ + ఇంగ్లీష్ కోడ్-విడ్ TTS ప్రస్థుత ధ్వనులు మరియు సున్నితమైన ధ్వనులు. CPU- మాత్రమే, అవసరం లేదు.
డెవలపర్: Phạm Nguyễn Ngọc Bảo · లైసెన్స్: Apache 2.0
ప్రయత్నించు
Chatterbox Turbo ప్రామాణిక
. ఉప-20stency మరియు పారామిలిటి రికార్డ్ టాగ్స్. నవ్వులు, దగ్గులు మరియు ఎక్కువ.
డెవలపర్: Resemble AI · లైసెన్స్: MIT
ప్రయత్నించు
VoxCPM ప్రామాణిక
TTS ప్రసార పదకోశం తో 44.1kHz ఆడియోను ఉత్పత్తి చేసే TTS.
డెవలపర్: OpenBMB · లైసెన్స్: Apache 2.0
ప్రయత్నించు
VibeVoice ప్రామాణిక
పోడ్కాస్ట్ మరియు ఆడియోపుస్తకాల వంటి బహుళ- స్పీకర్ సారముల కొరకు మైక్రోసాఫ్ట్ మోడ్.
డెవలపర్: Microsoft · లైసెన్స్: MIT
ప్రయత్నించు
CosyVoice3 ప్రామాణిక
తదుపరి-సమయ TTS BITS, భావోద్వేగ నియంత్రణ, మరియు సున్నా-Status వాయిస్.
డెవలపర్: Alibaba (FunAudioLLM) · లైసెన్స్: Apache 2.0
ప్రయత్నించు
NAMAA Saudi TTS ప్రామాణిక
మొదటి ఓపెన్ సౌదీ-అరేబిక్ TTS. చాటర్బాక్స్-సమస్య స్వరం క్లోనింగ్ తో సౌత్ సౌత్ మాండ.
డెవలపర్: NAMAA Space · లైసెన్స్: MIT
ప్రయత్నించు
Darwin TTS ప్రామాణిక
క్రాస్-మోదల్ క్వాన్ క్విన్-TTS variant FFN పందెం పందెం సమ్మిళిత గ్రీక్ పదకోశం కోసం Gean3-7B భాష మోడల్ నుండి మిషన్.
డెవలపర్: FINAL-Bench · లైసెన్స్: Apache 2.0
ప్రయత్నించు
MOSS-TTSD ప్రామాణిక
బహుళ- స్పీకర్ డైలాగ్ మోడల్ మోడల్ — 5 ప్రసంగీకులు వరకు మరియు 60 నిమిషాల కాంట్రాస్ట్ ఆడియోతో పోడ్కాస్ట్- శైలి సంభాషణలను సృష్టిస్తుంది.
డెవలపర్: OpenMOSS · లైసెన్స్: Apache 2.0
ప్రయత్నించు
CosyVoice 2
Alibba యొక్క scapting TTS సంపత్తి మానవ సహజ మరియు సమీపమైన మరియు దగ్గరగా-తొలెంట్సీ.
భాషలు: en, zh, ja, ko, fr, de, it, es
విలోమ ధ్వని
IndexTTS-2
జరిమానా-shoo-హోట్ TS మంచి-తెరపిన భావోద్వేగ నియంత్రణ మరియు అధిక స్పృహ.
భాషలు: en, zh
విలోమ ధ్వని
GPT-SoVITS
కేవలం 5 సెకన్ల నుండి ఏ స్వరం ప్రసారం క్లోనింగ్ టీట్స్ కొద్దిగా.
భాషలు: en, zh, ja, ko
విలోమ ధ్వని
Tortoise TTS
Multi-trus-tale-tap-Sublication భవనం తో నాణ్యతపై దృష్టి కేంద్రీకరించబడింది.
భాషలు: en
విలోమ ధ్వని
OpenVoice
కన్పించే స్వరం, శైలి, భావోద్వేగం, ఉచ్చారణలపై గీరింగ్ను నిటారుగా ఉంచుతుంది.
భాషలు: en, zh, ja, ko, fr, es
విలోమ ధ్వని
VieNeu-TTS-v2
వియత్నామీస్ + ఇంగ్లీష్ కోడ్-విడ్ TTS ప్రస్థుత ధ్వనులు మరియు సున్నితమైన ధ్వనులు. CPU- మాత్రమే, అవసరం లేదు.
భాషలు: vi, en
విలోమ ధ్వని
Chatterbox Turbo
. ఉప-20stency మరియు పారామిలిటి రికార్డ్ టాగ్స్. నవ్వులు, దగ్గులు మరియు ఎక్కువ.
భాషలు: en
విలోమ ధ్వని
OuteTTS
LLM- ఆధారిత TTS, CPU, లేదా Lamap.cpp మరియు బదలాయింపుల ద్వారా నడుస్తున్నది.
భాషలు: en
విలోమ ధ్వని
Pocket TTS
ఒక మాదిరి నుండి స్వరం క్యుటుయి ద్వారా లైట్ 100M పారామితి మోడల్.
భాషలు: en, fr
విలోమ ధ్వని
CosyVoice3
తదుపరి-సమయ TTS BITS, భావోద్వేగ నియంత్రణ, మరియు సున్నా-Status వాయిస్.
భాషలు: en, zh, ja, ko, de, es, fr, it, ru
విలోమ ధ్వని
NAMAA Saudi TTS
మొదటి ఓపెన్ సౌదీ-అరేబిక్ TTS. చాటర్బాక్స్-సమస్య స్వరం క్లోనింగ్ తో సౌత్ సౌత్ మాండ.
భాషలు: ar
విలోమ ధ్వని
Darwin TTS
క్రాస్-మోదల్ క్వాన్ క్విన్-TTS variant FFN పందెం పందెం సమ్మిళిత గ్రీక్ పదకోశం కోసం Gean3-7B భాష మోడల్ నుండి మిషన్.
భాషలు: en, ko, ja, zh
విలోమ ధ్వని
MOSS-TTSD
బహుళ- స్పీకర్ డైలాగ్ మోడల్ మోడల్ — 5 ప్రసంగీకులు వరకు మరియు 60 నిమిషాల కాంట్రాస్ట్ ఆడియోతో పోడ్కాస్ట్- శైలి సంభాషణలను సృష్టిస్తుంది.
భాషలు: en, zh
విలోమ ధ్వని
Ming-Omni TTS
Compact 0. 5B memne-madeatial Stencils నుండి brasero-fidedefault 44.1kz మరియు సున్నా- show- shoult strings లాంచర్.
భాషలు: en, zh
విలోమ ధ్వని
MOSS-TTS Nano
చిన్న 100 MOS-TTS variance — అదే భవనం, 80x చిన్న, ఉచిత-titeryyyy.
భాషలు: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
విలోమ ధ్వనిడెవలపర్- మొదటి API
ఓపెన్ API- సారూప్యమైన RAPI. ఒక ముగింపు పాయింట్, 22+ మోడల్. నిజమైన-நேர అనువర్తనాలకు మద్దతు స్ట్రీమింగ్ చేస్తోంది.
- ఓపెన్ AI- సారూప్యమైన ఫార్మాట్
- థంబ్నెయిల్స్ కొరకు TTS స్ట్రీమ్బాక్స్Name
- పెద్ద పనిల కోసం పనిచెయ్యి ప్రక్రియ
- వెబ్ టాగ్ నోటిఫికేషన్లు
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
సరళమైన, పారదృశ్యమైన ప్రసారం
పెరిగే కొద్దీ స్కేల్ మొదలుపెట్టు.
ఖాళీ
15,000 అక్షరములు + 5,000/ రోజు
- 7 కోకోరోతో సహా ఉచిత మోడల్లు
- 5,000 అంగుళాలు తరతరము
- API యాక్సెస్ చేర్చబడింది
ప్రారంభించు
500 రేట్లు/ నెల
- అన్ని 22+ మొబైల్Comment
- తరంకు 1,00,000 అక్షరములు
- శబ్డం క్లుంకింగ్
పధ్ధతి
2,000 ఘనాలు/ నెలలు
- ప్రారంభించు లో అంతా
- API యాక్సెస్
- అధిక ప్రాక్సీ ప్రాసెస్Comment
తరచూ అడగబడే ప్రశ్నలు
మనమేం మెరుగుపర్చుకోగలం?
నేడు AI స్వరాన్ని ఉపయోగించడం మొదలుపెట్టు
సృష్టికర్తను, అభివృద్ధులను, వ్యాపారాన్ని TTS.ai ఉపయోగించి చేరవేయండి