Ազատ AI Տեքստից խոսքName
31+ բաց կոդով մոդելներ, 231+ ձայներ, 34+ լեզուներ։ Հաշիվ չի պահանջվում։
Ամեն ինչ, ինչ անհրաժեշտ է ձայնային ինտելեկտի համար
30+ գործիքներ բաց կոդով AI մոդելներով
31+ AI ձայնային մոդելներ
Առանց կոդավորման TTS մոդելների ամենախոշոր հավաքածուն մեկ պլատֆորմում
Kokoro Free
Kokoro- ն 82 միլիոն պարամետրով տեքստը խոսքի վերածող մոդել է, որը իր քաշային դասակարգից շատ ավելին է տալիս։ Անկախ իր փոքր չափից, այն արտադրում է բնական և արտահայտիչ խոսք։ Kokoro- ն աջակցում է մի շարք լեզուների, այդ թվում անգլերեն, յապոնական, չինարեն և կորեերեն, տարբեր արտահայտիչ ձայներով։ Այն աշխատում է անհավատալի արագ՝ ձայնը գեներացնելով գրեթե 100 անգամ արագ, քան իրական ժամանակում GPU- ում։
Լավագույնը ՝ Հնարավոր է նվազագույն ուշացումով, բարձր որակով TTS, ալիքային ծրագրեր
Ստուգել անվճար
Piper Free
Piper- ը Rhasspy- ի կողմից մշակված թեթև տեքստը խոսքի վերածող համակարգ է, որը օգտագործում է VITS և larynx ճարտարապետությունները։ Այն ամբողջությամբ աշխատում է CPU- ի վրա, ինչը այն դարձնում է եզրային սարքերի, տնային ավտոմատացման և օֆլայն TTS պահանջող ծրագրերի համար իդեալական։ 30+ լեզուներով ավելի քան 100 ձայներով Piper- ը ապահովում է բնական հնչողությամբ խոսք իրական ժամանակում նույնիսկ Raspberry Pi 4- ի վրա։
Լավագույնը ՝ Ժամանակակից նախադիտումներ, հասանելիություն և ներկառուցված ծրագրեր
Ստուգել անվճար
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) զուգահեռ end-to-end TTS մեթոդ է, որը գեներացնում է ավելի բնական հնչողության ձայն, քան ներկայիս երկու փուլային մոդելները։ Այն ընդունում է variation inference- ն ավելացված նորմալացման հոսքերով և հակառակորդի պատրաստման գործընթացով, հասնելով բնականության կարևոր բարելավման։
Լավագույնը ՝ Համատեղելի է բնական ձայնագրության հետ
Ստուգել անվճար
MeloTTS Free
MeloTTS- ը MyShell. ai- ի կողմից ստեղծված բազմլեզու TTS գրադարան է, որը աջակցում է անգլերեն (ամերիկյան, բրիտանական, հնդկական, ավստրալիական), իսպաներեն, ֆրանսերեն, չինարեն, Ճապոներեն և կորեերեն։ Այն շատ արագ է, տեքստը վերամշակում է մոտավորապես իրական ժամանակի արագությամբ միայն պրոցեսորի վրա։ MeloTTS- ը նախագծված է արտադրական օգտագործման համար և աջակցում է ինչպես պրոցեսորի, այնպես էլ GPU- ի եզրակացություններին։
Լավագույնը ՝ Աշխատանքային ծրագրեր, որոնք պահանջում են արագ, բազմալեզու TTS
Ստուգել անվճար
OuteTTS Free
OuteTTS-ը լեզվի մեծ մոդելները լրացնում է տեքստից խոսքի ունակություններով՝ պահպանելով սկզբնական ճարտարապետությունը։ Այն աջակցում է մի քանի backend-եր, այդ թվում llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, և նույնիսկ բրաուզերի եզրակացությունը Transformers.js-ի միջոցով։ Այն ձայնի 0-shot կլոինգի հնարավորություն է տալիս JSON-ի պես պահպանված խոսնակի պրոֆիլների միջոցով։
Լավագույնը ՝ Edge-ի տեղադրում, բրաուզերի վրա հիմնված TTS, ցածր ռեսուրսներով միջավայրեր
Ստուգել անվճար
Pocket TTS Free
Pocket TTS- ը Kyutai- ի (Moshi- ի ստեղծողներ) կողմից ստեղծված կոմպակտ 100Մ պարամետրերով տեքստը խոսքի վերածելու մոդել է, որը իր քաշից շատ ավելին է տալիս։ Այն արդյունավետորեն աշխատում է պրոցեսորի վրա, աջակցում է ձայնի 0- ական կլոնավորմանը մեկ ձայնային նմուշից և արտադրում է բնական հնչողությամբ խոսք։ Փոքր մոդելի չափսը այն դարձնում է իդեալական եզրային տեղակայման և ցածր ռեսուրսներով միջավայրերի համար։
Լավագույնը ՝ Հեշտ տեղադրում, միայն պրոցեսորային միջավայրեր, արագ ձայնային կլոունավորում
Ստուգել անվճար
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Լավագույնը ՝ Fast lightweight TTS, edge deployment, low-latency applications
Ստուգել անվճար
Bark Standard
Տրանսֆորմերների վրա հիմնված տեքստը ձայնային մոդել, որը ստեղծում է իրական խոսակցություն, երաժշտություն և ձայնային էֆեկտներ։
Հեղինակ Suno · Լիցենզիա MIT
Փորձեք :
Bark Small Standard
Bark-ի ավելի թեթև տարբերակը՝ ավելի արագ եզրակացություններով և հիշողության ավելի քիչ օգտագործմամբ։
Հեղինակ Suno · Լիցենզիա MIT
Փորձեք :
CosyVoice 2 Standard
Alibaba-ի արագացվող TTS-ը, որը բնական է և մոտ է 0-ին.
Հեղինակ Alibaba (Tongyi Lab) · Լիցենզիա Apache 2.0
Փորձեք :
Dia TTS Standard
Բազմախոսնակ դիալոգների ստեղծման մոդել, որը ստեղծում է խոսողների միջև բնական զրույցներ։
Հեղինակ Nari Labs · Լիցենզիա Apache 2.0
Փորձեք :
Parler TTS Standard
Օգտագործեք բնական լեզուն և Parler-ը կստեղծի ձեզ համար հարմար ձայն.
Հեղինակ Hugging Face · Լիցենզիա Apache 2.0
Փորձեք :
GLM-TTS Standard
Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։
Հեղինակ Zhipu AI · Լիցենզիա GLM-4 License
Փորձեք :
IndexTTS-2 Standard
Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։
Հեղինակ Index Team · Լիցենզիա Bilibili Model License
Փորձեք :
Spark TTS Standard
TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։
Հեղինակ SparkAudio · Լիցենզիա CC BY-NC-SA 4.0
Փորձեք :
GPT-SoVITS Standard
Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։
Հեղինակ RVC-Boss · Լիցենզիա MIT
Փորձեք :
Orpheus Standard
100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ
Հեղինակ Canopy Labs · Լիցենզիա Llama 3.2 Community
Փորձեք :
Qwen3 TTS Standard
Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.
Հեղինակ Alibaba (Qwen) · Լիցենզիա Apache 2.0
Փորձեք :
Chatterbox Turbo Standard
200 մլրդ դրամ, 200 մլն դոլար և 200 մլն եվրո, 200 մլն դոլար և 200 մլն դոլար՝ 2009 թվականի տվյալներով։
Հեղինակ Resemble AI · Լիցենզիա MIT
Փորձեք :
Dia 2 Standard
Առաջին հոսքի զրույցների TTS-ը բազմահոսքային երկխոսությամբ և զուգահեռ լեզվաբանական ազդանշաններով.
Հեղինակ Nari Labs · Լիցենզիա Apache 2.0
Փորձեք :
VoxCPM Standard
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency Վիքիպահեստում
Հեղինակ OpenBMB · Լիցենզիա Apache 2.0
Փորձեք :
TADA Standard
5000-ական թվականների սկզբին, որի ժամանակ տիեզերքը 5000 անգամ ավելի մեծ էր, քան այսօր։ 5000 թ.
Հեղինակ Hume AI · Լիցենզիա MIT
Փորձեք :
VibeVoice Standard
Microsoft-ի մոդելը երկար ձևի բազմահնչյուն բովանդակության համար, ինչպիսիք են podcast-ները և ձայնագրված գրքերը։
Հեղինակ Microsoft · Լիցենզիա MIT
Փորձեք :
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Հեղինակ Alibaba (FunAudioLLM) · Լիցենզիա Apache 2.0
Փորձեք :
CosyVoice 2
Alibaba-ի արագացվող TTS-ը, որը բնական է և մոտ է 0-ին.
Լեզուներ en, zh, ja, ko, fr, de, it, es
Ձայնի հնարք
GLM-TTS
Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։
Լեզուներ en, zh
Ձայնի հնարք
IndexTTS-2
Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։
Լեզուներ en, zh
Ձայնի հնարք
Spark TTS
TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։
Լեզուներ en, zh
Ձայնի հնարք
GPT-SoVITS
Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։
Լեզուներ en, zh, ja, ko
Ձայնի հնարք
Chatterbox
Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։
Լեզուներ en
Ձայնի հնարք
Tortoise TTS
Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։
Լեզուներ en
Ձայնի հնարք
OpenVoice
Ձայնի արագ կլոունավորում՝ կերպարի, զգացմունքների և ակցենտերի մանրամասն կառավարմամբ։
Լեզուներ en, zh, ja, ko, fr, de, es, it
Ձայնի հնարք
Qwen3 TTS
Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.
Լեզուներ en, zh, ja, ko, de, fr, ru, pt, es, it
Ձայնի հնարք
Chatterbox Turbo
200 մլրդ դրամ, 200 մլն դոլար և 200 մլն եվրո, 200 մլն դոլար և 200 մլն դոլար՝ 2009 թվականի տվյալներով։
Լեզուներ en
Ձայնի հնարք
VoxCPM
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency Վիքիպահեստում
Լեզուներ en, zh
Ձայնի հնարք
OuteTTS
LLM-ի վրա հիմնված TTS, որը աշխատում է CPU, GPU կամ բրաուզերի միջոցով llama.cpp և Transformers.js.
Լեզուներ en
Ձայնի հնարք
Pocket TTS
Kyutai-ի հեշտ 100M պարամետրերի մոդել, ձայնի կլոինգի համար մեկ նմուշից
Լեզուներ en, fr
Ձայնի հնարք
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Լեզուներ en, zh, ja, ko, de, es, fr, it, ru
Ձայնի հնարք
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Լեզուներ en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Ձայնի հնարք
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Լեզուներ en, zh
Ձայնի հնարքԱռաջին ծրագրավորողի API
OpenAI-ի հետ համընկնող REST API. Մի վերջնական կետ, 22+ մոդելներ. Ցանցային աջակցություն իրական ժամանակի ծրագրերի համար։
- OpenAI- համապատասխան ձևաչափ
- TTS-ի հոսք իրական ժամանակի ծրագրերի համար
- Փաթեթային աշխատանք մեծ աշխատանքների համար
- Webhook հաղորդագրություններ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Պարզ, թափանցիկ գնահատում
Սկսեք անվճար։ Մեծացեք, երբ աճում եք։
Ազատ
15 կետեր
- Kokoro, Piper, VITS, MeloTTS
- 500 սանտիմետր սահմանափակում
- 3 գեներ/ժամ (համար չկա)
Ընդունել
500 կետ / ամիս
- Բոլոր 22+ մոդելները
- 100,000 այբուբեն յուրաքանչյուր սերունդում
- Ձայնի կլոնավորում
Օգտագործող
2,000,000 կերպար/ամսվա
- Ամեն ինչ սկզբնականում
- API մուտք
- Առավելություն
Հաճախ տրվող հարցեր
Ի՞նչ կարող ենք բարելավել: Ձեր կարծիքը օգնում է մեզ լուծել խնդիրները:
Սկսեք օգտագործել AI ձայնը այսօր
Միացեք ստեղծողներին, ծրագրավորողներին և բիզնեսին TTS.ai-ը օգտագործելով