Ազատ AI Տեքստից խոսքName
20+ բաց կոդով մոդելներ, 107+ ձայներ, 32+ լեզուներ։ Հաշիվ չի պահանջվում։
Ամեն ինչ, ինչ անհրաժեշտ է ձայնային ինտելեկտի համար
30+ գործիքներ բաց կոդով AI մոդելներով
20+ AI ձայնային մոդելներ
Առանց կոդավորման TTS մոդելների ամենախոշոր հավաքածուն մեկ պլատֆորմում
Kokoro Free
Kokoro- ն 82 միլիոն պարամետր ունեցող տեքստը խոսքի վերածող մոդել է, որն իր քաշային դասակարգից շատ ավելին է տալիս։ Չնայած փոքր չափին, այն արտադրում է բնական և արտահայտիչ խոսք։ Kokoro- ն աջակցում է բազմաթիվ լեզուների, այդ թվում անգլերենի, ճապոներենի, չինարենի և կորեերենի՝ արտահայտիչ ձայների բազմազանությամբ։ Այն աշխատում է անհավատալի արագ՝ ձայնը ստեղծելով գրեթե 100 անգամ ավելի արագ, քան իրական ժամանակում GPU- ում։
Լավագույնը ՝ Ավելի բարձր որակի TTS նվազագույն ուշացումով, հոսքային ծրագրեր
Ստուգել անվճար
Piper Free
Piper- ը Rhasspy- ի կողմից մշակված թեթև տեքստը խոսքի վերածող համակարգ է, որը օգտագործում է VITS և larynx ճարտարապետությունները։ Այն ամբողջությամբ աշխատում է CPU- ի վրա, ինչը այն դարձնում է եզրային սարքերի, տնային ավտոմատացման և օֆլայն TTS պահանջող ծրագրերի համար իդեալական։ 30+ լեզուներով ավելի քան 100 ձայներով Piper- ը ապահովում է բնական հնչողությամբ խոսք իրական ժամանակում նույնիսկ Raspberry Pi 4- ի վրա։
Լավագույնը ՝ Ժամանակակից նախադիտումներ, հասանելիություն և ներկառուցված ծրագրեր
Ստուգել անվճար
VITS Free
VITS- ը (Variation Inference with adversarial learning for end- to- end Text- to- Speech) զուգահեռ end- to- end TTS մեթոդ է, որը ստեղծում է ավելի բնական հնչողությամբ ձայն, քան ներկայիս երկու փուլային մոդելները։ Այն ընդունում է variation inference- ը, որը լրացվում է նորմալացնող հոսքերով և հակառակորդական ուսուցման գործընթացով, ինչը նշանակալիորեն բարելավում է բնականությունը։
Լավագույնը ՝ Ընդհանուր նպատակի տեքստը խոսքի վերածող համակարգ՝ բնական պրոսոդիայով
Ստուգել անվճար
MeloTTS Free
MyShell.ai-ի MeloTTS-ը բազմլեզու TTS գրադարան է, որը աջակցում է անգլերեն (ամերիկյան, բրիտանական, հնդկական, ավստրալիական), իսպաներեն, ֆրանսերեն, չինարեն, Ճապոներեն և կորեերեն։ Այն շատ արագ է, տեքստը վերամշակում է մոտավորապես իրական ժամանակի արագությամբ միայն պրոցեսորի վրա։ MeloTTS-ը նախագծված է արտադրական օգտագործման համար և աջակցում է ինչպես պրոցեսորի, այնպես էլ GPU-ի եզրակացություններին։
Լավագույնը ՝ Աշխատանքային ծրագրեր, որոնք պահանջում են արագ, բազմալեզու TTS
Ստուգել անվճար
Bark Standard
Տրանսֆորմերների վրա հիմնված տեքստը ձայնային մոդել, որը ստեղծում է իրական խոսակցություն, երաժշտություն և ձայնային էֆեկտներ։
Հեղինակ Suno · Լիցենզիա MIT
Փորձեք :
Bark Small Standard
Bark-ի ավելի թեթև տարբերակը՝ ավելի արագ եզրակացություններով և հիշողության ավելի քիչ օգտագործմամբ։
Հեղինակ Suno · Լիցենզիա MIT
Փորձեք :
CosyVoice 2 Standard
Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency (անգլերեն)։ Արխիվացված օրիգինալից-ից 2011-09-28-ին։ Վերցված է 2011-09-28 (անգլ.)
Հեղինակ Alibaba (Tongyi Lab) · Լիցենզիա Apache 2.0
Փորձեք :
Dia TTS Standard
Multi-speaker dialog generation model, որը ստեղծում է խոսողների միջև բնական զրույցներ։
Հեղինակ Nari Labs · Լիցենզիա Apache 2.0
Փորձեք :
Parler TTS Standard
Օգտագործեք բնական լեզուն և Parler-ը կստեղծի ձեզ համար հարմար ձայն.
Հեղինակ Hugging Face · Լիցենզիա Apache 2.0
Փորձեք :
GLM-TTS Standard
Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։
Հեղինակ Zhipu AI · Լիցենզիա GLM-4 License
Փորձեք :
IndexTTS-2 Standard
Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։
Հեղինակ Index Team · Լիցենզիա Bilibili Model License
Փորձեք :
Spark TTS Standard
TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։
Հեղինակ SparkAudio · Լիցենզիա CC BY-NC-SA 4.0
Փորձեք :
GPT-SoVITS Standard
Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։
Հեղինակ RVC-Boss · Լիցենզիա MIT
Փորձեք :
Orpheus Standard
100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ
Հեղինակ Canopy Labs · Լիցենզիա Llama 3.2 Community
Փորձեք :
Qwen3 TTS Standard
Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.
Հեղինակ Alibaba (Qwen) · Լիցենզիա Apache 2.0
Փորձեք :
CosyVoice 2
Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency (անգլերեն)։ Արխիվացված օրիգինալից-ից 2011-09-28-ին։ Վերցված է 2011-09-28 (անգլ.)
Լեզուներ en, zh, ja, ko, fr, de, it, es
Ձայնի հնարք
GLM-TTS
Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։
Լեզուներ en, zh
Ձայնի հնարք
IndexTTS-2
Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։
Լեզուներ en, zh
Ձայնի հնարք
Spark TTS
TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։
Լեզուներ en, zh
Ձայնի հնարք
GPT-SoVITS
Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։
Լեզուներ en, zh, ja, ko
Ձայնի հնարք
Chatterbox
Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։
Լեզուներ en
Ձայնի հնարք
Tortoise TTS
Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։
Լեզուներ en
Ձայնի հնարք
OpenVoice
Ձայնի ակնթարթային կլոնավորում՝ ոճի, զգացմունքների և շեշտադրման հստակ վերահսկողությամբ։
Լեզուներ en, zh, ja, ko, fr, de, es, it
Ձայնի հնարք
Qwen3 TTS
Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.
Լեզուներ en, zh, ja, ko, de, fr, ru, pt, es, it
Ձայնի հնարքԱռաջին ծրագրավորողի API
OpenAI-ի հետ համընկնող REST API. Մի վերջնական կետ, 22+ մոդելներ. Ցանցային աջակցություն իրական ժամանակի ծրագրերի համար։
- OpenAI- համապատասխան ձևաչափ
- TTS-ի հոսք իրական ժամանակի ծրագրերի համար
- Փաթեթային աշխատանք մեծ աշխատանքների համար
- Webhook հաղորդագրություններ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Պարզ, թափանցիկ գնահատում
Սկսեք անվճար։ Մեծացեք, երբ աճում եք։
Ազատ
15 կետեր
- Kokoro, Piper, VITS, MeloTTS
- 500 սանտիմետր սահմանափակում
- 3 գեներ/ժամ (համար չկա)
Ընդունել
500 կետ / ամիս
- Բոլոր 22+ մոդելները
- 100,000 այբուբեն յուրաքանչյուր սերունդում
- Ձայնի կլոնավորում
Օգտագործող
2,000,000 կերպար/ամսվա
- Ամեն ինչ սկզբնականում
- API մուտք
- Առավելություն
Հաճախ տրվող հարցեր
Սկսեք օգտագործել AI ձայնը այսօր
Միացեք ստեղծողներին, ծրագրավորողներին և բիզնեսին TTS.ai-ը օգտագործելով