Ազատ AI Տեքստից խոսքName

20+ բաց կոդով մոդելներ, 107+ ձայներ, 32+ լեզուներ։ Հաշիվ չի պահանջվում։

1K+
ստեղծողներ
2K+
սերնդեր
20+
AI մոդելներ
107+
ձայներ
0/500 այբուբեն Ազատ
Ինչպես TTS.ai-ն, պատմեք ձեր ընկերներին։

Ամեն ինչ, ինչ անհրաժեշտ է ձայնային ինտելեկտի համար

30+ գործիքներ բաց կոդով AI մոդելներով

20+ AI ձայնային մոդելներ

Առանց կոդավորման TTS մոդելների ամենախոշոր հավաքածուն մեկ պլատֆորմում

KokoroKokoro Free

Kokoro- ն 82 միլիոն պարամետր ունեցող տեքստը խոսքի վերածող մոդել է, որն իր քաշային դասակարգից շատ ավելին է տալիս։ Չնայած փոքր չափին, այն արտադրում է բնական և արտահայտիչ խոսք։ Kokoro- ն աջակցում է բազմաթիվ լեզուների, այդ թվում անգլերենի, ճապոներենի, չինարենի և կորեերենի՝ արտահայտիչ ձայների բազմազանությամբ։ Այն աշխատում է անհավատալի արագ՝ ձայնը ստեղծելով գրեթե 100 անգամ ավելի արագ, քան իրական ժամանակում GPU- ում։

Լավագույնը ՝ Ավելի բարձր որակի TTS նվազագույն ուշացումով, հոսքային ծրագրեր

Ստուգել անվճար

PiperPiper Free

Piper- ը Rhasspy- ի կողմից մշակված թեթև տեքստը խոսքի վերածող համակարգ է, որը օգտագործում է VITS և larynx ճարտարապետությունները։ Այն ամբողջությամբ աշխատում է CPU- ի վրա, ինչը այն դարձնում է եզրային սարքերի, տնային ավտոմատացման և օֆլայն TTS պահանջող ծրագրերի համար իդեալական։ 30+ լեզուներով ավելի քան 100 ձայներով Piper- ը ապահովում է բնական հնչողությամբ խոսք իրական ժամանակում նույնիսկ Raspberry Pi 4- ի վրա։

Լավագույնը ՝ Ժամանակակից նախադիտումներ, հասանելիություն և ներկառուցված ծրագրեր

Ստուգել անվճար

VITSVITS Free

VITS- ը (Variation Inference with adversarial learning for end- to- end Text- to- Speech) զուգահեռ end- to- end TTS մեթոդ է, որը ստեղծում է ավելի բնական հնչողությամբ ձայն, քան ներկայիս երկու փուլային մոդելները։ Այն ընդունում է variation inference- ը, որը լրացվում է նորմալացնող հոսքերով և հակառակորդական ուսուցման գործընթացով, ինչը նշանակալիորեն բարելավում է բնականությունը։

Լավագույնը ՝ Ընդհանուր նպատակի տեքստը խոսքի վերածող համակարգ՝ բնական պրոսոդիայով

Ստուգել անվճար

MeloTTSMeloTTS Free

MyShell.ai-ի MeloTTS-ը բազմլեզու TTS գրադարան է, որը աջակցում է անգլերեն (ամերիկյան, բրիտանական, հնդկական, ավստրալիական), իսպաներեն, ֆրանսերեն, չինարեն, Ճապոներեն և կորեերեն։ Այն շատ արագ է, տեքստը վերամշակում է մոտավորապես իրական ժամանակի արագությամբ միայն պրոցեսորի վրա։ MeloTTS-ը նախագծված է արտադրական օգտագործման համար և աջակցում է ինչպես պրոցեսորի, այնպես էլ GPU-ի եզրակացություններին։

Լավագույնը ՝ Աշխատանքային ծրագրեր, որոնք պահանջում են արագ, բազմալեզու TTS

Ստուգել անվճար

BarkBark Standard

Տրանսֆորմերների վրա հիմնված տեքստը ձայնային մոդել, որը ստեղծում է իրական խոսակցություն, երաժշտություն և ձայնային էֆեկտներ։

Հեղինակ Suno · Լիցենզիա MIT

Փորձեք :

Bark SmallBark Small Standard

Bark-ի ավելի թեթև տարբերակը՝ ավելի արագ եզրակացություններով և հիշողության ավելի քիչ օգտագործմամբ։

Հեղինակ Suno · Լիցենզիա MIT

Փորձեք :

CosyVoice 2CosyVoice 2 Standard

Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency (անգլերեն)։ Արխիվացված օրիգինալից-ից 2011-09-28-ին։ Վերցված է 2011-09-28  (անգլ.)

Հեղինակ Alibaba (Tongyi Lab) · Լիցենզիա Apache 2.0

Փորձեք :

Dia TTSDia TTS Standard

Multi-speaker dialog generation model, որը ստեղծում է խոսողների միջև բնական զրույցներ։

Հեղինակ Nari Labs · Լիցենզիա Apache 2.0

Փորձեք :

Parler TTSParler TTS Standard

Օգտագործեք բնական լեզուն և Parler-ը կստեղծի ձեզ համար հարմար ձայն.

Հեղինակ Hugging Face · Լիցենզիա Apache 2.0

Փորձեք :

GLM-TTSGLM-TTS Standard

Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։

Հեղինակ Zhipu AI · Լիցենզիա GLM-4 License

Փորձեք :

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։

Հեղինակ Index Team · Լիցենզիա Bilibili Model License

Փորձեք :

Spark TTSSpark TTS Standard

TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։

Հեղինակ SparkAudio · Լիցենզիա CC BY-NC-SA 4.0

Փորձեք :

GPT-SoVITSGPT-SoVITS Standard

Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։

Հեղինակ RVC-Boss · Լիցենզիա MIT

Փորձեք :

OrpheusOrpheus Standard

100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ

Հեղինակ Canopy Labs · Լիցենզիա Llama 3.2 Community

Փորձեք :

Qwen3 TTSQwen3 TTS Standard

Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.

Հեղինակ Alibaba (Qwen) · Լիցենզիա Apache 2.0

Փորձեք :

ChatterboxChatterbox Premium

Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։

Ապրանքանիշ:

Փորձեք :

Tortoise TTSTortoise TTS Premium

Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։

Ապրանքանիշ:

Փորձեք :

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversary training (անգլերեն)  Վիքիպահեստում

Ապրանքանիշ:

Փորձեք :

OpenVoiceOpenVoice Premium

Ձայնի ակնթարթային կլոնավորում՝ ոճի, զգացմունքների և շեշտադրման հստակ վերահսկողությամբ։

Ապրանքանիշ:

Փորձեք :

Sesame CSMSesame CSM Premium

Ընդհանուր լեզուաբանություն, լեզուաբանության բնագավառ, որը ուսումնասիրում է լեզուների կառուցվածքը և լեզուների միջև կապերը։

Ապրանքանիշ:

Փորձեք :

CosyVoice 2CosyVoice 2

Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency (անգլերեն)։ Արխիվացված օրիգինալից-ից 2011-09-28-ին։ Վերցված է 2011-09-28  (անգլ.)

Լեզուներ en, zh, ja, ko, fr, de, it, es

Ձայնի հնարք

GLM-TTSGLM-TTS

Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։

Լեզուներ en, zh

Ձայնի հնարք

IndexTTS-2IndexTTS-2

Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։

Լեզուներ en, zh

Ձայնի հնարք

Spark TTSSpark TTS

TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։

Լեզուներ en, zh

Ձայնի հնարք

GPT-SoVITSGPT-SoVITS

Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։

Լեզուներ en, zh, ja, ko

Ձայնի հնարք

ChatterboxChatterbox

Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։

Լեզուներ en

Ձայնի հնարք

Tortoise TTSTortoise TTS

Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։

Լեզուներ en

Ձայնի հնարք

OpenVoiceOpenVoice

Ձայնի ակնթարթային կլոնավորում՝ ոճի, զգացմունքների և շեշտադրման հստակ վերահսկողությամբ։

Լեզուներ en, zh, ja, ko, fr, de, es, it

Ձայնի հնարք

Qwen3 TTSQwen3 TTS

Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.

Լեզուներ en, zh, ja, ko, de, fr, ru, pt, es, it

Ձայնի հնարք

Առաջին ծրագրավորողի API

OpenAI-ի հետ համընկնող REST API. Մի վերջնական կետ, 22+ մոդելներ. Ցանցային աջակցություն իրական ժամանակի ծրագրերի համար։

  • OpenAI- համապատասխան ձևաչափ
  • TTS-ի հոսք իրական ժամանակի ծրագրերի համար
  • Փաթեթային աշխատանք մեծ աշխատանքների համար
  • Webhook հաղորդագրություններ
Դիտել API փաստաթղթերը
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Պարզ, թափանցիկ գնահատում

Սկսեք անվճար։ Մեծացեք, երբ աճում եք։

Ազատ

$0

15 կետեր

  • Kokoro, Piper, VITS, MeloTTS
  • 500 սանտիմետր սահմանափակում
  • 3 գեներ/ժամ (համար չկա)
Անվճար գրանցում

Ընդունել

$9/րոպե

500 կետ / ամիս

  • Բոլոր 22+ մոդելները
  • 100,000 այբուբեն յուրաքանչյուր սերունդում
  • Ձայնի կլոնավորում
Սկսել
Ամենատարածված

Օգտագործող

$29/րոպե

2,000,000 կերպար/ամսվա

  • Ամեն ինչ սկզբնականում
  • API մուտք
  • Առավելություն
Գրանցվել

Բիզնես

$99/րոպե

10,000 վարկ / ամիս

  • Ամեն ինչ Pro- ում
  • Բազմաթիվ API
  • Առավելություն
Գրանցվել

Դիտել բոլոր պլանները, ներառյալ հերոսների փաթեթները →

Հաճախ տրվող հարցեր

TTS.ai-ն ամենախոշոր AI ձայնային պլատֆորմն է, որն առաջարկում է 22+ տեքստը խոսքի վերածելու մոդելներ, ձայնի կլոնավորում, խոսքը տեքստի վերածելու և ձայնային գործիքներ։ Բոլոր մոդելները բաց կոդով են և ոչ մի արտադրողի կողմից չեն սահմանափակվում։

Այո! TTS.ai-ը առաջարկում է անվճար տեքստը խոսքի վերածելու ծառայություն Kokoro, Piper, VITS և MeloTTS մոդելների հետ։ Հաշիվ պահանջվում չէ։ Գրանցվեք 15,000 անվճար հերոսների և բոլոր մոդելների համար։ Պետք է վճարեք $9/ամսվա համար։

արագության համար օգտագործեք Kokoro կամ Piper։ որակի համար փորձեք CosyVoice 2 կամ StyleTTS 2։ ձայնի կլոնավորման համար օգտագործեք Chatterbox կամ GPT-SoVITS։ երկխոսության համար օգտագործեք Dia TTS։ համեմատելու համար փորձեք միևնույն տեքստի վրա մի քանի մոդելներ։

Այո։ OpenAI-ի հետ համընկնող REST API TTS, STT, ձայնի կլոնավորման և ձայնային գործիքների համար։ Գտնվում է Pro ($29/month) և Enterprise ($99/month) պլաններում։ Դիտեք փաստաթղթերը tts.ai/api/ կայքում։

Խոսքի որակը կախված է մոդելից։ Premium մոդելները, ինչպիսիք են CosyVoice 2, StyleTTS 2 և Chatterbox- ը, արտադրում են մոտավորապես մարդկային որակի խոսք՝ բնական ինտոնացիայով և զգացմունքներով։ Kokoro- ի նման անվճար մոդելները առաջարկում են գերազանց որակ օգտագործման շատ դեպքերում։

TTS.ai-ն իր մոդելային գրադարանում աջակցում է ավելի քան 30 լեզուների։ Անգլերենը ունի ամենախոշոր մոդելային աջակցությունը, սակայն CosyVoice 2-ի նման մոդելները ներառում են Չիներեն, Ճապոներեն և Կորեերեն; GPT-SoVITS-ը աջակցում է Չիներեն, Ճապոներեն, Կորեերեն և Անգլերեն; իսկ MeloTTS-ը աջակցում է Չիներեն, Իսպաներեն, Ֆրանսերեն, Չիներեն, Ճապոներեն և Կորեերեն։

Այո։ Բոլոր գործողությունները կատարվում են մեր հատուկ GPU սերվերներում։ Մենք չենք պահպանում ձեր տեքստի մուտքագրումը կամ ձայնի գեներացիան։ Կլոնավորման համար ներբեռնված ձայնային նմուշները օգտագործվում են միայն ընթացիկ սեանսի համար և չեն պահպանվում։ Մենք երբեք չենք փոխանակում ձեր տվյալները երրորդ անձանց հետ կամ օգտագործում դրանք մոդելները սովորեցնելու համար։

Այո։ TTS.ai-ի վրա ստեղծված բոլոր ձայնագրությունները կարող եք օգտագործել առևտրային նպատակներով, ներառյալ YouTube-ի տեսանյութեր, podcast-եր, ձայնագրված գրքեր, ծրագրեր, գովազդներ և այլն։ Մեր մոդելները բաց կոդով են և թույլատրելի լիցենզիաներով (MIT, Apache 2.0)։ Ոչ մի արտոնագիր կամ մատնանշում չի պահանջվում։

TTS.ai-ն լռելյայն ձայնագրում է WAV ձևաչափով՝ առավելագույն որակի ապահովման համար։ Դուք կարող եք փոխակերպել MP3, FLAC, OGG կամ M4A ձևաչափերով՝ օգտագործելով մեր անվճար ձայնագրման գործիքը։ API-ն աջակցում է ձեր նախընտրած ելքի ձևաչափի ուղղակի նշումը խնդրանքում։

Տեղադրեք ձայնի կարճ ձայնային նմուշ (մինչև 5 վայրկյան), որը ցանկանում եք կլոնավորել, այնուհետև գրեք ցանկացած տեքստը այդ ձայնով խոսելու համար։ Chatterbox, GPT-SoVITS և CosyVoice 2-ի նման մոդելները աջակցում են ձայնի կլոնավորումը։ Կլոնավորված ձայնը գրանցում է տոնը, արտահայտությունը և խոսելու ոճը։

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) չեն պահանջում հաշիվ և արժեն 0 կերպար։ Ստացված մոդելները (2000 կերպար/1K մուտք) ներառում են Bark, CosyVoice 2, F5-TTS և Dia։ Պրեմիում մոդելները (4000 կերպար/1K մուտք) ներառում են OpenVoice, Chatterbox, StyleTTS 2 և Tortoise։ Պետք է վճարել մոդելների համար, որոնք սովորաբար առաջարկում են ավելի բարձր որակ, ավելի շատ ձայներ և հավելյալ հատկություններ, ինչպիսիք են ձայնի կլոնինգը։

Այո։ API-ն աջակցում է մեծ քանակությամբ տեքստը խոսքի վերածելու համար խմբային գործընթացը։ Տեղադրեք մի քանի խնդրանքներ և ստացեք արդյունքները ասինխրոնորեն՝ օգտագործելով աշխատանքի UUID-ները։ Enterprise պլանները ($99/month) ներառում են նախապատվության երթևեկության մուտք արագացված խմբային գործընթացների համար։ Հատկապես հարմար է ձայնագրված գրքերի արտադրության, դասընթացների բովանդակության և մեծածավալ ձայնագրման նախագծերի համար։
4.0/5 (8)

Սկսեք օգտագործել AI ձայնը այսօր

Միացեք ստեղծողներին, ծրագրավորողներին և բիզնեսին TTS.ai-ը օգտագործելով