Ազատ AI Տեքստից խոսքName

31+ բաց կոդով մոդելներ, 231+ ձայներ, 34+ լեզուներ։ Հաշիվ չի պահանջվում։

8K+
ստեղծողներ
32K+
սերնդեր
31+
AI մոդելներ
231+
ձայներ
0/500 այբուբեն · Sign up for 5,000 per generation → Ազատ
Սիրում եք TTS.ai-ն? Պատմեք ձեր ընկերներին։

Ամեն ինչ, ինչ անհրաժեշտ է ձայնային ինտելեկտի համար

30+ գործիքներ բաց կոդով AI մոդելներով

31+ AI ձայնային մոդելներ

Առանց կոդավորման TTS մոդելների ամենախոշոր հավաքածուն մեկ պլատֆորմում

KokoroKokoro Free

Kokoro- ն 82 միլիոն պարամետրով տեքստը խոսքի վերածող մոդել է, որը իր քաշային դասակարգից շատ ավելին է տալիս։ Անկախ իր փոքր չափից, այն արտադրում է բնական և արտահայտիչ խոսք։ Kokoro- ն աջակցում է մի շարք լեզուների, այդ թվում անգլերեն, յապոնական, չինարեն և կորեերեն, տարբեր արտահայտիչ ձայներով։ Այն աշխատում է անհավատալի արագ՝ ձայնը գեներացնելով գրեթե 100 անգամ արագ, քան իրական ժամանակում GPU- ում։

Լավագույնը ՝ Հնարավոր է նվազագույն ուշացումով, բարձր որակով TTS, ալիքային ծրագրեր

Ստուգել անվճար

PiperPiper Free

Piper- ը Rhasspy- ի կողմից մշակված թեթև տեքստը խոսքի վերածող համակարգ է, որը օգտագործում է VITS և larynx ճարտարապետությունները։ Այն ամբողջությամբ աշխատում է CPU- ի վրա, ինչը այն դարձնում է եզրային սարքերի, տնային ավտոմատացման և օֆլայն TTS պահանջող ծրագրերի համար իդեալական։ 30+ լեզուներով ավելի քան 100 ձայներով Piper- ը ապահովում է բնական հնչողությամբ խոսք իրական ժամանակում նույնիսկ Raspberry Pi 4- ի վրա։

Լավագույնը ՝ Ժամանակակից նախադիտումներ, հասանելիություն և ներկառուցված ծրագրեր

Ստուգել անվճար

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) զուգահեռ end-to-end TTS մեթոդ է, որը գեներացնում է ավելի բնական հնչողության ձայն, քան ներկայիս երկու փուլային մոդելները։ Այն ընդունում է variation inference- ն ավելացված նորմալացման հոսքերով և հակառակորդի պատրաստման գործընթացով, հասնելով բնականության կարևոր բարելավման։

Լավագույնը ՝ Համատեղելի է բնական ձայնագրության հետ

Ստուգել անվճար

MeloTTSMeloTTS Free

MeloTTS- ը MyShell. ai- ի կողմից ստեղծված բազմլեզու TTS գրադարան է, որը աջակցում է անգլերեն (ամերիկյան, բրիտանական, հնդկական, ավստրալիական), իսպաներեն, ֆրանսերեն, չինարեն, Ճապոներեն և կորեերեն։ Այն շատ արագ է, տեքստը վերամշակում է մոտավորապես իրական ժամանակի արագությամբ միայն պրոցեսորի վրա։ MeloTTS- ը նախագծված է արտադրական օգտագործման համար և աջակցում է ինչպես պրոցեսորի, այնպես էլ GPU- ի եզրակացություններին։

Լավագույնը ՝ Աշխատանքային ծրագրեր, որոնք պահանջում են արագ, բազմալեզու TTS

Ստուգել անվճար

OuteTTSOuteTTS Free

OuteTTS-ը լեզվի մեծ մոդելները լրացնում է տեքստից խոսքի ունակություններով՝ պահպանելով սկզբնական ճարտարապետությունը։ Այն աջակցում է մի քանի backend-եր, այդ թվում llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, և նույնիսկ բրաուզերի եզրակացությունը Transformers.js-ի միջոցով։ Այն ձայնի 0-shot կլոինգի հնարավորություն է տալիս JSON-ի պես պահպանված խոսնակի պրոֆիլների միջոցով։

Լավագույնը ՝ Edge-ի տեղադրում, բրաուզերի վրա հիմնված TTS, ցածր ռեսուրսներով միջավայրեր

Ստուգել անվճար

Pocket TTSPocket TTS Free

Pocket TTS- ը Kyutai- ի (Moshi- ի ստեղծողներ) կողմից ստեղծված կոմպակտ 100Մ պարամետրերով տեքստը խոսքի վերածելու մոդել է, որը իր քաշից շատ ավելին է տալիս։ Այն արդյունավետորեն աշխատում է պրոցեսորի վրա, աջակցում է ձայնի 0- ական կլոնավորմանը մեկ ձայնային նմուշից և արտադրում է բնական հնչողությամբ խոսք։ Փոքր մոդելի չափսը այն դարձնում է իդեալական եզրային տեղակայման և ցածր ռեսուրսներով միջավայրերի համար։

Լավագույնը ՝ Հեշտ տեղադրում, միայն պրոցեսորային միջավայրեր, արագ ձայնային կլոունավորում

Ստուգել անվճար

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Լավագույնը ՝ Fast lightweight TTS, edge deployment, low-latency applications

Ստուգել անվճար

BarkBark Standard

Տրանսֆորմերների վրա հիմնված տեքստը ձայնային մոդել, որը ստեղծում է իրական խոսակցություն, երաժշտություն և ձայնային էֆեկտներ։

Հեղինակ Suno · Լիցենզիա MIT

Փորձեք :

Bark SmallBark Small Standard

Bark-ի ավելի թեթև տարբերակը՝ ավելի արագ եզրակացություններով և հիշողության ավելի քիչ օգտագործմամբ։

Հեղինակ Suno · Լիցենզիա MIT

Փորձեք :

CosyVoice 2CosyVoice 2 Standard

Alibaba-ի արագացվող TTS-ը, որը բնական է և մոտ է 0-ին.

Հեղինակ Alibaba (Tongyi Lab) · Լիցենզիա Apache 2.0

Փորձեք :

Dia TTSDia TTS Standard

Բազմախոսնակ դիալոգների ստեղծման մոդել, որը ստեղծում է խոսողների միջև բնական զրույցներ։

Հեղինակ Nari Labs · Լիցենզիա Apache 2.0

Փորձեք :

Parler TTSParler TTS Standard

Օգտագործեք բնական լեզուն և Parler-ը կստեղծի ձեզ համար հարմար ձայն.

Հեղինակ Hugging Face · Լիցենզիա Apache 2.0

Փորձեք :

GLM-TTSGLM-TTS Standard

Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։

Հեղինակ Zhipu AI · Լիցենզիա GLM-4 License

Փորձեք :

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։

Հեղինակ Index Team · Լիցենզիա Bilibili Model License

Փորձեք :

Spark TTSSpark TTS Standard

TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։

Հեղինակ SparkAudio · Լիցենզիա CC BY-NC-SA 4.0

Փորձեք :

GPT-SoVITSGPT-SoVITS Standard

Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։

Հեղինակ RVC-Boss · Լիցենզիա MIT

Փորձեք :

OrpheusOrpheus Standard

100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ 100-ամյակի առթիվ

Հեղինակ Canopy Labs · Լիցենզիա Llama 3.2 Community

Փորձեք :

Qwen3 TTSQwen3 TTS Standard

Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.

Հեղինակ Alibaba (Qwen) · Լիցենզիա Apache 2.0

Փորձեք :

Chatterbox TurboChatterbox Turbo Standard

200 մլրդ դրամ, 200 մլն դոլար և 200 մլն եվրո, 200 մլն դոլար և 200 մլն դոլար՝ 2009 թվականի տվյալներով։

Հեղինակ Resemble AI · Լիցենզիա MIT

Փորձեք :

Dia 2Dia 2 Standard

Առաջին հոսքի զրույցների TTS-ը բազմահոսքային երկխոսությամբ և զուգահեռ լեզվաբանական ազդանշաններով.

Հեղինակ Nari Labs · Լիցենզիա Apache 2.0

Փորձեք :

VoxCPMVoxCPM Standard

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency Վիքիպահեստում

Հեղինակ OpenBMB · Լիցենզիա Apache 2.0

Փորձեք :

TADATADA Standard

5000-ական թվականների սկզբին, որի ժամանակ տիեզերքը 5000 անգամ ավելի մեծ էր, քան այսօր։ 5000 թ.

Հեղինակ Hume AI · Լիցենզիա MIT

Փորձեք :

VibeVoiceVibeVoice Standard

Microsoft-ի մոդելը երկար ձևի բազմահնչյուն բովանդակության համար, ինչպիսիք են podcast-ները և ձայնագրված գրքերը։

Հեղինակ Microsoft · Լիցենզիա MIT

Փորձեք :

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Հեղինակ Alibaba (FunAudioLLM) · Լիցենզիա Apache 2.0

Փորձեք :

ChatterboxChatterbox Premium

Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։

Ապրանքանիշ:

Փորձեք :

Tortoise TTSTortoise TTS Premium

Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։

Ապրանքանիշ:

Փորձեք :

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversary training (անգլերեն)  Վիքիպահեստում

Ապրանքանիշ:

Փորձեք :

OpenVoiceOpenVoice Premium

Ձայնի արագ կլոունավորում՝ կերպարի, զգացմունքների և ակցենտերի մանրամասն կառավարմամբ։

Ապրանքանիշ:

Փորձեք :

Sesame CSMSesame CSM Premium

Ընդհանուր լեզուաբանություն, լեզուաբանության բնագավառ, որը ուսումնասիրում է լեզուների կառուցվածքը և լեզուների միջև կապերը։

Ապրանքանիշ:

Փորձեք :

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Ապրանքանիշ:

Փորձեք :

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Ապրանքանիշ:

Փորձեք :

CosyVoice 2CosyVoice 2

Alibaba-ի արագացվող TTS-ը, որը բնական է և մոտ է 0-ին.

Լեզուներ en, zh, ja, ko, fr, de, it, es

Ձայնի հնարք

GLM-TTSGLM-TTS

Առանց սկզբնական կոդերի TTS մոդելների մեջ նվազագույն սխալների ցուցանիշ է ապահովում։

Լեզուներ en, zh

Ձայնի հնարք

IndexTTS-2IndexTTS-2

Zero-shot TTS-ը լավ էմոցիոնալ վերահսկողությամբ և բարձր արտահայտչունակությամբ։

Լեզուներ en, zh

Ձայնի հնարք

Spark TTSSpark TTS

TTS-ի ձայնային կլոնավորում՝ վերահսկելի զգացմունքներով և խոսելու ոճով՝ խնդրանքների միջոցով։

Լեզուներ en, zh

Ձայնի հնարք

GPT-SoVITSGPT-SoVITS

Ձայնի կլոինգի TTS-ը, որը կրկնօրինակում է ցանկացած ձայն ընդամենը 5 վայրկյան տևողությամբ ձայնային տվյալներից։

Լեզուներ en, zh, ja, ko

Ձայնի հնարք

ChatterboxChatterbox

Էմոցիաների վերահսկման համար ձայնի ռեկլոմացման նորագույն տեխնոլոգիա՝ Resemble AI-ից։

Լեզուներ en

Ձայնի հնարք

Tortoise TTSTortoise TTS

Ընդհանուր ձայնային տեքստը խոսքի վերածելու համակարգ, որը կենտրոնացած է որակի վրա և ունի ինքնակրկնվող ճարտարապետություն։

Լեզուներ en

Ձայնի հնարք

OpenVoiceOpenVoice

Ձայնի արագ կլոունավորում՝ կերպարի, զգացմունքների և ակցենտերի մանրամասն կառավարմամբ։

Լեզուներ en, zh, ja, ko, fr, de, es, it

Ձայնի հնարք

Qwen3 TTSQwen3 TTS

Alibaba-ի բազմալեզու TTS-ը ձայնի կլոինգի, նախատեսված ձայների և ձայնային դիզայնի միջոցով տեքստում.

Լեզուներ en, zh, ja, ko, de, fr, ru, pt, es, it

Ձայնի հնարք

Chatterbox TurboChatterbox Turbo

200 մլրդ դրամ, 200 մլն դոլար և 200 մլն եվրո, 200 մլն դոլար և 200 մլն դոլար՝ 2009 թվականի տվյալներով։

Լեզուներ en

Ձայնի հնարք

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency Վիքիպահեստում

Լեզուներ en, zh

Ձայնի հնարք

OuteTTSOuteTTS

LLM-ի վրա հիմնված TTS, որը աշխատում է CPU, GPU կամ բրաուզերի միջոցով llama.cpp և Transformers.js.

Լեզուներ en

Ձայնի հնարք

Pocket TTSPocket TTS

Kyutai-ի հեշտ 100M պարամետրերի մոդել, ձայնի կլոինգի համար մեկ նմուշից

Լեզուներ en, fr

Ձայնի հնարք

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Լեզուներ en, zh, ja, ko, de, es, fr, it, ru

Ձայնի հնարք

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Լեզուներ en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Ձայնի հնարք

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Լեզուներ en, zh

Ձայնի հնարք

Առաջին ծրագրավորողի API

OpenAI-ի հետ համընկնող REST API. Մի վերջնական կետ, 22+ մոդելներ. Ցանցային աջակցություն իրական ժամանակի ծրագրերի համար։

  • OpenAI- համապատասխան ձևաչափ
  • TTS-ի հոսք իրական ժամանակի ծրագրերի համար
  • Փաթեթային աշխատանք մեծ աշխատանքների համար
  • Webhook հաղորդագրություններ
Դիտել API փաստաթղթերը
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Պարզ, թափանցիկ գնահատում

Սկսեք անվճար։ Մեծացեք, երբ աճում եք։

Ազատ

$0

15 կետեր

  • Kokoro, Piper, VITS, MeloTTS
  • 500 սանտիմետր սահմանափակում
  • 3 գեներ/ժամ (համար չկա)
Անվճար գրանցում

Ընդունել

$9/րոպե

500 կետ / ամիս

  • Բոլոր 22+ մոդելները
  • 100,000 այբուբեն յուրաքանչյուր սերունդում
  • Ձայնի կլոնավորում
Սկսել
Ամենատարածված

Օգտագործող

$29/րոպե

2,000,000 կերպար/ամսվա

  • Ամեն ինչ սկզբնականում
  • API մուտք
  • Առավելություն
Գրանցվել

Բիզնես

$99/րոպե

10,000 վարկ / ամիս

  • Ամեն ինչ Pro- ում
  • Բազմաթիվ API
  • Առավելություն
Գրանցվել

Դիտել բոլոր պլանները, ներառյալ հերոսների փաթեթները →

Հաճախ տրվող հարցեր

TTS.ai-ը ամենատարածված AI ձայնային պլատֆորմն է, որը առաջարկում է 22+ տեքստը խոսքի վերածելու մոդելներ, ձայնի կլոունավորում, խոսքը խոսքի վերածելու և ձայնային գործիքներ։ Բոլոր մոդելները բաց կոդ են և չեն կախված արտադրողից։

Այո! TTS.ai-ը առաջարկում է անվճար տեքստը խոսքի վերածելու ծառայություն Kokoro, Piper, VITS և MeloTTS մոդելների հետ։ Հաշիվ պահանջվում չէ։ Գրանցվեք 15,000 անվճար հերոսների և բոլոր մոդելների համար։ Պետք է վճարեք $9/ամսվա համար։

արագության համար օգտագործեք Kokoro կամ Piper։ որակի համար փորձեք CosyVoice 2 կամ StyleTTS 2։ ձայնի կլոնավորման համար օգտագործեք Chatterbox կամ GPT-SoVITS։ երկխոսության համար օգտագործեք Dia TTS։ համեմատելու համար փորձեք միևնույն տեքստի վրա մի քանի մոդելներ։

Այո։ OpenAI-ի հետ համընկնող REST API TTS, STT, ձայնի կլոնավորման և ձայնային գործիքների համար։ Գտնվում է Pro ($29/month) և Enterprise ($99/month) պլաններում։ Դիտեք փաստաթղթերը tts.ai/api/ կայքում։

Խոսքի որակը կախված է մոդելից։ Premium մոդելները, ինչպիսիք են CosyVoice 2, StyleTTS 2 և Chatterbox- ը, արտադրում են մոտավորապես մարդկային որակի խոսք՝ բնական ինտոնացիայով և զգացմունքներով։ Kokoro- ի նման անվճար մոդելները առաջարկում են գերազանց որակ օգտագործման շատ դեպքերում։

TTS.ai-ը աջակցում է 30+ լեզուների իր մոդելային գրադարանում։ Անգլերենը ունի ամենամեծ մոդելի աջակցությունը, բայց CosyVoice 2-ի նման մոդելները ներառում են Չիներեն, Ճապոներեն և Կորեերեն; GPT-SoVITS-ը աջակցում է Չիներեն, Ճապոներեն, Կորեերեն և Անգլերեն; իսկ MeloTTS-ը աջակցում է Չիներեն, Իսպաներեն, Ֆրանսերեն, Չիներեն, Ճապոներեն և Կորեերեն։

Այո։ Բոլոր գործողությունները կատարվում են մեր հատուկ GPU սերվերներում։ Մենք չենք պահպանում ձեր տեքստի մուտքագրումը կամ ձայնի գեներացիան։ Կլոնավորման համար ներբեռնված ձայնային նմուշները օգտագործվում են միայն ընթացիկ սեանսի համար և չեն պահպանվում։ Մենք երբեք չենք փոխանակում ձեր տվյալները երրորդ անձանց հետ կամ օգտագործում դրանք մոդելները սովորեցնելու համար։

Այո։ TTS.ai-ի վրա ստեղծված բոլոր ձայնագրությունները կարող եք օգտագործել առևտրային նպատակներով, ներառյալ YouTube-ի տեսանյութեր, podcast-եր, ձայնագրված գրքեր, ծրագրեր, գովազդներ և այլն։ Մեր մոդելները բաց կոդով են և թույլատրելի լիցենզիաներով (MIT, Apache 2.0)։ Ոչ մի արտոնագիր կամ մատնանշում չի պահանջվում։

TTS.ai-ը լռելյայն ձայնը թողարկում է WAV ձևաչափով՝ առավելագույն որակի համար։ Դուք կարող եք այն վերածել MP3, FLAC, OGG կամ M4A ձևաչափերի՝ օգտագործելով մեր անվճար ձայնային փոխակերպիչ գործիքը։ API-ն աջակցում է ձեր նախընտրած ելքի ձևաչափի ուղղակի նշումը խնդրում։

Տեղադրեք ձայնի կարճ ձայնային նմուշ (մինչև 5 վայրկյան), որը ցանկանում եք կլոնավորել, այնուհետև գրեք ցանկացած տեքստը այդ ձայնով խոսելու համար։ Chatterbox, GPT-SoVITS և CosyVoice 2-ի նման մոդելները աջակցում են ձայնի կլոնավորումը։ Կլոնավորված ձայնը գրանցում է տոնը, արտահայտությունը և խոսելու ոճը։

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) չեն պահանջում հաշիվ և արժեն 0 կերպար։ Ստացված մոդելները (2000 կերպար/1K մուտք) ներառում են Bark, CosyVoice 2, F5-TTS և Dia։ Պրեմիում մոդելները (4000 կերպար/1K մուտք) ներառում են OpenVoice, Chatterbox, StyleTTS 2 և Tortoise։ Պետք է վճարել մոդելների համար, որոնք սովորաբար առաջարկում են ավելի բարձր որակ, ավելի շատ ձայներ և հավելյալ հատկություններ, ինչպիսիք են ձայնի կլոնինգը։

Այո։ API-ն աջակցում է մեծ քանակությամբ տեքստը խոսքի վերածելու համար խմբային գործընթացը։ Տեղադրեք մի քանի խնդրանքներ և ստացեք արդյունքները ասինխրոնորեն՝ օգտագործելով աշխատանքի UUID-ները։ Enterprise պլանները ($99/month) ներառում են նախապատվության երթևեկության մուտք արագացված խմբային գործընթացների համար։ Հատկապես հարմար է ձայնագրված գրքերի արտադրության, դասընթացների բովանդակության և մեծածավալ ձայնագրման նախագծերի համար։
4.0/5 (22)

Ի՞նչ կարող ենք բարելավել: Ձեր կարծիքը օգնում է մեզ լուծել խնդիրները:

Սկսեք օգտագործել AI ձայնը այսօր

Միացեք ստեղծողներին, ծրագրավորողներին և բիզնեսին TTS.ai-ը օգտագործելով