Ազատ AI Տեքստից խոսքName

22+ բաց կոդով մոդելներ, 100+ ձայներ, 32+ լեզուներ։ Հաշիվ չի պահանջվում։

0/500 նշաններ Ազատ
Կրեդիտ քարտ չկա 50 անվճար վարկ 32+ լեզուներ Առևտրային օգտագործման համար
0:00 / 0:00
Download Audio Հղումն ավարտվում է 24 ժամ անց
Ինչպես TTS.ai-ն, պատմեք ձեր ընկերներին։

Ամեն ինչ, ինչի կարիք ունեք ձայնային արհեստական բանականության համար

26 գործիք 24+ բաց կոդով արհեստական բանականության մոդելներով

22+ AI ձայնային մոդելներ

Open-source TTS մոդելների ամենախոշոր հավաքածուն մեկ պլատֆորմում

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Լավագույնը` High-quality TTS with minimal latency, streaming applications

Ստուգել անվճար

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Լավագույնը` Quick previews, accessibility, and embedded applications

Ստուգել անվճար

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Լավագույնը` General-purpose text-to-speech with natural prosody

Ստուգել անվճար

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Լավագույնը` Աշխատանքային ծրագրեր, որոնք պահանջում են արագ, բազմալեզու TTS

Ստուգել անվճար

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Հեղինակ Suno · Լիցենզիա MIT

Փորձեք :

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Հեղինակ Suno · Լիցենզիա MIT

Փորձեք :

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Հեղինակ Alibaba (Tongyi Lab) · Լիցենզիա Apache 2.0

Փորձեք :

Dia TTSDia TTS Standard

Multi-speaker dialog generation model, որը ստեղծում է խոսողների միջև բնական զրույցներ։

Հեղինակ Nari Labs · Լիցենզիա Apache 2.0

Փորձեք :

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Հեղինակ Hugging Face · Լիցենզիա Apache 2.0

Փորձեք :

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Հեղինակ Index Team · Լիցենզիա Apache 2.0

Փորձեք :

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Հեղինակ SparkAudio · Լիցենզիա Apache 2.0

Փորձեք :

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Հեղինակ RVC-Boss · Լիցենզիա MIT

Փորձեք :

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Հեղինակ Canopy Labs · Լիցենզիա Llama 3.2 Community

Փորձեք :

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Հեղինակ Alibaba (Qwen) · Լիցենզիա Apache 2.0

Փորձեք :

ChatterboxChatterbox Premium

Էմոցիոնալ վերահսկողությամբ ձայնի կլոնավորում Resemble AI-ի միջոցով։

Ապրանքանիշ:

Փորձեք :

Tortoise TTSTortoise TTS Premium

Բազմաձայն տեքստը խոսքի վերածող համակարգ, որը կենտրոնացած է որակի վրա՝ օգտագործելով ավտոռեգրեսիվ ճարտարապետություն։

Ապրանքանիշ:

Փորձեք :

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Ապրանքանիշ:

Փորձեք :

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Ապրանքանիշ:

Փորձեք :

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Լեզուներ en, zh, ja, ko, fr, de, it, es

Գործողություն

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Լեզուներ en, zh

Գործողություն

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Լեզուներ en, zh

Գործողություն

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Լեզուներ en, zh, ja, ko

Գործողություն

ChatterboxChatterbox

Էմոցիոնալ վերահսկողությամբ ձայնի կլոնավորում Resemble AI-ի միջոցով։

Լեզուներ en

Գործողություն

Tortoise TTSTortoise TTS

Բազմաձայն տեքստը խոսքի վերածող համակարգ, որը կենտրոնացած է որակի վրա՝ օգտագործելով ավտոռեգրեսիվ ճարտարապետություն։

Լեզուներ en

Գործողություն

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Լեզուներ en, zh, ja, ko, fr, de, es, it

Գործողություն

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Լեզուներ en, zh, ja, ko, de, fr, ru, pt, es, it

Գործողություն

Առաջին ծրագրավորողի API

OpenAI-ի հետ համընկնող REST API. Մի վերջնական կետ, 22+ մոդելներ. Ցանցային աջակցություն իրական ժամանակի ծրագրերի համար։

  • OpenAI- համապատասխան ձևաչափ
  • TTS-ի հոսք իրական ժամանակի ծրագրերի համար
  • Փաթեթային աշխատանք մեծ աշխատանքների համար
  • Webhook հաղորդագրություններ
Դիտել API փաստաթղթերը
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Պարզ, թափանցիկ գնագոյացում

Սկսեք անվճար։ Մեծացեք, երբ աճում եք։

Ազատ

$0

50 միավոր

  • Kokoro, Piper, VITS, MeloTTS
  • 500 սանտիմետր սահմանափակում
  • 3 գեներ/ժամ (առանց հաշվի)
Անվճար գրանցում

Առաջարկ

$9/րոպե

500 կետ / ամիս

  • Բոլոր 22+ մոդելները
  • 5,000 սանտիմետր սահմանափակում
  • Ձայնի կլոնավորում
Սկսել
Ամենատարածված

Օգտագործող

$29/րոպե

2,000 credits/month

  • Ամեն ինչ սկզբնականում
  • API մուտք
  • Առավելություն
Գրանցվել որպես մասնագետ

Ընկերություն

$99/րոպե

10,000 վարկ / ամիս

  • Ամեն ինչ Pro- ում
  • Բազմաթիվ API
  • Առավելություն
Համագործակցություն վաճառքի հետ

View all plans including credit packs →

Հաճախ տրվող հարցեր

TTS.ai-ն ամենախոշոր AI ձայնային պլատֆորմն է, որն առաջարկում է 22+ տեքստը խոսքի վերածելու մոդելներ, ձայնի կլոնավորում, խոսքը տեքստի վերածելու և ձայնային գործիքներ։ Բոլոր մոդելները բաց կոդով են և ոչ մի արտադրողի կողմից չեն սահմանափակվում։

Այո! TTS.ai-ն առաջարկում է Kokoro, Piper, VITS և MeloTTS մոդելներով անվճար տեքստը խոսքի վերածելու ծառայություն։ Հաշիվ չի պահանջվում։ Գրանցվեք 50 անվճար վարկային միավորներ ստանալու և բոլոր մոդելներին մուտք գործելու համար։ Ամսական վճարովի պլանները սկսվում են $9-ից։

արագության համար օգտագործեք Kokoro կամ Piper։ որակի համար փորձեք CosyVoice 2 կամ StyleTTS 2։ ձայնի կլոնավորման համար օգտագործեք Chatterbox կամ GPT-SoVITS։ երկխոսության համար օգտագործեք Dia TTS։ համեմատելու համար փորձեք միևնույն տեքստի վրա մի քանի մոդելներ։

Այո։ OpenAI-ի հետ համընկնող REST API TTS, STT, ձայնի կլոնավորման և ձայնային գործիքների համար։ Գտնվում է Pro ($29/month) և Enterprise ($99/month) պլաններում։ Դիտեք փաստաթղթերը tts.ai/api/ կայքում։

Խոսքի որակը կախված է մոդելից։ Premium մոդելները, ինչպիսիք են CosyVoice 2, StyleTTS 2 և Chatterbox- ը, արտադրում են մոտավորապես մարդկային որակի խոսք՝ բնական ինտոնացիայով և զգացմունքներով։ Kokoro- ի նման անվճար մոդելները առաջարկում են գերազանց որակ օգտագործման շատ դեպքերում։

TTS.ai supports 30+ languages across its model library. English has the widest model support, but models like CosyVoice 2 cover Chinese, Japanese, and Korean; GPT-SoVITS handles Chinese, Japanese, Korean, and English; and MeloTTS supports English, Spanish, French, Chinese, Japanese, and Korean.

Այո։ Բոլոր գործընթացները կատարվում են մեր հատուկ GPU սերվերներում։ Մենք չենք պահպանում ձեր տեքստի մուտքագրումը կամ ստեղծված ձայնը։ Կլոնավորման համար ներբեռնված ձայնային նմուշները օգտագործվում են միայն ընթացիկ նստաշրջանի համար և չեն պահպանվում։ Մենք երբեք չենք կիսվում ձեր տվյալներով երրորդ անձանց հետ և չենք օգտագործում դրանք մոդելները սովորեցնելու համար։

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai-ն լռելյայն ձայնագրում է WAV ձևաչափով՝ առավելագույն որակի ապահովման համար։ Դուք կարող եք փոխակերպել MP3, FLAC, OGG կամ M4A ձևաչափերով՝ օգտագործելով մեր անվճար ձայնագրման գործիքը։ API-ն աջակցում է ձեր նախընտրած ելքի ձևաչափի ուղղակի նշումը խնդրանքում։

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) չեն պահանջում հաշիվ և արժեն զրոյական գումար։ Ստացվող ստանդարտ մոդելները (2 գումար/1K կերպար) ներառում են Bark, CosyVoice 2, F5-TTS և Dia։ Պրեմիում մոդելները (4 գումար/1K կերպար) ներառում են OpenVoice, Chatterbox, StyleTTS 2 և Tortoise։ Փոխհատուցվող մոդելները սովորաբար առաջարկում են ավելի բարձր որակ, ավելի շատ ձայներ և հավելյալ հատկություններ, ինչպիսիք են ձայնի կլոնավորումը։

Այո։ API-ն աջակցում է մեծ քանակությամբ տեքստը խոսքի վերածելու համար խմբային գործընթացը։ Տեղադրեք մի քանի խնդրանքներ և ստացեք արդյունքները ասինխրոնորեն՝ օգտագործելով աշխատանքի UUID-ները։ Enterprise պլանները ($99/month) ներառում են նախապատվության երթևեկության մուտք արագացված խմբային գործընթացների համար։ Հատկապես հարմար է ձայնագրված գրքերի արտադրության, դասընթացների բովանդակության և մեծածավալ ձայնագրման նախագծերի համար։
5.0/5 (1)

Սկսեք օգտագործել AI ձայնը այսօր

Միացեք ստեղծողներին, ծրագրավորողներին և TTS.ai-ն օգտագործող բիզնեսին