Tasuta tehisintellekt Tekst kõnele

33+ avatud lähtekoodiga mudelid; 273+ hääled, 33+ keeli. Kontot ei ole vaja.

18K+
loojad
71K+
generatsioonidunit synonyms for matching user input
33+
AI mudelid
273+
hääled
Armastus TTS.ai?

33+ AI häälemudelid

Kõige ulatuslikum avatud lähtekoodiga TTS-mudelite kogu ühes platvormis

KokoroKokoro Vaba

Kokoro on 82 miljonit parameetrit teksti-kõne mudel, mis lööb oluliselt üle oma kaaluklassi. Vaatamata oma tillukese suurusega, see toodab märkimisväärselt loomulik ja väljendusrikas kõne. Kokoro toetab mitmeid keeli, sealhulgas inglise, jaapani, hiina ja Korea erinevaid väljendusrikkaid hääli. See töötab uskumatult kiire ~ genereerib heli peaaegu 100x kiiremini kui reaalajas GPU.

Parim: Kvaliteetne TTS minimaalse latentsiga, streaming rakendused

Proovi tasuta

PiperPiper Vaba

Piper on kerge teksti kõneks mootor välja töötatud Rhasspy, mis kasutab VITS ja kõri arhitektuuri. See töötab täielikult CPU, muutes selle ideaalseks serva seadmed, koduautomaatika, ja rakendused nõuavad offline TTS. Üle 100 hääled üle 30+ keeles, Piper pakub loomulik kõlav kõne reaalajas isegi Vaarika Pi 4.

Parim: Kiire eelvaatlus, ligipääsetavus ja põimitud rakendused

Proovi tasuta

VITSVITS Vaba

VITS (Variational Inference with võistlev õppe lõpp-to-end Tekst-to-Speech) on paralleelne lõpp-to-end TTS meetod, mis tekitab loomuliku heli kui praegune kaheastmeline mudelid. See võtab variational järeldus laiendatud normaliseerida voolud ja võistlev koolitusprotsess, saavutades olulise paranemise loomulikkus.

Parim: Üldotstarbeline tekst-kõne loomuliku prosoodiaga

Proovi tasuta

MeloTTSMeloTTS Vaba

MyShell.ai MeloTTS on mitmekeelne TTS raamatukogu, mis toetab inglise (Ameerika, Briti, India, Austraalia), hispaania, prantsuse, hiina, jaapani ja korea keelt. See on väga kiire, töötledes teksti peaaegu reaalajas kiirusega CPU üksi. MeloTTS on mõeldud tootmiseks ja toetab nii CPU ja GPU järeldus.

Parim: Tootmisrakendused, mis vajavad kiiret mitmekeelset TTS-d

Proovi tasuta

Kani TTS 2Kani TTS 2 Vaba

Kani-TTS-2 poolt NineNineSix on ultra-valguse 400M parameeter mudel ehitatud Liquid AI LFM2 selgroog NVIDIA NanoCodec. See töötab vaid 3GB VRAM ja toodab ~10 sekundit kõne A100 (RTF 0.2). Praegune avalik vabastamist laevade inglise-ainult ~kani-ttts-2-en.nie ja ei paljasta kõlar-embled konks vaja hääl kloonimine ~ Kasutage Chatterbox / IndexTTS2 / F5-TTS kloonimine, või Kokoro / MeloTTS mitte-inglise keeles.

Parim: Kiire inglise põlvkonna madal-VRAM riistvara, kiire eelvaatlused

Proovi tasuta

OuteTTSOuteTTS Vaba

OuteTTS laiendab suuri keelemudeleid teksti kõneks saamise võimalustega, säilitades samal ajal originaalarhitektuuri. See toetab mitmeid taustaprogramme, sealhulgas lama.cpp (CPU/GPU), Huging Face Transformers, ExLlamaV2, VLLM ja isegi brauseri järeldamist Transformers.js kaudu. Omadused null-shot hääl kloonimine läbi kõlari profiilid salvestatud JSON.

Parim: Edge kasutuselevõtt, brauseripõhine TTS, madala ressursiga keskkond

Proovi tasuta

Pocket TTSPocket TTS Vaba

Tasku TTS poolt Kyutai (loojad Moshi) on kompaktne 100M parameeter teksti-kõne mudel, mis lööb hästi üle oma kaalu. See töötab tõhusalt CPU, toetab null-shot hääl kloonimine ühe helinäidis ja toodab loomulik kõlav kõne. Väike mudel suurus teeb ideaalne servade kasutuselevõtu ja madala ressursiga keskkondades.

Parim: Kergkaalu kasutamine, ainult protsessoris kasutatavad keskkonnad, kiire hääle kloonimine

Proovi tasuta

Kitten TTSKitten TTS Vaba

Kitten TTS poolt KittenML on ultra-valguse teksti-kõne mudel ehitatud ONNX. Mis variandid 15M kuni 80M parameetrid (25-80 MB kettal), see pakub kvaliteetse häälesünteesi CPU ilma, et oleks vaja GPU. Omadused 8 sisseehitatud hääled, reguleeritav kõnekiirus, ja sisseehitatud teksti eeltöötlus numbrid, valuutade ja üksused. Ideaalne servade kasutuselevõtu ja madala-latentse rakendusi.

Parim: Kiire kerge TTS, servade kasutamine, madala tugevusega rakendused

Proovi tasuta

Ming-Omni TTSMing-Omni TTS Vaba

Ming-omni-ttts-0.5B poolt inclusionAI on kompaktne omni-modaalne kõne mudel ehitatud BailingMM tihe selgroog koos Patch-by-Patch voolu-sobiv audio dekooder. Tarnib 44,1kHz väljund (near CD kvaliteet), toetab null-shot hääl kloonimine 3+ teine viide, ja sisaldab sisseehitatud emotsiooni / dialect / GFM kontrolli kaudu JSON juhiseid. Suurepärane stabiilsus ~ 0.83% WER Hiina võrdlusalused.

Parim: Kõrge truuduse kakskeelne jutustamine, emotsioonidega kontrollitud hääl näitlemine, Hiina audioraamat sisu

Proovi tasuta

MOSS-TTS NanoMOSS-TTS Nano Vaba

MOSS-TTS-Nano-100M on OpenMOSS'i kompaktne 100M-parameetri variant MOSS-TTS perekonnast, jagades viivituste ülekandmise arhitektuuri. 8B mudeli tippkvaliteet on ~80x väiksem kaal ja oluliselt madalam taotluse alusel VRAM, muutes selle sobivaks vaba-tihedamaks ja suure läbilaskvusega rakendusteks. Sama 20-keeleline ulatus.

Parim: Vabatasemel TTS, suuremahuline tootmine, madala suhtega interaktiivne kasutamine

Proovi tasuta

BarkBark Standardne

Transformer-põhine teksti-to-audio mudel, mis tekitab realistlik kõne, muusika, ja heliefekte.

Arendaja: Suno · Litsents: MIT

Proovi seda.

Bark SmallBark Small Standardne

Kergem versioon Bark kiirem järeldus ja madalam mälu kasutamine.

Arendaja: Suno · Litsents: MIT

Proovi seda.

CosyVoice 2CosyVoice 2 Standardne

Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.

Arendaja: Alibaba (Tongyi Lab) · Litsents: Apache 2.0

Proovi seda.

Dia TTSDia TTS Standardne

Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.

Arendaja: Nari Labs · Litsents: Apache 2.0

Proovi seda.

Parler TTSParler TTS Standardne

Kirjelda oma soovitud häält loomulikus keeles ja Parler loob sobiva kõne.

Arendaja: Hugging Face · Litsents: Apache 2.0

Proovi seda.

IndexTTS-2IndexTTS-2 Standardne

Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.

Arendaja: Index Team · Litsents: Bilibili Model License

Proovi seda.

Spark TTSSpark TTS Standardne

Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.

Arendaja: SparkAudio · Litsents: CC BY-NC-SA 4.0

Proovi seda.

GPT-SoVITSGPT-SoVITS Standardne

Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.

Arendaja: RVC-Boss · Litsents: MIT

Proovi seda.

OrpheusOrpheus Standardne

Inimese tasemel emotsionaalne TTS mudel treenitud 100K tundi kõne andmeid.

Arendaja: Canopy Labs · Litsents: Llama 3.2 Community

Proovi seda.

Qwen3 TTSQwen3 TTS Standardne

Alibaba mitmekeelne TTS eelseadistatud häälte ja häälekujundusega tekstist.

Arendaja: Alibaba (Qwen) · Litsents: Apache 2.0

Proovi seda.

VieNeu-TTS-v2VieNeu-TTS-v2 Standardne

Vietnami + inglise kood-switching TTS 7 eelnevalt hääled ja null-shot hääl kloonimine. CPU-ainult, ei GPU vaja.

Arendaja: Phạm Nguyễn Ngọc Bảo · Litsents: Apache 2.0

Proovi seda.

Chatterbox TurboChatterbox Turbo Standardne

Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.

Arendaja: Resemble AI · Litsents: MIT

Proovi seda.

VoxCPMVoxCPM Standardne

Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.

Arendaja: OpenBMB · Litsents: Apache 2.0

Proovi seda.

VibeVoiceVibeVoice Standardne

Microsoft mudel pikaform multi-kõlar sisu nagu podcasts ja audiobooks.

Arendaja: Microsoft · Litsents: MIT

Proovi seda.

CosyVoice3CosyVoice3 Standardne

Järgmise põlvkonna mitmekeelne TTS koos bi-streaming, emotsioonide kontroll, ja null-shot hääl kloonimine.

Arendaja: Alibaba (FunAudioLLM) · Litsents: Apache 2.0

Proovi seda.

NAMAA Saudi TTSNAMAA Saudi TTS Standardne

Esimene avatud Saudi-Arabic TTS. Native Saudi dialekt Chatterbox-kvaliteedi hääl kloonimine.

Arendaja: NAMAA Space · Litsents: MIT

Proovi seda.

Darwin TTSDarwin TTS Standardne

Intermodaalne Qwen3-TTS variant FFN kaaluga, mis on segatud Qwen3-1.7B keelemudelist teravama mitmekeelse kloonimise jaoks.

Arendaja: FINAL-Bench · Litsents: Apache 2.0

Proovi seda.

MOSS-TTSDMOSS-TTSD Standardne

Multi-speaker dialoogi jätkamise mudel ~ genereerida podcast stiilis vestlusi kuni 5 kõlarid ja 60 minutit sidusat heli.

Arendaja: OpenMOSS · Litsents: Apache 2.0

Proovi seda.

ChatterboxChatterbox Premium

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Kvaliteet:

Proovi seda.

Tortoise TTSTortoise TTS Premium

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Kvaliteet:

Proovi seda.

StyleTTS 2StyleTTS 2 Premium

Inimese tasemel teksti kõne-kõne kaudu stiili difusiooni ja võistlevate koolitus.

Kvaliteet:

Proovi seda.

OpenVoiceOpenVoice Premium

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Kvaliteet:

Proovi seda.

Sesame CSMSesame CSM Premium

Vestluskõne mudel, mis loob loomuliku dialoogi sobiva ajastuse ja emotsioonidega.

Kvaliteet:

Proovi seda.

CosyVoice 2CosyVoice 2

Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.

Keeled: en, zh, ja, ko, fr, de, it, es

Klooni hääl

IndexTTS-2IndexTTS-2

Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.

Keeled: en, zh

Klooni hääl

Spark TTSSpark TTS

Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.

Keeled: en, zh

Klooni hääl

GPT-SoVITSGPT-SoVITS

Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.

Keeled: en, zh, ja, ko

Klooni hääl

ChatterboxChatterbox

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Keeled: en

Klooni hääl

Tortoise TTSTortoise TTS

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Keeled: en

Klooni hääl

OpenVoiceOpenVoice

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Keeled: en, zh, ja, ko, fr, es

Klooni hääl

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnami + inglise kood-switching TTS 7 eelnevalt hääled ja null-shot hääl kloonimine. CPU-ainult, ei GPU vaja.

Keeled: vi, en

Klooni hääl

Chatterbox TurboChatterbox Turbo

Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.

Keeled: en

Klooni hääl

VoxCPMVoxCPM

Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.

Keeled: en, zh

Klooni hääl

OuteTTSOuteTTS

LLM-põhine TTS, mis töötab CPU, GPU, või brauseri kaudu lama.cpp ja Transformers.js.

Keeled: en

Klooni hääl

Pocket TTSPocket TTS

Kyutai kerge 100M parameetri mudel, mille puhul ühe proovi hääl kloonitakse.

Keeled: en, fr

Klooni hääl

CosyVoice3CosyVoice3

Järgmise põlvkonna mitmekeelne TTS koos bi-streaming, emotsioonide kontroll, ja null-shot hääl kloonimine.

Keeled: en, zh, ja, ko, de, es, fr, it, ru

Klooni hääl

NAMAA Saudi TTSNAMAA Saudi TTS

Esimene avatud Saudi-Arabic TTS. Native Saudi dialekt Chatterbox-kvaliteedi hääl kloonimine.

Keeled: ar

Klooni hääl

Darwin TTSDarwin TTS

Intermodaalne Qwen3-TTS variant FFN kaaluga, mis on segatud Qwen3-1.7B keelemudelist teravama mitmekeelse kloonimise jaoks.

Keeled: en, ko, ja, zh

Klooni hääl

MOSS-TTSDMOSS-TTSD

Multi-speaker dialoogi jätkamise mudel ~ genereerida podcast stiilis vestlusi kuni 5 kõlarid ja 60 minutit sidusat heli.

Keeled: en, zh

Klooni hääl

Ming-Omni TTSMing-Omni TTS

Kompaktne 0,5B omni-modaalne kõnemudel inclusionAI suure truuduse 44,1kHz väljundiga ja nullkuuma hääle kloonimisega.

Keeled: en, zh

Klooni hääl

MOSS-TTS NanoMOSS-TTS Nano

Pisike 100M MOSS-TTS variant, sama arhitektuur, 80x väiksem, vabataseme latentsus.

Keeled: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Klooni hääl

Arendaja- esimene API

OpenAI ühilduv REST API. Üks tulemusnäitaja, 22+ mudelid. Streaming toetust reaalajas rakendusi.

  • OpenAI- ga ühilduv vorming
  • Trimmimine TTS reaalajas rakendused
  • Partii töötlemine suurte tööde jaoks
  • Veebikonksu teated
API dokkide vaatamine
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Lihtne ja läbipaistev hinnakujundus

Alusta tasuta, skaleeri kasvades.

Vaba

$0

15 000 tähemärki + 5000/päev

  • 7 tasuta mudelid, sealhulgas Kokoro
  • 5000 tähemärki generatsiooni kohta
  • Kaasatud API-juurdepääs
Registreeru tasuta

Starter

$9/munit description in lists

500 krediiti kuus

  • Kõik 22+ mudelit
  • 100 000 tähemärki generatsiooni kohta
  • Hääle kloonimine
Alusta
Kõige populaarsem

Pro

$29/munit description in lists

2000 krediiti kuus

  • Kõik Starter'is
  • API-juurdepääs
  • Prioriteetne töötlemine
Hangi proff

Äri

$99/munit description in lists

10 000 krediiti kuus

  • Kõik on Pro's
  • Pulk API
  • Prioriteetne järjekord
Hangi äri

Vaata kõiki plaane, kaasa arvatud märgipakette →

Korduma kippuvad küsimused

TTS.ai on kõige terviklikum tehisintellekti häälplatvorm, mis pakub 22+ tekstist kõneni mudeleid, kõne kloonimist, kõnest tekstini ja audiovahendeid. Kõik mudelid on avatud lähtekoodiga ilma müüjata.

Jah! TTS.ai pakub tasuta teksti kõneks Kokoro, Piper, VITS, ja MeloTTS mudelid. Ei ole vaja. Registreeru, et saada 15,000 tasuta tähemärki ja juurdepääsu kõigile mudelitele. Tasulised plaanid algavad $9/kuus.

Kiiruse saamiseks kasutage Kokorot või Piperit. Kvaliteetseks proovige CosyVoice 2 või StyleTTS 2. Hääle kloonimiseks kasutage Chatterboxi või GPT- Sovits'i. Dialoogi jaoks kasutage Dia TTS- d. Võrrelda tuleb mitut mudelit samas tekstis.

Jah. OpenAI-ühilduv REST API TTS, STT, hääl kloonimine, ja audio tööriistad. Sisaldab iga plaani sealhulgas tasuta, koos määra piirangud, et skaala astmete kaupa (Vaba: 10 req/min, Lite: 20, Starter: 30, Pro: 60, Business: 300). Vaata dokumente tts.ai/api/.

Hääle kvaliteet varieerub mudeli järgi. Premium mudelid nagu CosyVoice 2, StyleTTS 2 ja Chatterbox toota inimeselähedane kvaliteet kõne loomulik intonatsioon ja emotsioonid. Tasuta mudelid nagu Kokoro pakkuda suurepärast kvaliteeti enamikul juhtudel.

TTS.ai toetab 30+ keelt oma mudeliraamatukogus. Inglise keelel on kõige laiem mudeli toetus, kuid sellised mudelid nagu CosyVoice 2 hõlmavad hiina, jaapani ja korea keelt; GPT-SoviTS tegeleb hiina, jaapani, korea ja inglise keelega ning MeloTTS toetab inglise, hispaania, prantsuse, hiina, jaapani ja korea keelt.

Jah. Kogu töötlemine toimub meie spetsiaalsetes GPU serverites. Me ei salvesta sinu tekstisisendit või genereeritud audiot pärast kohaletoimetamist. Üleslaaditud helinäidiseid kloonimiseks kasutatakse ainult aktiivse seansi jaoks ja neid ei säilitata. Me ei jaga kunagi sinu andmeid kolmandate osapooltega ega kasuta seda mudelite treenimiseks.

Jah. Kõik heli loodud TTS.ai on teie kasutada kaubanduslikult, sealhulgas YouTube videod, podcasts, audioraamatud, rakendused, reklaamid, ja tooted. Meie mudelid on avatud lähtekoodiga alusel lubatud litsentsid (MIT, Apache 2.0). Nr litsentsitasud või määramine vaja.

TTS.ai loob heli WAV formaadis vaikimisi maksimaalse kvaliteedi. Saate teisendada MP3, FLAC, OGG või M4A kasutades meie tasuta Audio Converter tööriist. API toetab täpsustada oma eelistatud väljundvorming otse taotluse.

Laadib üles lühikese helinäidise (pisuke kui 5 sekundit) häälest, mida soovid kloonida, ning kirjutab siis mis tahes teksti kõne tekitamiseks hääles. Sellised mudelid nagu Chatterbox, GPT- Sovetts ja CosyVoice 2 toetavad hääle kloonimist. Kloonitud hääl haarab tooni, aktsendi ja kõnelemise stiili.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) ei nõua konto ja kulu null tähemärki. Standardmudelid (2000 tähemärki/1K sisend) sisaldavad Bark, CosyVoice 2, F5-TTS ja Dia. Premium mudelid (4000 tähemärki/1K sisend) sisaldavad OpenVoice, Chatterbox, StyleTTS 2 ja Tortoise. Tasustatud mudelid pakuvad üldiselt kõrgema kvaliteediga, rohkem hääli, ja täiendavaid funktsioone nagu hääl kloonimine.

Jah. API toetab partii töötlemise teisendamiseks suurtes kogustes teksti kõne. Saada mitu päringut ja saada tulemusi asünkroonselt kasutades töö UUTID. Äriplaan ($99/mo) ja suurem lisada prioriteet järjekorra juurdepääsu kiiremaks partii töötlemise. Ideaalne audioraamat tootmise, muidugi sisu ja suuremahuline häälüle projekte.
4.1/5 (42)

Mida me võiks parandada? Teie tagasiside aitab meil lahendada küsimusi.

Alusta AI-hääle kasutamist tänapäeval

Liitu loojate, arendajate ja ettevõtetega, kasutades TTS.ai