Tasuta tehisintellekt Tekst kõnele
20+ avatud lähtekoodiga mudelid; 107+ hääled, 32+ keeli. Kontot ei ole vaja.
Kõik, mida vajate hääl AI
30+ avatud lähtekoodiga tehisintellektimudelitel töötavad tööriistad
20+ AI häälemudelid
Kõige ulatuslikum avatud lähtekoodiga TTS-mudelite kogu ühes platvormis
Kokoro Free
Kokoro on 82 miljonit parameetrit teksti-kõne mudel, mis lööb oluliselt üle oma kaaluklassi. Vaatamata oma tillukese suurusega, see toodab märkimisväärselt loomulik ja väljendusrikas kõne. Kokoro toetab mitmeid keeli, sealhulgas inglise, jaapani, hiina ja Korea erinevaid väljendusrikkaid hääli. See töötab uskumatult kiire ~ genereerib heli peaaegu 100x kiiremini kui reaalajas GPU.
Parim: Kvaliteetne TTS minimaalse latentsiga, streaming rakendused
Proovi tasuta
Piper Free
Piper on kerge teksti kõneks mootor välja töötatud Rhasspy, mis kasutab VITS ja kõri arhitektuuri. See töötab täielikult CPU, muutes selle ideaalseks serva seadmed, koduautomaatika, ja rakendused nõuavad offline TTS. Üle 100 hääled üle 30+ keeles, Piper pakub loomulik kõlav kõne reaalajas isegi Vaarika Pi 4.
Parim: Kiire eelvaatlus, ligipääsetavus ja põimitud rakendused
Proovi tasuta
VITS Free
VITS (Variational Inference with võistlev õppe lõpp-to-end Tekst-to-Speech) on paralleelne lõpp-to-end TTS meetod, mis tekitab loomuliku heli kui praegune kaheastmeline mudelid. See võtab variational järeldus laiendatud normaliseerida voolud ja võistlev koolitusprotsess, saavutades olulise paranemise loomulikkus.
Parim: Üldotstarbeline tekst-kõne loomuliku prosoodiaga
Proovi tasuta
MeloTTS Free
MyShell.ai MeloTTS on mitmekeelne TTS raamatukogu, mis toetab inglise (Ameerika, Briti, India, Austraalia), hispaania, prantsuse, hiina, jaapani ja korea keelt. See on väga kiire, töötledes teksti peaaegu reaalajas kiirusega CPU üksi. MeloTTS on mõeldud tootmiseks ja toetab nii CPU ja GPU järeldus.
Parim: Tootmisrakendused, mis vajavad kiiret mitmekeelset TTS-d
Proovi tasuta
Bark Standard
Transformer-põhine teksti-to-audio mudel, mis tekitab realistlik kõne, muusika, ja heliefekte.
Arendaja: Suno · Litsents: MIT
Proovi seda.
Bark Small Standard
Kergem versioon Bark kiirem järeldus ja madalam mälu kasutamine.
Arendaja: Suno · Litsents: MIT
Proovi seda.
CosyVoice 2 Standard
Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.
Arendaja: Alibaba (Tongyi Lab) · Litsents: Apache 2.0
Proovi seda.
Dia TTS Standard
Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.
Arendaja: Nari Labs · Litsents: Apache 2.0
Proovi seda.
Parler TTS Standard
Kirjelda oma soovitud häält loomulikus keeles ja Parler loob sobiva kõne.
Arendaja: Hugging Face · Litsents: Apache 2.0
Proovi seda.
GLM-TTS Standard
Saavutab avatud lähtekoodiga TTS-mudelite madalaima märgi veamäära.
Arendaja: Zhipu AI · Litsents: GLM-4 License
Proovi seda.
IndexTTS-2 Standard
Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.
Arendaja: Index Team · Litsents: Bilibili Model License
Proovi seda.
Spark TTS Standard
Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.
Arendaja: SparkAudio · Litsents: CC BY-NC-SA 4.0
Proovi seda.
GPT-SoVITS Standard
Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.
Arendaja: RVC-Boss · Litsents: MIT
Proovi seda.
Orpheus Standard
Inimese tasemel emotsionaalne TTS mudel treenitud 100K tundi kõne andmeid.
Arendaja: Canopy Labs · Litsents: Llama 3.2 Community
Proovi seda.
Qwen3 TTS Standard
Alibaba mitmekeelne TTS koos hääl kloonimine, eelseadistatud hääled, ja hääl disain tekstist.
Arendaja: Alibaba (Qwen) · Litsents: Apache 2.0
Proovi seda.
CosyVoice 2
Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.
Keeled: en, zh, ja, ko, fr, de, it, es
Klooni hääl
GLM-TTS
Saavutab avatud lähtekoodiga TTS-mudelite madalaima märgi veamäära.
Keeled: en, zh
Klooni hääl
IndexTTS-2
Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.
Keeled: en, zh
Klooni hääl
Spark TTS
Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.
Keeled: en, zh
Klooni hääl
GPT-SoVITS
Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.
Keeled: en, zh, ja, ko
Klooni hääl
Chatterbox
"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.
Keeled: en
Klooni hääl
Tortoise TTS
Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.
Keeled: en
Klooni hääl
OpenVoice
Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.
Keeled: en, zh, ja, ko, fr, de, es, it
Klooni hääl
Qwen3 TTS
Alibaba mitmekeelne TTS koos hääl kloonimine, eelseadistatud hääled, ja hääl disain tekstist.
Keeled: en, zh, ja, ko, de, fr, ru, pt, es, it
Klooni häälArendaja- esimene API
OpenAI ühilduv REST API. Üks tulemusnäitaja, 22+ mudelid. Streaming toetust reaalajas rakendusi.
- OpenAI- ga ühilduv vorming
- Trimmimine TTS reaalajas rakendused
- Partii töötlemine suurte tööde jaoks
- Veebikonksu teated
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Lihtne ja läbipaistev hinnakujundus
Alusta tasuta, skaleeri kasvades.
Vaba
15 krediiti
- Kokoro, Piper, VITS, MeloTTS
- 500 tähemärgi piirang
- 3 g/h (kontot ei ole)
Starter
500 krediiti kuus
- Kõik 22+ mudelit
- 100 000 tähemärki generatsiooni kohta
- Hääle kloonimine
Pro
2000 krediiti kuus
- Kõik Starter'is
- API-juurdepääs
- Prioriteetne töötlemine
Äri
10 000 krediiti kuus
- Kõik on Pro's
- Pulk API
- Prioriteetne järjekord
Korduma kippuvad küsimused
Alusta AI-hääle kasutamist tänapäeval
Liitu loojate, arendajate ja ettevõtetega, kasutades TTS.ai