Tasuta tehisintellekt Tekst kõnele
31+ avatud lähtekoodiga mudelid; 231+ hääled, 34+ keeli. Kontot ei ole vaja.
Kõik, mida vajate hääl AI
30+ avatud lähtekoodiga tehisintellektimudelitel töötavad tööriistad
31+ AI häälemudelid
Kõige ulatuslikum avatud lähtekoodiga TTS-mudelite kogu ühes platvormis
Kokoro Vaba
Kokoro on 82 miljonit parameetrit teksti-kõne mudel, mis lööb oluliselt üle oma kaaluklassi. Vaatamata oma tillukese suurusega, see toodab märkimisväärselt loomulik ja väljendusrikas kõne. Kokoro toetab mitmeid keeli, sealhulgas inglise, jaapani, hiina ja Korea erinevaid väljendusrikkaid hääli. See töötab uskumatult kiire ~ genereerib heli peaaegu 100x kiiremini kui reaalajas GPU.
Parim: Kvaliteetne TTS minimaalse latentsiga, streaming rakendused
Proovi tasuta
Piper Vaba
Piper on kerge teksti kõneks mootor välja töötatud Rhasspy, mis kasutab VITS ja kõri arhitektuuri. See töötab täielikult CPU, muutes selle ideaalseks serva seadmed, koduautomaatika, ja rakendused nõuavad offline TTS. Üle 100 hääled üle 30+ keeles, Piper pakub loomulik kõlav kõne reaalajas isegi Vaarika Pi 4.
Parim: Kiire eelvaatlus, ligipääsetavus ja põimitud rakendused
Proovi tasuta
VITS Vaba
VITS (Variational Inference with võistlev õppe lõpp-to-end Tekst-to-Speech) on paralleelne lõpp-to-end TTS meetod, mis tekitab loomuliku heli kui praegune kaheastmeline mudelid. See võtab variational järeldus laiendatud normaliseerida voolud ja võistlev koolitusprotsess, saavutades olulise paranemise loomulikkus.
Parim: Üldotstarbeline tekst-kõne loomuliku prosoodiaga
Proovi tasuta
MeloTTS Vaba
MyShell.ai MeloTTS on mitmekeelne TTS raamatukogu, mis toetab inglise (Ameerika, Briti, India, Austraalia), hispaania, prantsuse, hiina, jaapani ja korea keelt. See on väga kiire, töötledes teksti peaaegu reaalajas kiirusega CPU üksi. MeloTTS on mõeldud tootmiseks ja toetab nii CPU ja GPU järeldus.
Parim: Tootmisrakendused, mis vajavad kiiret mitmekeelset TTS-d
Proovi tasuta
OuteTTS Vaba
OuteTTS laiendab suuri keelemudeleid teksti kõneks saamise võimalustega, säilitades samal ajal originaalarhitektuuri. See toetab mitmeid taustaprogramme, sealhulgas lama.cpp (CPU/GPU), Huging Face Transformers, ExLlamaV2, VLLM ja isegi brauseri järeldamist Transformers.js kaudu. Omadused null-shot hääl kloonimine läbi kõlari profiilid salvestatud JSON.
Parim: Edge kasutuselevõtt, brauseripõhine TTS, madala ressursiga keskkond
Proovi tasuta
Pocket TTS Vaba
Tasku TTS poolt Kyutai (loojad Moshi) on kompaktne 100M parameeter teksti-kõne mudel, mis lööb hästi üle oma kaalu. See töötab tõhusalt CPU, toetab null-shot hääl kloonimine ühe helinäidis ja toodab loomulik kõlav kõne. Väike mudel suurus teeb ideaalne servade kasutuselevõtu ja madala ressursiga keskkondades.
Parim: Kergkaalu kasutamine, ainult protsessoris kasutatavad keskkonnad, kiire hääle kloonimine
Proovi tasuta
Kitten TTS Vaba
Kitten TTS poolt KittenML on ultra-valguse teksti-kõne mudel ehitatud ONNX. Mis variandid 15M kuni 80M parameetrid (25-80 MB kettal), see pakub kvaliteetse häälesünteesi CPU ilma, et oleks vaja GPU. Omadused 8 sisseehitatud hääled, reguleeritav kõnekiirus, ja sisseehitatud teksti eeltöötlus numbrid, valuutade ja üksused. Ideaalne servade kasutuselevõtu ja madala-latentse rakendusi.
Parim: Kiire kerge TTS, servade kasutamine, madala tugevusega rakendused
Proovi tasuta
Bark Standardne
Transformer-põhine teksti-to-audio mudel, mis tekitab realistlik kõne, muusika, ja heliefekte.
Arendaja: Suno · Litsents: MIT
Proovi seda.
Bark Small Standardne
Kergem versioon Bark kiirem järeldus ja madalam mälu kasutamine.
Arendaja: Suno · Litsents: MIT
Proovi seda.
CosyVoice 2 Standardne
Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.
Arendaja: Alibaba (Tongyi Lab) · Litsents: Apache 2.0
Proovi seda.
Dia TTS Standardne
Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.
Arendaja: Nari Labs · Litsents: Apache 2.0
Proovi seda.
Parler TTS Standardne
Kirjelda oma soovitud häält loomulikus keeles ja Parler loob sobiva kõne.
Arendaja: Hugging Face · Litsents: Apache 2.0
Proovi seda.
GLM-TTS Standardne
Saavutab avatud lähtekoodiga TTS-mudelite madalaima märgi veamäära.
Arendaja: Zhipu AI · Litsents: GLM-4 License
Proovi seda.
IndexTTS-2 Standardne
Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.
Arendaja: Index Team · Litsents: Bilibili Model License
Proovi seda.
Spark TTS Standardne
Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.
Arendaja: SparkAudio · Litsents: CC BY-NC-SA 4.0
Proovi seda.
GPT-SoVITS Standardne
Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.
Arendaja: RVC-Boss · Litsents: MIT
Proovi seda.
Orpheus Standardne
Inimese tasemel emotsionaalne TTS mudel treenitud 100K tundi kõne andmeid.
Arendaja: Canopy Labs · Litsents: Llama 3.2 Community
Proovi seda.
Qwen3 TTS Standardne
Alibaba mitmekeelne TTS koos hääl kloonimine, eelseadistatud hääled, ja hääl disain tekstist.
Arendaja: Alibaba (Qwen) · Litsents: Apache 2.0
Proovi seda.
Chatterbox Turbo Standardne
Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.
Arendaja: Resemble AI · Litsents: MIT
Proovi seda.
Dia 2 Standardne
Streaming-esimene jutuajamine TTS multi-speaker dialoogi ja paralinguistlik vihjeid.
Arendaja: Nari Labs · Litsents: Apache 2.0
Proovi seda.
VoxCPM Standardne
Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.
Arendaja: OpenBMB · Litsents: Apache 2.0
Proovi seda.
TADA Standardne
Nullhallutsinatsioonid TTS teksti-akustiline dual joondamine, 5x kiiremini kui võrreldav LLM TTS.
Arendaja: Hume AI · Litsents: MIT
Proovi seda.
VibeVoice Standardne
Microsoft mudel pikaform multi-kõlar sisu nagu podcasts ja audiobooks.
Arendaja: Microsoft · Litsents: MIT
Proovi seda.
CosyVoice3 Standardne
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Arendaja: Alibaba (FunAudioLLM) · Litsents: Apache 2.0
Proovi seda.
CosyVoice 2
Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.
Keeled: en, zh, ja, ko, fr, de, it, es
Klooni hääl
GLM-TTS
Saavutab avatud lähtekoodiga TTS-mudelite madalaima märgi veamäära.
Keeled: en, zh
Klooni hääl
IndexTTS-2
Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.
Keeled: en, zh
Klooni hääl
Spark TTS
Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.
Keeled: en, zh
Klooni hääl
GPT-SoVITS
Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.
Keeled: en, zh, ja, ko
Klooni hääl
Chatterbox
"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.
Keeled: en
Klooni hääl
Tortoise TTS
Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.
Keeled: en
Klooni hääl
OpenVoice
Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.
Keeled: en, zh, ja, ko, fr, de, es, it
Klooni hääl
Qwen3 TTS
Alibaba mitmekeelne TTS koos hääl kloonimine, eelseadistatud hääled, ja hääl disain tekstist.
Keeled: en, zh, ja, ko, de, fr, ru, pt, es, it
Klooni hääl
Chatterbox Turbo
Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.
Keeled: en
Klooni hääl
VoxCPM
Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.
Keeled: en, zh
Klooni hääl
OuteTTS
LLM-põhine TTS, mis töötab CPU, GPU, või brauseri kaudu lama.cpp ja Transformers.js.
Keeled: en
Klooni hääl
Pocket TTS
Kyutai kerge 100M parameetri mudel, mille puhul ühe proovi hääl kloonitakse.
Keeled: en, fr
Klooni hääl
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Keeled: en, zh, ja, ko, de, es, fr, it, ru
Klooni hääl
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Keeled: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klooni hääl
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Keeled: en, zh
Klooni häälArendaja- esimene API
OpenAI ühilduv REST API. Üks tulemusnäitaja, 22+ mudelid. Streaming toetust reaalajas rakendusi.
- OpenAI- ga ühilduv vorming
- Trimmimine TTS reaalajas rakendused
- Partii töötlemine suurte tööde jaoks
- Veebikonksu teated
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Lihtne ja läbipaistev hinnakujundus
Alusta tasuta, skaleeri kasvades.
Vaba
15 krediiti
- Kokoro, Piper, VITS, MeloTTS
- 500 tähemärgi piirang
- 3 g/h (kontot ei ole)
Starter
500 krediiti kuus
- Kõik 22+ mudelit
- 100 000 tähemärki generatsiooni kohta
- Hääle kloonimine
Pro
2000 krediiti kuus
- Kõik Starter'is
- API-juurdepääs
- Prioriteetne töötlemine
Äri
10 000 krediiti kuus
- Kõik on Pro's
- Pulk API
- Prioriteetne järjekord
Korduma kippuvad küsimused
Mida me võiks parandada? Teie tagasiside aitab meil lahendada küsimusi.
Alusta AI-hääle kasutamist tänapäeval
Liitu loojate, arendajate ja ettevõtetega, kasutades TTS.ai