Tasuta tehisintellekt Tekst kõnele
33+ avatud lähtekoodiga mudelid; 273+ hääled, 33+ keeli. Kontot ei ole vaja.
Kõik, mida vajate hääl AI
30+ avatud lähtekoodiga tehisintellektimudelitel töötavad tööriistad
33+ AI häälemudelid
Kõige ulatuslikum avatud lähtekoodiga TTS-mudelite kogu ühes platvormis
Kokoro Vaba
Kokoro on 82 miljonit parameetrit teksti-kõne mudel, mis lööb oluliselt üle oma kaaluklassi. Vaatamata oma tillukese suurusega, see toodab märkimisväärselt loomulik ja väljendusrikas kõne. Kokoro toetab mitmeid keeli, sealhulgas inglise, jaapani, hiina ja Korea erinevaid väljendusrikkaid hääli. See töötab uskumatult kiire ~ genereerib heli peaaegu 100x kiiremini kui reaalajas GPU.
Parim: Kvaliteetne TTS minimaalse latentsiga, streaming rakendused
Proovi tasuta
Piper Vaba
Piper on kerge teksti kõneks mootor välja töötatud Rhasspy, mis kasutab VITS ja kõri arhitektuuri. See töötab täielikult CPU, muutes selle ideaalseks serva seadmed, koduautomaatika, ja rakendused nõuavad offline TTS. Üle 100 hääled üle 30+ keeles, Piper pakub loomulik kõlav kõne reaalajas isegi Vaarika Pi 4.
Parim: Kiire eelvaatlus, ligipääsetavus ja põimitud rakendused
Proovi tasuta
VITS Vaba
VITS (Variational Inference with võistlev õppe lõpp-to-end Tekst-to-Speech) on paralleelne lõpp-to-end TTS meetod, mis tekitab loomuliku heli kui praegune kaheastmeline mudelid. See võtab variational järeldus laiendatud normaliseerida voolud ja võistlev koolitusprotsess, saavutades olulise paranemise loomulikkus.
Parim: Üldotstarbeline tekst-kõne loomuliku prosoodiaga
Proovi tasuta
MeloTTS Vaba
MyShell.ai MeloTTS on mitmekeelne TTS raamatukogu, mis toetab inglise (Ameerika, Briti, India, Austraalia), hispaania, prantsuse, hiina, jaapani ja korea keelt. See on väga kiire, töötledes teksti peaaegu reaalajas kiirusega CPU üksi. MeloTTS on mõeldud tootmiseks ja toetab nii CPU ja GPU järeldus.
Parim: Tootmisrakendused, mis vajavad kiiret mitmekeelset TTS-d
Proovi tasuta
Kani TTS 2 Vaba
Kani-TTS-2 poolt NineNineSix on ultra-valguse 400M parameeter mudel ehitatud Liquid AI LFM2 selgroog NVIDIA NanoCodec. See töötab vaid 3GB VRAM ja toodab ~10 sekundit kõne A100 (RTF 0.2). Praegune avalik vabastamist laevade inglise-ainult ~kani-ttts-2-en.nie ja ei paljasta kõlar-embled konks vaja hääl kloonimine ~ Kasutage Chatterbox / IndexTTS2 / F5-TTS kloonimine, või Kokoro / MeloTTS mitte-inglise keeles.
Parim: Kiire inglise põlvkonna madal-VRAM riistvara, kiire eelvaatlused
Proovi tasuta
OuteTTS Vaba
OuteTTS laiendab suuri keelemudeleid teksti kõneks saamise võimalustega, säilitades samal ajal originaalarhitektuuri. See toetab mitmeid taustaprogramme, sealhulgas lama.cpp (CPU/GPU), Huging Face Transformers, ExLlamaV2, VLLM ja isegi brauseri järeldamist Transformers.js kaudu. Omadused null-shot hääl kloonimine läbi kõlari profiilid salvestatud JSON.
Parim: Edge kasutuselevõtt, brauseripõhine TTS, madala ressursiga keskkond
Proovi tasuta
Pocket TTS Vaba
Tasku TTS poolt Kyutai (loojad Moshi) on kompaktne 100M parameeter teksti-kõne mudel, mis lööb hästi üle oma kaalu. See töötab tõhusalt CPU, toetab null-shot hääl kloonimine ühe helinäidis ja toodab loomulik kõlav kõne. Väike mudel suurus teeb ideaalne servade kasutuselevõtu ja madala ressursiga keskkondades.
Parim: Kergkaalu kasutamine, ainult protsessoris kasutatavad keskkonnad, kiire hääle kloonimine
Proovi tasuta
Kitten TTS Vaba
Kitten TTS poolt KittenML on ultra-valguse teksti-kõne mudel ehitatud ONNX. Mis variandid 15M kuni 80M parameetrid (25-80 MB kettal), see pakub kvaliteetse häälesünteesi CPU ilma, et oleks vaja GPU. Omadused 8 sisseehitatud hääled, reguleeritav kõnekiirus, ja sisseehitatud teksti eeltöötlus numbrid, valuutade ja üksused. Ideaalne servade kasutuselevõtu ja madala-latentse rakendusi.
Parim: Kiire kerge TTS, servade kasutamine, madala tugevusega rakendused
Proovi tasuta
Ming-Omni TTS Vaba
Ming-omni-ttts-0.5B poolt inclusionAI on kompaktne omni-modaalne kõne mudel ehitatud BailingMM tihe selgroog koos Patch-by-Patch voolu-sobiv audio dekooder. Tarnib 44,1kHz väljund (near CD kvaliteet), toetab null-shot hääl kloonimine 3+ teine viide, ja sisaldab sisseehitatud emotsiooni / dialect / GFM kontrolli kaudu JSON juhiseid. Suurepärane stabiilsus ~ 0.83% WER Hiina võrdlusalused.
Parim: Kõrge truuduse kakskeelne jutustamine, emotsioonidega kontrollitud hääl näitlemine, Hiina audioraamat sisu
Proovi tasuta
MOSS-TTS Nano Vaba
MOSS-TTS-Nano-100M on OpenMOSS'i kompaktne 100M-parameetri variant MOSS-TTS perekonnast, jagades viivituste ülekandmise arhitektuuri. 8B mudeli tippkvaliteet on ~80x väiksem kaal ja oluliselt madalam taotluse alusel VRAM, muutes selle sobivaks vaba-tihedamaks ja suure läbilaskvusega rakendusteks. Sama 20-keeleline ulatus.
Parim: Vabatasemel TTS, suuremahuline tootmine, madala suhtega interaktiivne kasutamine
Proovi tasuta
Bark Standardne
Transformer-põhine teksti-to-audio mudel, mis tekitab realistlik kõne, muusika, ja heliefekte.
Arendaja: Suno · Litsents: MIT
Proovi seda.
Bark Small Standardne
Kergem versioon Bark kiirem järeldus ja madalam mälu kasutamine.
Arendaja: Suno · Litsents: MIT
Proovi seda.
CosyVoice 2 Standardne
Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.
Arendaja: Alibaba (Tongyi Lab) · Litsents: Apache 2.0
Proovi seda.
Dia TTS Standardne
Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.
Arendaja: Nari Labs · Litsents: Apache 2.0
Proovi seda.
Parler TTS Standardne
Kirjelda oma soovitud häält loomulikus keeles ja Parler loob sobiva kõne.
Arendaja: Hugging Face · Litsents: Apache 2.0
Proovi seda.
IndexTTS-2 Standardne
Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.
Arendaja: Index Team · Litsents: Bilibili Model License
Proovi seda.
Spark TTS Standardne
Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.
Arendaja: SparkAudio · Litsents: CC BY-NC-SA 4.0
Proovi seda.
GPT-SoVITS Standardne
Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.
Arendaja: RVC-Boss · Litsents: MIT
Proovi seda.
Orpheus Standardne
Inimese tasemel emotsionaalne TTS mudel treenitud 100K tundi kõne andmeid.
Arendaja: Canopy Labs · Litsents: Llama 3.2 Community
Proovi seda.
Qwen3 TTS Standardne
Alibaba mitmekeelne TTS eelseadistatud häälte ja häälekujundusega tekstist.
Arendaja: Alibaba (Qwen) · Litsents: Apache 2.0
Proovi seda.
VieNeu-TTS-v2 Standardne
Vietnami + inglise kood-switching TTS 7 eelnevalt hääled ja null-shot hääl kloonimine. CPU-ainult, ei GPU vaja.
Arendaja: Phạm Nguyễn Ngọc Bảo · Litsents: Apache 2.0
Proovi seda.
Chatterbox Turbo Standardne
Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.
Arendaja: Resemble AI · Litsents: MIT
Proovi seda.
VoxCPM Standardne
Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.
Arendaja: OpenBMB · Litsents: Apache 2.0
Proovi seda.
VibeVoice Standardne
Microsoft mudel pikaform multi-kõlar sisu nagu podcasts ja audiobooks.
Arendaja: Microsoft · Litsents: MIT
Proovi seda.
CosyVoice3 Standardne
Järgmise põlvkonna mitmekeelne TTS koos bi-streaming, emotsioonide kontroll, ja null-shot hääl kloonimine.
Arendaja: Alibaba (FunAudioLLM) · Litsents: Apache 2.0
Proovi seda.
NAMAA Saudi TTS Standardne
Esimene avatud Saudi-Arabic TTS. Native Saudi dialekt Chatterbox-kvaliteedi hääl kloonimine.
Arendaja: NAMAA Space · Litsents: MIT
Proovi seda.
Darwin TTS Standardne
Intermodaalne Qwen3-TTS variant FFN kaaluga, mis on segatud Qwen3-1.7B keelemudelist teravama mitmekeelse kloonimise jaoks.
Arendaja: FINAL-Bench · Litsents: Apache 2.0
Proovi seda.
MOSS-TTSD Standardne
Multi-speaker dialoogi jätkamise mudel ~ genereerida podcast stiilis vestlusi kuni 5 kõlarid ja 60 minutit sidusat heli.
Arendaja: OpenMOSS · Litsents: Apache 2.0
Proovi seda.
CosyVoice 2
Alibaba skaleeritav streaming TTS koos inimese-parity naturalness ja liginull latency.
Keeled: en, zh, ja, ko, fr, de, it, es
Klooni hääl
IndexTTS-2
Null-shot TTS peeneteraline emotsioonide kontrolli ja kõrge väljendusvõimega.
Keeled: en, zh
Klooni hääl
Spark TTS
Hääl kloonimine TTS kontrollitav emotsioonide ja rääkimisstiili kaudu.
Keeled: en, zh
Klooni hääl
GPT-SoVITS
Vähesed helid kloonivad TTS-d, mis jäljendavad igat häält vaid 5 sekundi helist.
Keeled: en, zh, ja, ko
Klooni hääl
Chatterbox
"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.
Keeled: en
Klooni hääl
Tortoise TTS
Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.
Keeled: en
Klooni hääl
OpenVoice
Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.
Keeled: en, zh, ja, ko, fr, es
Klooni hääl
VieNeu-TTS-v2
Vietnami + inglise kood-switching TTS 7 eelnevalt hääled ja null-shot hääl kloonimine. CPU-ainult, ei GPU vaja.
Keeled: vi, en
Klooni hääl
Chatterbox Turbo
Kiirem Chatterbox sub-200ms latency ja paralinguistlik sildid naeru, köha, ja rohkem.
Keeled: en
Klooni hääl
VoxCPM
Tokenizer-free TTS producing 44,1kHz audio with context-aware paragraph consistance.
Keeled: en, zh
Klooni hääl
OuteTTS
LLM-põhine TTS, mis töötab CPU, GPU, või brauseri kaudu lama.cpp ja Transformers.js.
Keeled: en
Klooni hääl
Pocket TTS
Kyutai kerge 100M parameetri mudel, mille puhul ühe proovi hääl kloonitakse.
Keeled: en, fr
Klooni hääl
CosyVoice3
Järgmise põlvkonna mitmekeelne TTS koos bi-streaming, emotsioonide kontroll, ja null-shot hääl kloonimine.
Keeled: en, zh, ja, ko, de, es, fr, it, ru
Klooni hääl
NAMAA Saudi TTS
Esimene avatud Saudi-Arabic TTS. Native Saudi dialekt Chatterbox-kvaliteedi hääl kloonimine.
Keeled: ar
Klooni hääl
Darwin TTS
Intermodaalne Qwen3-TTS variant FFN kaaluga, mis on segatud Qwen3-1.7B keelemudelist teravama mitmekeelse kloonimise jaoks.
Keeled: en, ko, ja, zh
Klooni hääl
MOSS-TTSD
Multi-speaker dialoogi jätkamise mudel ~ genereerida podcast stiilis vestlusi kuni 5 kõlarid ja 60 minutit sidusat heli.
Keeled: en, zh
Klooni hääl
Ming-Omni TTS
Kompaktne 0,5B omni-modaalne kõnemudel inclusionAI suure truuduse 44,1kHz väljundiga ja nullkuuma hääle kloonimisega.
Keeled: en, zh
Klooni hääl
MOSS-TTS Nano
Pisike 100M MOSS-TTS variant, sama arhitektuur, 80x väiksem, vabataseme latentsus.
Keeled: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Klooni häälArendaja- esimene API
OpenAI ühilduv REST API. Üks tulemusnäitaja, 22+ mudelid. Streaming toetust reaalajas rakendusi.
- OpenAI- ga ühilduv vorming
- Trimmimine TTS reaalajas rakendused
- Partii töötlemine suurte tööde jaoks
- Veebikonksu teated
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Lihtne ja läbipaistev hinnakujundus
Alusta tasuta, skaleeri kasvades.
Vaba
15 000 tähemärki + 5000/päev
- 7 tasuta mudelid, sealhulgas Kokoro
- 5000 tähemärki generatsiooni kohta
- Kaasatud API-juurdepääs
Starter
500 krediiti kuus
- Kõik 22+ mudelit
- 100 000 tähemärki generatsiooni kohta
- Hääle kloonimine
Pro
2000 krediiti kuus
- Kõik Starter'is
- API-juurdepääs
- Prioriteetne töötlemine
Äri
10 000 krediiti kuus
- Kõik on Pro's
- Pulk API
- Prioriteetne järjekord
Korduma kippuvad küsimused
Mida me võiks parandada? Teie tagasiside aitab meil lahendada küsimusi.
Alusta AI-hääle kasutamist tänapäeval
Liitu loojate, arendajate ja ettevõtetega, kasutades TTS.ai