Free AI Testun i LeferyddComment
33+ modelau ffynhonnell agored, 273+ llais, 33+ ieithoedd. Nid oes angen cyfrif.
Popeth sydd ei angen arnoch ar gyfer AI LleferyddName
30+ offer wedi'u pweru gan ffynonellau agored modelau AI
33+ Modelau Lleferydd AI
Y casgliad mwyaf eang o fathau TTS ffynhonnell agored ar un platfform
Kokoro Rhydd
Model testun-i-leferydd 82 miliwn o baramedrau yw Kokoro sy'n gwneud yn well na'i ddosbarth pwysau. Er gwaethaf ei faint bach, mae'n cynhyrchu siarad naturiol a chryno. Cynhelir nifer o ieithoedd gan gynnwys Saesneg, Japaneg, Tsieineeg a Corea gydag amrywiaeth o lais cryf. Mae'n rhedeg yn gyflym iawn - yn creu sain bron 100 gwaith yn gyflymach na real-time ar GPU.
Gorau ar gyfer: TTS o ansawdd uchel gyda chynnydd lleiaf, rhaglenni llifogydd
Ceisiwch Am Ddim
Piper Rhydd
Peiriant testun-i-leferydd ysgafn yw Piper a ddatblygwyd gan Rhasspy sy'n defnyddio strwythurau VITS a laryncs. Mae'n rhedeg yn llwyr ar CPU, gan ei wneud yn berffaith ar gyfer dyfeisiau ymylon, awtomeiddio cartref, a rhaglenni sy'n gofyn am TTS all-lein. Gyda dros 100 o lais dros 30+ o ieithoedd, mae Piper yn darparu lleferydd sy'n swnio'n naturiol ar gyflymderau gwirioneddol hyd yn oed ar Raspberry Pi 4.
Gorau ar gyfer: Rhagolygon cyflym, hygyrchedd, a rhaglenni mewnadeiladedig
Ceisiwch Am Ddim
VITS Rhydd
VITS (Dealltwriaeth Amrywiol gyda dysgu gwrthwynebol ar gyfer Testun-i-Leferydd diwedd-i-ddiwedd) yw dull TTS diwedd-i-ddiwedd paralel sy'n creu sain sy'n swnio'n fwy naturiol na'r modelau cyfredol o ddau gam. Mae'n mabwysiadu dealltwriaeth amrywiol wedi'i wella gyda llifoedd normaleiddio a phrosesu hyfforddi gwrthwynebol, gan gyflawni gwelliannau sylweddol mewn naturioldeb.
Gorau ar gyfer: Testun-i-leferydd pwrpas-cyffredinol gyda phrosodi naturiolName
Ceisiwch Am Ddim
MeloTTS Rhydd
Llyfrgell TTS aml-iaith yw MeloTTS gan MyShell.ai sy'n cynnal Saesneg (Americanaidd, Prydeinig, Indiaidd, Awstralaidd), Sbaeneg, Ffrangeg, Tsieineaidd, Japaneaidd a Corea. Mae'n hynod o gyflym, yn prosesu testun ar gyflymder sy'n debyg i gyflymder amser real ar y CPU yn unig. Mae MeloTTS wedi ei ddylunio ar gyfer defnydd cynhyrchu ac yn cynnal dehongliad CPU a GPU.
Gorau ar gyfer: Rhaglenni cynhyrchu sydd angen TTS cyflym, aml-ieithog
Ceisiwch Am Ddim
Kani TTS 2 Rhydd
Kani-TTS-2 gan NineNineSix yw model paramedr 400M ultra-ysgafn wedi'i adeiladu ar gefndir LiquidAI LFM2 gyda Nvidia NanoCodec. Mae'n rhedeg mewn dim ond 3GB o VRAM ac yn cyrraedd 10 eiliad o siarad mewn ~2 eiliad (RTF 0.2). Cynhelir clôn llais zero-shot trwy mewnosodiadau siaradwr.
Gorau ar gyfer: Creu cyflym, amgylcheddau adnoddau isel, rhagolygon cyflym
Ceisiwch Am Ddim
OuteTTS Rhydd
Mae OuteTTS yn ehangu modelau iaith mawr gyda galluoedd testun-i-ganu tra'n cadw'r adeiladwaith gwreiddiol. Mae'n cynnal amryw o ochr gefn gan gynnwys llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, a hyd yn oed dehongliad porwr drwy Transformers.js. Mae'n cynnwys clonio llais zero-shot drwy broffiliau siaradwyr wedi'u cadw fel JSON.
Gorau ar gyfer: Datblygu Edge, TTS seiliedig ar borwr, amgylcheddau adnoddau isel
Ceisiwch Am Ddim
Pocket TTS Rhydd
Model testun-i-leferydd cymhleth 100M o paramedrau yw Pocket TTS gan Kyutai (crewyr Moshi) sy'n torri'r ffiniau. Mae'n rhedeg yn effeithlon ar CPU, yn cynnal clonio llais zero-shot o sampl sain sengl, ac yn cynhyrchu llais sy'n swnio'n naturiol. Mae maint bach y model yn ei wneud yn berffaith ar gyfer datblygiadau ar y ffin a chyfleusterau sydd â llai o adnoddau.
Gorau ar gyfer: Gosod ysgafn, amgylcheddau CPU yn unig, clonio llais cyflym
Ceisiwch Am Ddim
Kitten TTS Rhydd
Model testun-i-leferydd ultra-ysgafn yw Kitten TTS gan KittenML, wedi'i adeiladu ar ONNX. Gyda gwahanol fathau o 15M i 80M o baramedrau (25-80 MB ar y ddisg), mae'n darparu cyfansoddiad llais o ansawdd uchel ar y CPU heb angen GPU. Mae ganddo 8 llais mewnol, cyflymder llais addasadwy, a rhag-brosesu testun mewnol ar gyfer rhifau, arian, ac unedau. Mae'n berffaith ar gyfer rhaglenni eithaf a chynnydd isel.
Gorau ar gyfer: TTS ysgafn a gyflym, datblygiadau ymylon, rhaglenni â chynnydd isel
Ceisiwch Am Ddim
Ming-Omni TTS Rhydd
Mae Ming-omni-tts-0.5B gan inclusionAI yn fodel siarad aml-modal cymharol ysgafn wedi'i adeiladu ar y gwraidd dwys BailingMM gyda datgodiwr sain sy'n cydweddu llif Patch-by-Patch. Mae'n darparu allbwn 44.1kHz (yn agos at ansawdd CD), yn cynnal clonio llais zero-shot o gyfeiriad 3+ eiliad, ac yn cynnwys rheoli teimladau / naws / BGM mewnol trwy gyfarwyddiadau JSON. Sefydlogrwydd rhagorol — 0.83% WER ar fesurau cyferbyniad Tsieineaidd.
Gorau ar gyfer: Naratifau dwyieithog uchel-gywirdeb, chwarae llais wedi'i reoli gan emosiynau, cynnwys llyfr sain Tsieineaidd
Ceisiwch Am Ddim
MOSS-TTS Nano Rhydd
MOSS-TTS-Nano-100M yw amrywiad paramedr 100M OpenMOSS o'r teulu MOSS-TTS, yn rhannu'r adeiladwaith trawsnewidydd-oedi. Mae'n masnachu ansawdd uchaf y model 8B am bwysau ~80x llai a VRAM yn isel yn sylweddol ar gyfer pob cais, gan ei wneud yn addas ar gyfer datblygiadau lefel rhad ac uchel-trwybwn. Yr un cyrraedd 20 iaith.
Gorau ar gyfer: TTS haen-rydd, cynhyrchu llwyth uchel, defnydd rhyngweithiol â chynnydd isel
Ceisiwch Am Ddim
Bark & Gwaredu Iaith
Model testun-i-sain seiliedig ar drawsnewidydd sy'n creu siarad, cerddoriaeth ac effeithiau sain realistig.
Datblygwr: Suno · Trwydded: MIT
Ceisiwch hi
Bark Small & Gwaredu Iaith
Fersiwn ysgafnach o Bark gyda dehongli cyflymach a defnydd cof is. Name
Datblygwr: Suno · Trwydded: MIT
Ceisiwch hi
CosyVoice 2 & Gwaredu Iaith
Alibaba's scalable streaming TTS with human-parity naturalness and nearly-zero latency.
Datblygwr: Alibaba (Tongyi Lab) · Trwydded: Apache 2.0
Ceisiwch hi
Dia TTS & Gwaredu Iaith
Model creu ymgom aml-seinydd sy'n creu sgyrsiau naturiol rhwng siaradwyr.
Datblygwr: Nari Labs · Trwydded: Apache 2.0
Ceisiwch hi
Parler TTS & Gwaredu Iaith
Disgrifiwch y llais rydych ei eisiau mewn iaith naturiol a bydd Parler yn creu llais sy'n cydweddu.
Datblygwr: Hugging Face · Trwydded: Apache 2.0
Ceisiwch hi
IndexTTS-2 & Gwaredu Iaith
TTS zero-shot gyda rheoli emosiynau grawn-fin a mynegiant uchel.
Datblygwr: Index Team · Trwydded: Bilibili Model License
Ceisiwch hi
Spark TTS & Gwaredu Iaith
Clonio llais TTS gydag arddull emosiynau a siarad rheoliadwy drwy alwadau.
Datblygwr: SparkAudio · Trwydded: CC BY-NC-SA 4.0
Ceisiwch hi
GPT-SoVITS & Gwaredu Iaith
Clonio llais TTS ychydig-sgyrsiau sy'n ail-greu unrhyw lais o 5 eiliad o sain yn unig.
Datblygwr: RVC-Boss · Trwydded: MIT
Ceisiwch hi
Orpheus & Gwaredu Iaith
Model TTS emosiynol lefel dynol wedi ei hyfforddi ar 100K o oriau o ddata siarad.
Datblygwr: Canopy Labs · Trwydded: Llama 3.2 Community
Ceisiwch hi
Qwen3 TTS & Gwaredu Iaith
TTS aml-ieithog Alibaba gyda chlonio llais, lleisiau rhagosodedig, a dylunio llais o destun.
Datblygwr: Alibaba (Qwen) · Trwydded: Apache 2.0
Ceisiwch hi
VieNeu-TTS-v2 & Gwaredu Iaith
TTS Fietnameg + Saesneg yn newid cod gyda 7 llais rhagosodedig a chlonio llais zero-shot. CPU yn unig, dim angen GPU.
Datblygwr: Phạm Nguyễn Ngọc Bảo · Trwydded: Apache 2.0
Ceisiwch hi
Chatterbox Turbo & Gwaredu Iaith
Chatterbox cyflymach gydag oedi o dan 200ms a thagiau para- ieithyddol ar gyfer chwerthin, sychder, a mwy.
Datblygwr: Resemble AI · Trwydded: MIT
Ceisiwch hi
VoxCPM & Gwaredu Iaith
TTS di-tokenizer yn cynhyrchu sain 44.1kHz gyda chysondeb paragraff cyd-destun.
Datblygwr: OpenBMB · Trwydded: Apache 2.0
Ceisiwch hi
VibeVoice & Gwaredu Iaith
Model Microsoft ar gyfer cynnwys aml-seinydd ar ffurf hir fel podlediadau a llyfr sain.
Datblygwr: Microsoft · Trwydded: MIT
Ceisiwch hi
CosyVoice3 & Gwaredu Iaith
TTS aml-ieithog y genhedlaeth nesaf gyda dau-sianel, rheoli teimladau, a chlonio llais zero-shot.
Datblygwr: Alibaba (FunAudioLLM) · Trwydded: Apache 2.0
Ceisiwch hi
NAMAA Saudi TTS & Gwaredu Iaith
TTS Saesneg-Arabeg agored cyntaf. Saesneg Saesneg naturiol gyda chlonio llais o ansawdd Chatterbox.
Datblygwr: NAMAA Space · Trwydded: MIT
Ceisiwch hi
Darwin TTS & Gwaredu Iaith
Math Qwen3-TTS traws-modal gyda phwysau FFN wedi'u cymysgu o'r model iaith Qwen3-1.7B er mwyn clonio aml-ieithog mwy cryf. Name
Datblygwr: FINAL-Bench · Trwydded: Apache 2.0
Ceisiwch hi
MOSS-TTSD & Gwaredu Iaith
Model parhaus ymgom aml-seinydd — creu sgyrsiau arddull pod-dafod gyda hyd at 5 seinydd a 60 munud o sain gydlynol.
Datblygwr: OpenMOSS · Trwydded: Apache 2.0
Ceisiwch hi
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and nearly-zero latency.
Ieithoedd: en, zh, ja, ko, fr, de, it, es
Cloi Llythyren
IndexTTS-2
TTS zero-shot gyda rheoli emosiynau grawn-fin a mynegiant uchel.
Ieithoedd: en, zh
Cloi Llythyren
Spark TTS
Clonio llais TTS gydag arddull emosiynau a siarad rheoliadwy drwy alwadau.
Ieithoedd: en, zh
Cloi Llythyren
GPT-SoVITS
Clonio llais TTS ychydig-sgyrsiau sy'n ail-greu unrhyw lais o 5 eiliad o sain yn unig.
Ieithoedd: en, zh, ja, ko
Cloi Llythyren
Chatterbox
Clonio llais zero-shot o'r radd flaenaf gyda rheoli teimladau o Resemble AI.
Ieithoedd: en
Cloi Llythyren
Tortoise TTS
Testun-i-leferydd aml-lais wedi'i ganolbwyntio ar ansawdd gydag adeiladwaith awto-adferol.
Ieithoedd: en
Cloi Llythyren
OpenVoice
Clonio llais yn syth gyda rheoli graenus dros arddull, teimlad, a chaneuon.
Ieithoedd: en, zh, ja, ko, fr, es
Cloi Llythyren
VieNeu-TTS-v2
TTS Fietnameg + Saesneg yn newid cod gyda 7 llais rhagosodedig a chlonio llais zero-shot. CPU yn unig, dim angen GPU.
Ieithoedd: vi, en
Cloi Llythyren
Chatterbox Turbo
Chatterbox cyflymach gydag oedi o dan 200ms a thagiau para- ieithyddol ar gyfer chwerthin, sychder, a mwy.
Ieithoedd: en
Cloi Llythyren
VoxCPM
TTS di-tokenizer yn cynhyrchu sain 44.1kHz gyda chysondeb paragraff cyd-destun.
Ieithoedd: en, zh
Cloi Llythyren
OuteTTS
TTS wedi'i seilio ar LLM sy'n rhedeg ar CPU, GPU, neu borwr drwy llama.cpp a Transformers.js.
Ieithoedd: en
Cloi Llythyren
Pocket TTS
Model paramedr ysgafn 100M gan Kyutai gyda chlonio llais o sampl sengl. Name
Ieithoedd: en, fr
Cloi Llythyren
CosyVoice3
TTS aml-ieithog y genhedlaeth nesaf gyda dau-sianel, rheoli teimladau, a chlonio llais zero-shot.
Ieithoedd: en, zh, ja, ko, de, es, fr, it, ru
Cloi Llythyren
NAMAA Saudi TTS
TTS Saesneg-Arabeg agored cyntaf. Saesneg Saesneg naturiol gyda chlonio llais o ansawdd Chatterbox.
Ieithoedd: ar
Cloi Llythyren
Darwin TTS
Math Qwen3-TTS traws-modal gyda phwysau FFN wedi'u cymysgu o'r model iaith Qwen3-1.7B er mwyn clonio aml-ieithog mwy cryf. Name
Ieithoedd: en, ko, ja, zh
Cloi Llythyren
MOSS-TTSD
Model parhaus ymgom aml-seinydd — creu sgyrsiau arddull pod-dafod gyda hyd at 5 seinydd a 60 munud o sain gydlynol.
Ieithoedd: en, zh
Cloi Llythyren
Ming-Omni TTS
Model siarad aml-modal 0.5B compact o inclusionAI gydag allbwn 44.1kHz uchel-ddilysrwydd a chlonio llais zero-shot.
Ieithoedd: en, zh
Cloi Llythyren
MOSS-TTS Nano
Math bach 100M MOSS-TTS - yr un strwythur, 80x yn llai, diffyg amser rhydd-haen.
Ieithoedd: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Cloi LlythyrenAPI Datblygwr-Arwain
API REST sy'n gydnaws â OpenAI. Un diwedd-bwynt, 22+ model. Cynhaliaeth llif ar gyfer cymwysiadau amser real.
- Fformat cydnaws â OpenAI
- Llif TTS ar gyfer rhaglenni amser real
- Prosesu batch ar gyfer swyddi mawr
- Hysbysiadau Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Prisio Syml, Tryloyw
Dechreuwch yn rhydd. Graddio wrth i chi dyfu.
Rhydd
15,000 o nodau + 5,000/diwrnod
- 7 model am ddim gan gynnwys Kokoro
- 5,000 o nodau y genhedlaeth
- API cyrchiad wedi'i gynnwys
Cychwynydd
500 credyd/mis
- Pob 22+ model
- 100,000 o nodau y genhedlaeth
- Clonio Llywio
Pro
2,000 credyd/mis
- Popeth yn y Cychwynydd
- Cyrchiad API
- Prosesu blaenoriaeth
Cwestiynau a Ofynnir yn Aml
Beth allwn ni ei wella? Mae eich adborth yn ein helpu i ddatrys problemau.
Dechrau Defnyddio Lleferydd AI Heddiw
Ymuno â chrewyr, datblygwyr a busnesau sy'n defnyddio TTS.ai