Free AI Testun i LeferyddComment
31+ modelau ffynhonnell agored, 231+ llais, 34+ ieithoedd. Nid oes angen cyfrif.
Popeth sydd ei angen arnoch ar gyfer AI LleferyddName
30+ offer wedi'u pweru gan ffynonellau agored modelau AI
31+ Modelau Lleferydd AI
Y casgliad mwyaf eang o fathau TTS ffynhonnell agored ar un platfform
Kokoro Rhydd
Model testun-i-leferydd 82 miliwn o baramedrau yw Kokoro sy'n gwneud yn well na'i ddosbarth pwysau. Er gwaethaf ei faint bach, mae'n cynhyrchu siarad naturiol a chryno. Cynhelir nifer o ieithoedd gan gynnwys Saesneg, Japaneg, Tsieineeg a Corea gydag amrywiaeth o lais cryf. Mae'n rhedeg yn gyflym iawn - yn creu sain bron 100 gwaith yn gyflymach na real-time ar GPU.
Gorau ar gyfer: TTS o ansawdd uchel gyda chynnydd lleiaf, rhaglenni llifogydd
Ceisiwch Am Ddim
Piper Rhydd
Peiriant testun-i-leferydd ysgafn yw Piper a ddatblygwyd gan Rhasspy sy'n defnyddio strwythurau VITS a laryncs. Mae'n rhedeg yn llwyr ar CPU, gan ei wneud yn berffaith ar gyfer dyfeisiau ymylon, awtomeiddio cartref, a rhaglenni sy'n gofyn am TTS all-lein. Gyda dros 100 o lais dros 30+ o ieithoedd, mae Piper yn darparu lleferydd sy'n swnio'n naturiol ar gyflymderau gwirioneddol hyd yn oed ar Raspberry Pi 4.
Gorau ar gyfer: Rhagolygon cyflym, hygyrchedd, a rhaglenni mewnadeiladedig
Ceisiwch Am Ddim
VITS Rhydd
VITS (Dealltwriaeth Amrywiol gyda dysgu gwrthwynebol ar gyfer Testun-i-Leferydd diwedd-i-ddiwedd) yw dull TTS diwedd-i-ddiwedd paralel sy'n creu sain sy'n swnio'n fwy naturiol na'r modelau cyfredol o ddau gam. Mae'n mabwysiadu dealltwriaeth amrywiol wedi'i wella gyda llifoedd normaleiddio a phrosesu hyfforddi gwrthwynebol, gan gyflawni gwelliannau sylweddol mewn naturioldeb.
Gorau ar gyfer: Testun-i-leferydd pwrpas-cyffredinol gyda phrosodi naturiolName
Ceisiwch Am Ddim
MeloTTS Rhydd
Llyfrgell TTS aml-iaith yw MeloTTS gan MyShell.ai sy'n cynnal Saesneg (Americanaidd, Prydeinig, Indiaidd, Awstralaidd), Sbaeneg, Ffrangeg, Tsieineaidd, Japaneaidd a Corea. Mae'n hynod o gyflym, yn prosesu testun ar gyflymder sy'n debyg i gyflymder amser real ar y CPU yn unig. Mae MeloTTS wedi ei ddylunio ar gyfer defnydd cynhyrchu ac yn cynnal dehongliad CPU a GPU.
Gorau ar gyfer: Rhaglenni cynhyrchu sydd angen TTS cyflym, aml-ieithog
Ceisiwch Am Ddim
OuteTTS Rhydd
Mae OuteTTS yn ehangu modelau iaith mawr gyda galluoedd testun-i-ganu tra'n cadw'r adeiladwaith gwreiddiol. Mae'n cynnal amryw o ochr gefn gan gynnwys llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, a hyd yn oed dehongliad porwr drwy Transformers.js. Mae'n cynnwys clonio llais zero-shot drwy broffiliau siaradwyr wedi'u cadw fel JSON.
Gorau ar gyfer: Datblygu Edge, TTS seiliedig ar borwr, amgylcheddau adnoddau isel
Ceisiwch Am Ddim
Pocket TTS Rhydd
Model testun-i-leferydd cymhleth 100M o paramedrau yw Pocket TTS gan Kyutai (crewyr Moshi) sy'n torri'r ffiniau. Mae'n rhedeg yn effeithlon ar CPU, yn cynnal clonio llais zero-shot o sampl sain sengl, ac yn cynhyrchu llais sy'n swnio'n naturiol. Mae maint bach y model yn ei wneud yn berffaith ar gyfer datblygiadau ar y ffin a chyfleusterau sydd â llai o adnoddau.
Gorau ar gyfer: Gosod ysgafn, amgylcheddau CPU yn unig, clonio llais cyflym
Ceisiwch Am Ddim
Kitten TTS Rhydd
Model testun-i-leferydd ultra-ysgafn yw Kitten TTS gan KittenML, wedi'i adeiladu ar ONNX. Gyda gwahanol fathau o 15M i 80M o baramedrau (25-80 MB ar y ddisg), mae'n darparu cyfansoddiad llais o ansawdd uchel ar y CPU heb angen GPU. Mae ganddo 8 llais mewnol, cyflymder llais addasadwy, a rhag-brosesu testun mewnol ar gyfer rhifau, arian, ac unedau. Mae'n berffaith ar gyfer rhaglenni eithaf a chynnydd isel.
Gorau ar gyfer: TTS ysgafn a gyflym, datblygiadau ymylon, rhaglenni â chynnydd isel
Ceisiwch Am Ddim
Bark & Gwaredu Iaith
Model testun-i-sain seiliedig ar drawsnewidydd sy'n creu siarad, cerddoriaeth ac effeithiau sain realistig.
Datblygwr: Suno · Trwydded: MIT
Ceisiwch hi
Bark Small & Gwaredu Iaith
Fersiwn ysgafnach o Bark gyda dehongli cyflymach a defnydd cof is. Name
Datblygwr: Suno · Trwydded: MIT
Ceisiwch hi
CosyVoice 2 & Gwaredu Iaith
Alibaba's scalable streaming TTS with human-parity naturalness and nearly-zero latency.
Datblygwr: Alibaba (Tongyi Lab) · Trwydded: Apache 2.0
Ceisiwch hi
Dia TTS & Gwaredu Iaith
Model creu ymgom aml-seinydd sy'n creu sgyrsiau naturiol rhwng siaradwyr.
Datblygwr: Nari Labs · Trwydded: Apache 2.0
Ceisiwch hi
Parler TTS & Gwaredu Iaith
Disgrifiwch y llais rydych ei eisiau mewn iaith naturiol a bydd Parler yn creu llais sy'n cydweddu.
Datblygwr: Hugging Face · Trwydded: Apache 2.0
Ceisiwch hi
GLM-TTS & Gwaredu Iaith
Cyrraedd y gyfradd gwall nodau isaf ymhlith modelau TTS ffynhonnell agored.
Datblygwr: Zhipu AI · Trwydded: GLM-4 License
Ceisiwch hi
IndexTTS-2 & Gwaredu Iaith
TTS zero-shot gyda rheoli emosiynau grawn-fin a mynegiant uchel.
Datblygwr: Index Team · Trwydded: Bilibili Model License
Ceisiwch hi
Spark TTS & Gwaredu Iaith
Clonio llais TTS gydag arddull emosiynau a siarad rheoliadwy drwy alwadau.
Datblygwr: SparkAudio · Trwydded: CC BY-NC-SA 4.0
Ceisiwch hi
GPT-SoVITS & Gwaredu Iaith
Clonio llais TTS ychydig-sgyrsiau sy'n ail-greu unrhyw lais o 5 eiliad o sain yn unig.
Datblygwr: RVC-Boss · Trwydded: MIT
Ceisiwch hi
Orpheus & Gwaredu Iaith
Model TTS emosiynol lefel dynol wedi ei hyfforddi ar 100K o oriau o ddata siarad.
Datblygwr: Canopy Labs · Trwydded: Llama 3.2 Community
Ceisiwch hi
Qwen3 TTS & Gwaredu Iaith
TTS aml-ieithog Alibaba gyda chlonio llais, lleisiau rhagosodedig, a dylunio llais o destun.
Datblygwr: Alibaba (Qwen) · Trwydded: Apache 2.0
Ceisiwch hi
Chatterbox Turbo & Gwaredu Iaith
Chatterbox cyflymach gydag oedi o dan 200ms a thagiau para- ieithyddol ar gyfer chwerthin, sychder, a mwy.
Datblygwr: Resemble AI · Trwydded: MIT
Ceisiwch hi
Dia 2 & Gwaredu Iaith
TTS cyfathrebu sy'n seiliedig ar ffrydio yn gyntaf gydag ymgom aml-seinydd ac awgrymiadau para-ieithog.
Datblygwr: Nari Labs · Trwydded: Apache 2.0
Ceisiwch hi
VoxCPM & Gwaredu Iaith
TTS di-tokenizer yn cynhyrchu sain 44.1kHz gyda chysondeb paragraff cyd-destun.
Datblygwr: OpenBMB · Trwydded: Apache 2.0
Ceisiwch hi
TADA & Gwaredu Iaith
TTS di-hallucination gydag alinio testun-acoustic duo, 5x cyflymach na TTS LLM cymharol.
Datblygwr: Hume AI · Trwydded: MIT
Ceisiwch hi
VibeVoice & Gwaredu Iaith
Model Microsoft ar gyfer cynnwys aml-seinydd ar ffurf hir fel podlediadau a llyfr sain.
Datblygwr: Microsoft · Trwydded: MIT
Ceisiwch hi
CosyVoice3 & Gwaredu Iaith
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Datblygwr: Alibaba (FunAudioLLM) · Trwydded: Apache 2.0
Ceisiwch hi
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and nearly-zero latency.
Ieithoedd: en, zh, ja, ko, fr, de, it, es
Cloi Llythyren
GLM-TTS
Cyrraedd y gyfradd gwall nodau isaf ymhlith modelau TTS ffynhonnell agored.
Ieithoedd: en, zh
Cloi Llythyren
IndexTTS-2
TTS zero-shot gyda rheoli emosiynau grawn-fin a mynegiant uchel.
Ieithoedd: en, zh
Cloi Llythyren
Spark TTS
Clonio llais TTS gydag arddull emosiynau a siarad rheoliadwy drwy alwadau.
Ieithoedd: en, zh
Cloi Llythyren
GPT-SoVITS
Clonio llais TTS ychydig-sgyrsiau sy'n ail-greu unrhyw lais o 5 eiliad o sain yn unig.
Ieithoedd: en, zh, ja, ko
Cloi Llythyren
Chatterbox
Clonio llais zero-shot o'r radd flaenaf gyda rheoli teimladau o Resemble AI.
Ieithoedd: en
Cloi Llythyren
Tortoise TTS
Testun-i-leferydd aml-lais wedi'i ganolbwyntio ar ansawdd gydag adeiladwaith awto-adferol.
Ieithoedd: en
Cloi Llythyren
OpenVoice
Clonio llais yn syth gyda rheoli graenus dros arddull, teimlad, a chaneuon.
Ieithoedd: en, zh, ja, ko, fr, de, es, it
Cloi Llythyren
Qwen3 TTS
TTS aml-ieithog Alibaba gyda chlonio llais, lleisiau rhagosodedig, a dylunio llais o destun.
Ieithoedd: en, zh, ja, ko, de, fr, ru, pt, es, it
Cloi Llythyren
Chatterbox Turbo
Chatterbox cyflymach gydag oedi o dan 200ms a thagiau para- ieithyddol ar gyfer chwerthin, sychder, a mwy.
Ieithoedd: en
Cloi Llythyren
VoxCPM
TTS di-tokenizer yn cynhyrchu sain 44.1kHz gyda chysondeb paragraff cyd-destun.
Ieithoedd: en, zh
Cloi Llythyren
OuteTTS
TTS wedi'i seilio ar LLM sy'n rhedeg ar CPU, GPU, neu borwr drwy llama.cpp a Transformers.js.
Ieithoedd: en
Cloi Llythyren
Pocket TTS
Model paramedr ysgafn 100M gan Kyutai gyda chlonio llais o sampl sengl. Name
Ieithoedd: en, fr
Cloi Llythyren
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Ieithoedd: en, zh, ja, ko, de, es, fr, it, ru
Cloi Llythyren
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Ieithoedd: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Cloi Llythyren
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Ieithoedd: en, zh
Cloi LlythyrenAPI Datblygwr-Arwain
API REST sy'n gydnaws â OpenAI. Un diwedd-bwynt, 22+ model. Cynhaliaeth llif ar gyfer cymwysiadau amser real.
- Fformat cydnaws â OpenAI
- Llif TTS ar gyfer rhaglenni amser real
- Prosesu batch ar gyfer swyddi mawr
- Hysbysiadau Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Prisio Syml, Tryloyw
Dechreuwch yn rhydd. Graddio wrth i chi dyfu.
Cychwynydd
500 credyd/mis
- Pob 22+ model
- 100,000 o nodau y genhedlaeth
- Clonio Llywio
Pro
2,000 credyd/mis
- Popeth yn y Cychwynydd
- Cyrchiad API
- Prosesu blaenoriaeth
Cwestiynau a Ofynnir yn Aml
Beth allwn ni ei wella? Mae eich adborth yn ein helpu i ddatrys problemau.
Dechrau Defnyddio Lleferydd AI Heddiw
Ymuno â chrewyr, datblygwyr a busnesau sy'n defnyddio TTS.ai