Free AI Texti í talName
33+ Opinn uppspretta módel, 273+ raddir, 33+ Engin reikningur krafist.
Allt sem þú þarft fyrir Voice AI
30+ verkfæri sem knúin eru af opnum AI módelum
33+ AI Voice módel
Alhliða safn af opnum uppruna TTS módel í einum vettvangi
Kokoro Frjáls
Kokoro er 82 milljón breyta texta-til-tal líkan sem kýlir vel yfir þyngdarflokki sínum. Þrátt fyrir litla stærð sína, framleiðir það ótrúlega náttúrulega og tjáningarmikla ræðu. Kokoro styður mörg tungumál, þar á meðal ensku, japönsku, kínversku og kóresku með ýmsum tjáningarmiklum raddir. Það keyrir ótrúlega hratt - framleiðir hljóð næstum 100x hraðar en rauntíma á GPU.
Best fyrir: Hágæða TTS með lágmarks leynd, straumspilunarforrit
Prófaðu ókeypis
Piper Frjáls
Piper er léttur texti-til-tal vél þróað af Rhasspy sem notar VITS og barkakýli arkitektúr.Það keyrir algerlega á CPU, sem gerir það tilvalið fyrir brún tæki, heimili sjálfvirkni, og forrit sem krefjast offline TTS.Með yfir 100 raddir yfir 30 + tungumálum, Piper skilar náttúrulega hljóðandi ræðu á rauntíma hraða jafnvel á Raspberry Pi 4.
Best fyrir: Fljótur forskoðun, aðgengi og innbyggð forrit
Prófaðu ókeypis
VITS Frjáls
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) er samsíða enda-til-enda TTS aðferð sem býr til meira náttúrulegt hljóma hljóð en núverandi tveggja stigs módel.Það samþykkir breytilegt ályktun aukið með eðlilegum flæði og andstæða þjálfunarferli, sem skilar verulegum framförum í náttúruleika.
Best fyrir: Texti-í-tal fyrir almenna notkun með náttúrulegri orðræðu
Prófaðu ókeypis
MeloTTS Frjáls
MeloTTS eftir MyShell.ai er fjöltyngd TTS bókasafn sem styður ensku (Ameríku, Bretlandi, Indlandi, Ástralíu), spænsku, frönsku, kínversku, japönsku og kóresku. Það er mjög hratt, vinnsla texta á nánast rauntíma hraða á CPU eingöngu. MeloTTS er hannað til framleiðslunotkunar og styður bæði CPU og GPU ályktun.
Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS
Prófaðu ókeypis
Kani TTS 2 Frjáls
Kani-TTS-2 eftir NineNineSix er öfgafullur léttur 400M breytu líkan byggt á Liquid AI LFM2 bakgrunni með NVIDIA NanoCodec. Það keyrir í aðeins 3GB VRAM og framleiðir ~ 10 sekúndur af ræðu á ~ 2 sekúndum á A100 (RTF 0.2). Núverandi opinbera útgáfa skiptir aðeins ensku `kani-tts-2-en` skoðunarstað og afhjúpar ekki hátalara-embed krókinn sem þarf til raddklónunar - notaðu Chatterbox / IndexTTS2 / F5-TTS til klónunar eða Kokoro / MeloTTS fyrir ekki ensku.
Best fyrir: Fast English kynslóð á lágmarks VRAM vélbúnaði, fljótur forskoðun
Prófaðu ókeypis
OuteTTS Frjáls
OuteTTS stækkar stór tungumál líkan með texta-til-tal getu en varðveita upprunalega arkitektúr. Það styður margar bakenda þar á meðal llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, og jafnvel vafra ályktun í gegnum Transformers.js.
Best fyrir: Edge dreifing, vafra-undirstaða TTS, lágmarks umhverfi
Prófaðu ókeypis
Pocket TTS Frjáls
Pocket TTS eftir Kyutai (hönnuðir Moshi) er samþætt 100M breytu texta-til-tal líkan sem kýlir vel yfir þyngd þess. Það keyrir á skilvirkan hátt á CPU, styður núll-skot rödd klónun frá einum hljóð sýni, og framleiðir náttúrulega hljóma ræðu.
Best fyrir: Létt dreifing, CPU-aðeins umhverfi, fljótur rödd klónun
Prófaðu ókeypis
Kitten TTS Frjáls
Kitten TTS frá KittenML er mjög létt texta-í-tal líkan byggt á ONNX. Með afbrigðum frá 15M til 80M breytur (25-80 MB á disknum), það skilar hágæða rödd myndun á CPU án þess að þurfa GPU. Lögun 8 innbyggð raddir, stillanleg tal hraða og innbyggður texti forvinnslu fyrir tölur, gjaldmiðla og einingar. Tilvalið fyrir brún dreifingu og lág-leynd forrit.
Best fyrir: Fljótur léttur TTS, brún dreifing, lágmarks leynd forrit
Prófaðu ókeypis
Ming-Omni TTS Frjáls
Ming-omni-tts-0.5B eftir inclusionAI er samþætt omni-modal tal líkan byggt á BailingMM þéttum bak við Patch-by-Patch flæði-samsvarandi hljóð afkóðari.Býr 44.1kHz framleiðsla (nær CD gæði), styður núll-skot rödd klónun frá 3 + sekúndu tilvísun, og inniheldur innbyggt tilfinning / mállýsku / BGM stjórna með JSON leiðbeiningar.Frábær stöðugleiki - 0,83% WER á kínverskum viðmiðunum.
Best fyrir: High-trúmennska tvítyngd frásögn, tilfinningalega stjórnað rödd leika, kínverska hljóðbók efni
Prófaðu ókeypis
MOSS-TTS Nano Frjáls
MOSS-TTS-Nano-100M er samþætt 100M-breytu afbrigði OpenMOSS af MOSS-TTS fjölskyldunni, sem deilir töf-spennu arkitektúr. Skiptir hámarksgæðum 8B líkansins fyrir ~ 80x minni þyngd og verulega lægri VRAM á beiðni, sem gerir það hentugur fyrir frjáls-lag og há-flæði dreifingu.
Best fyrir: Free-tier TTS, framleiðsla í miklu magni, gagnvirk notkun með litlum leynd
Prófaðu ókeypis
Bark Sjálfgefið
Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.
Forritari: Suno · Leyfi: MIT
Prófaðu það
Bark Small Sjálfgefið
Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.
Forritari: Suno · Leyfi: MIT
Prófaðu það
CosyVoice 2 Sjálfgefið
Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.
Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0
Prófaðu það
Dia TTS Sjálfgefið
Multi-hátalara samtal kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.
Forritari: Nari Labs · Leyfi: Apache 2.0
Prófaðu það
Parler TTS Sjálfgefið
Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.
Forritari: Hugging Face · Leyfi: Apache 2.0
Prófaðu það
IndexTTS-2 Sjálfgefið
Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.
Forritari: Index Team · Leyfi: Bilibili Model License
Prófaðu það
Spark TTS Sjálfgefið
Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.
Forritari: SparkAudio · Leyfi: CC BY-NC-SA 4.0
Prófaðu það
GPT-SoVITS Sjálfgefið
Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.
Forritari: RVC-Boss · Leyfi: MIT
Prófaðu það
Orpheus Sjálfgefið
Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.
Forritari: Canopy Labs · Leyfi: Llama 3.2 Community
Prófaðu það
Qwen3 TTS Sjálfgefið
Fjöltyng TTS Fjarvistarsönnun með forstilltum raddir og raddhönnun úr texta.
Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0
Prófaðu það
VieNeu-TTS-v2 Sjálfgefið
Víetnamska + enska kóðaskipti TTS með 7 forstilltum raddum og núll-skot radd klónun. CPU-aðeins, engin GPU krafist.
Forritari: Phạm Nguyễn Ngọc Bảo · Leyfi: Apache 2.0
Prófaðu það
Chatterbox Turbo Sjálfgefið
Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.
Forritari: Resemble AI · Leyfi: MIT
Prófaðu það
VoxCPM Sjálfgefið
Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.
Forritari: OpenBMB · Leyfi: Apache 2.0
Prófaðu það
VibeVoice Sjálfgefið
Microsoft líkan fyrir efni í langri mynd með mörgum hátölurum eins og podcast og hljóðbækur.
Forritari: Microsoft · Leyfi: MIT
Prófaðu það
CosyVoice3 Sjálfgefið
Næsta kynslóð fjöltyngdar TTS með tvískiptri straumspilun, tilfinningastjórnun og núll-skot raddklónun.
Forritari: Alibaba (FunAudioLLM) · Leyfi: Apache 2.0
Prófaðu það
NAMAA Saudi TTS Sjálfgefið
Fyrsta opna Saudi-Arabía TTS. Native Saudi mállýska með Chatterbox-gæði rödd klónun.
Forritari: NAMAA Space · Leyfi: MIT
Prófaðu það
Darwin TTS Sjálfgefið
Cross-modal Qwen3-TTS afbrigði með FFN þyngd blandað úr Qwen3-1.7B tungumál líkan fyrir skarpari fjöltyngd klónun.
Forritari: FINAL-Bench · Leyfi: Apache 2.0
Prófaðu það
MOSS-TTSD Sjálfgefið
Multi-hátalara samræður áframhaldandi líkan - búa podcast-stíl samtöl með allt að 5 hátalara og 60 mínútur af samfelldu hljóði.
Forritari: OpenMOSS · Leyfi: Apache 2.0
Prófaðu það
CosyVoice 2
Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.
Tungumál: en, zh, ja, ko, fr, de, it, es
Klóna rödd
IndexTTS-2
Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.
Tungumál: en, zh
Klóna rödd
Spark TTS
Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.
Tungumál: en, zh
Klóna rödd
GPT-SoVITS
Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.
Tungumál: en, zh, ja, ko
Klóna rödd
Chatterbox
State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.
Tungumál: en
Klóna rödd
Tortoise TTS
Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.
Tungumál: en
Klóna rödd
OpenVoice
Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.
Tungumál: en, zh, ja, ko, fr, es
Klóna rödd
VieNeu-TTS-v2
Víetnamska + enska kóðaskipti TTS með 7 forstilltum raddum og núll-skot radd klónun. CPU-aðeins, engin GPU krafist.
Tungumál: vi, en
Klóna rödd
Chatterbox Turbo
Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.
Tungumál: en
Klóna rödd
VoxCPM
Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.
Tungumál: en, zh
Klóna rödd
OuteTTS
LLM-undirstaða TTS sem keyrir á CPU, GPU, eða vafra í gegnum llama.cpp og Transformers.js.
Tungumál: en
Klóna rödd
Pocket TTS
Léttur 100M breytu líkan með Kyutai með rödd klónun úr einu sýni.
Tungumál: en, fr
Klóna rödd
CosyVoice3
Næsta kynslóð fjöltyngdar TTS með tvískiptri straumspilun, tilfinningastjórnun og núll-skot raddklónun.
Tungumál: en, zh, ja, ko, de, es, fr, it, ru
Klóna rödd
NAMAA Saudi TTS
Fyrsta opna Saudi-Arabía TTS. Native Saudi mállýska með Chatterbox-gæði rödd klónun.
Tungumál: ar
Klóna rödd
Darwin TTS
Cross-modal Qwen3-TTS afbrigði með FFN þyngd blandað úr Qwen3-1.7B tungumál líkan fyrir skarpari fjöltyngd klónun.
Tungumál: en, ko, ja, zh
Klóna rödd
MOSS-TTSD
Multi-hátalara samræður áframhaldandi líkan - búa podcast-stíl samtöl með allt að 5 hátalara og 60 mínútur af samfelldu hljóði.
Tungumál: en, zh
Klóna rödd
Ming-Omni TTS
Compact 0.5B omni-modal tal líkan frá inclusionAI með hár-trúverðugleiki 44.1kHz framleiðsla og núll-skot rödd klónun.
Tungumál: en, zh
Klóna rödd
MOSS-TTS Nano
Tiny 100M MOSS-TTS afbrigði - sama arkitektúr, 80x minni, frjáls-tier leynd.
Tungumál: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Klóna röddDeveloper-First API
OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.
- OpenAI-samhæft snið
- Streaming TTS fyrir rauntíma forrit
- Hópvinnsla fyrir stór störf
- Webhook tilkynningar
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Einföld, gagnsæ verðlagning
Byrjaðu ókeypis. Scale eins og þú vex.
Frjáls
15.000 stafir + 5.000/dag
- 7 ókeypis módel þar á meðal Kokoro
- 5.000 stafir á kynslóð
- API aðgangur innifalinn
Pro
2.000 einingar / mánuður
- Allt í Starter
- API aðgangur
- Forgangsvinnsla
Algengar spurningar (FAQ)
Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.
Byrjaðu að nota AI Voice í dag
Taka þátt í höfundum, verktaki og fyrirtækjum með TTS.ai