Free AI Texti í talName
31+ Opinn uppspretta módel, 231+ raddir, 34+ Engin reikningur krafist.
Allt sem þú þarft fyrir Voice AI
30+ verkfæri sem knúin eru af opnum AI módelum
31+ AI Voice módel
Alhliða safn af opnum uppruna TTS módel í einum vettvangi
Kokoro Frjáls
Kokoro er 82 milljón breyta texta-til-tal líkan sem kýlir vel yfir þyngdarflokki sínum. Þrátt fyrir litla stærð sína, framleiðir það ótrúlega náttúrulega og tjáningarmikla ræðu. Kokoro styður mörg tungumál, þar á meðal ensku, japönsku, kínversku og kóresku með ýmsum tjáningarmiklum raddir. Það keyrir ótrúlega hratt - framleiðir hljóð næstum 100x hraðar en rauntíma á GPU.
Best fyrir: Hágæða TTS með lágmarks leynd, straumspilunarforrit
Prófaðu ókeypis
Piper Frjáls
Piper er léttur texti-til-tal vél þróað af Rhasspy sem notar VITS og barkakýli arkitektúr.Það keyrir algerlega á CPU, sem gerir það tilvalið fyrir brún tæki, heimili sjálfvirkni, og forrit sem krefjast offline TTS.Með yfir 100 raddir yfir 30 + tungumálum, Piper skilar náttúrulega hljóðandi ræðu á rauntíma hraða jafnvel á Raspberry Pi 4.
Best fyrir: Fljótur forskoðun, aðgengi og innbyggð forrit
Prófaðu ókeypis
VITS Frjáls
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) er samsíða enda-til-enda TTS aðferð sem býr til meira náttúrulegt hljóma hljóð en núverandi tveggja stigs módel.Það samþykkir breytilegt ályktun aukið með eðlilegum flæði og andstæða þjálfunarferli, sem skilar verulegum framförum í náttúruleika.
Best fyrir: Texti-í-tal fyrir almenna notkun með náttúrulegri orðræðu
Prófaðu ókeypis
MeloTTS Frjáls
MeloTTS eftir MyShell.ai er fjöltyngd TTS bókasafn sem styður ensku (Ameríku, Bretlandi, Indlandi, Ástralíu), spænsku, frönsku, kínversku, japönsku og kóresku. Það er mjög hratt, vinnsla texta á nánast rauntíma hraða á CPU eingöngu. MeloTTS er hannað til framleiðslunotkunar og styður bæði CPU og GPU ályktun.
Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS
Prófaðu ókeypis
OuteTTS Frjáls
OuteTTS stækkar stór tungumál líkan með texta-til-tal getu en varðveita upprunalega arkitektúr. Það styður margar bakenda þar á meðal llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, og jafnvel vafra ályktun í gegnum Transformers.js.
Best fyrir: Edge dreifing, vafra-undirstaða TTS, lágmarks umhverfi
Prófaðu ókeypis
Pocket TTS Frjáls
Pocket TTS eftir Kyutai (hönnuðir Moshi) er samþætt 100M breytu texta-til-tal líkan sem kýlir vel yfir þyngd þess. Það keyrir á skilvirkan hátt á CPU, styður núll-skot rödd klónun frá einum hljóð sýni, og framleiðir náttúrulega hljóma ræðu.
Best fyrir: Létt dreifing, CPU-aðeins umhverfi, fljótur rödd klónun
Prófaðu ókeypis
Kitten TTS Frjáls
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Best fyrir: Fast lightweight TTS, edge deployment, low-latency applications
Prófaðu ókeypis
Bark Sjálfgefið
Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.
Forritari: Suno · Leyfi: MIT
Prófaðu það
Bark Small Sjálfgefið
Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.
Forritari: Suno · Leyfi: MIT
Prófaðu það
CosyVoice 2 Sjálfgefið
Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.
Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0
Prófaðu það
Dia TTS Sjálfgefið
Multi-hátalara samtal kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.
Forritari: Nari Labs · Leyfi: Apache 2.0
Prófaðu það
Parler TTS Sjálfgefið
Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.
Forritari: Hugging Face · Leyfi: Apache 2.0
Prófaðu það
GLM-TTS Sjálfgefið
Ná lægsta staf villa hlutfall meðal opnum uppruna TTS módel.
Forritari: Zhipu AI · Leyfi: GLM-4 License
Prófaðu það
IndexTTS-2 Sjálfgefið
Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.
Forritari: Index Team · Leyfi: Bilibili Model License
Prófaðu það
Spark TTS Sjálfgefið
Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.
Forritari: SparkAudio · Leyfi: CC BY-NC-SA 4.0
Prófaðu það
GPT-SoVITS Sjálfgefið
Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.
Forritari: RVC-Boss · Leyfi: MIT
Prófaðu það
Orpheus Sjálfgefið
Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.
Forritari: Canopy Labs · Leyfi: Llama 3.2 Community
Prófaðu það
Qwen3 TTS Sjálfgefið
Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.
Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0
Prófaðu það
Chatterbox Turbo Sjálfgefið
Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.
Forritari: Resemble AI · Leyfi: MIT
Prófaðu það
Dia 2 Sjálfgefið
Streaming-fyrsta samtals TTS með multi-hátalara samtal og paralinguistic vísbendingu.
Forritari: Nari Labs · Leyfi: Apache 2.0
Prófaðu það
VoxCPM Sjálfgefið
Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.
Forritari: OpenBMB · Leyfi: Apache 2.0
Prófaðu það
TADA Sjálfgefið
Zero-ofskynjanir TTS með texta-acoustic tvískiptur samræmingu, 5x hraðar en sambærileg LLM TTS.
Forritari: Hume AI · Leyfi: MIT
Prófaðu það
VibeVoice Sjálfgefið
Microsoft líkan fyrir efni í langri mynd með mörgum hátölurum eins og podcast og hljóðbækur.
Forritari: Microsoft · Leyfi: MIT
Prófaðu það
CosyVoice3 Sjálfgefið
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Forritari: Alibaba (FunAudioLLM) · Leyfi: Apache 2.0
Prófaðu það
CosyVoice 2
Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.
Tungumál: en, zh, ja, ko, fr, de, it, es
Klóna rödd
IndexTTS-2
Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.
Tungumál: en, zh
Klóna rödd
Spark TTS
Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.
Tungumál: en, zh
Klóna rödd
GPT-SoVITS
Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.
Tungumál: en, zh, ja, ko
Klóna rödd
Chatterbox
State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.
Tungumál: en
Klóna rödd
Tortoise TTS
Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.
Tungumál: en
Klóna rödd
OpenVoice
Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.
Tungumál: en, zh, ja, ko, fr, de, es, it
Klóna rödd
Qwen3 TTS
Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.
Tungumál: en, zh, ja, ko, de, fr, ru, pt, es, it
Klóna rödd
Chatterbox Turbo
Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.
Tungumál: en
Klóna rödd
VoxCPM
Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.
Tungumál: en, zh
Klóna rödd
OuteTTS
LLM-undirstaða TTS sem keyrir á CPU, GPU, eða vafra í gegnum llama.cpp og Transformers.js.
Tungumál: en
Klóna rödd
Pocket TTS
Léttur 100M breytu líkan með Kyutai með rödd klónun úr einu sýni.
Tungumál: en, fr
Klóna rödd
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Tungumál: en, zh, ja, ko, de, es, fr, it, ru
Klóna rödd
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Tungumál: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klóna rödd
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Tungumál: en, zh
Klóna röddDeveloper-First API
OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.
- OpenAI-samhæft snið
- Streaming TTS fyrir rauntíma forrit
- Hópvinnsla fyrir stór störf
- Webhook tilkynningar
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Einföld, gagnsæ verðlagning
Byrjaðu ókeypis. Scale eins og þú vex.
Frjáls
15 stig
- Kokoro, Piper, VITS, MeloTTS
- 500 stafa takmörk
- 3 gen/klukkustund (enginn reikningur)
Pro
2.000 einingar / mánuður
- Allt í Starter
- API aðgangur
- Forgangsvinnsla
Algengar spurningar (FAQ)
Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.
Byrjaðu að nota AI Voice í dag
Taka þátt í höfundum, verktaki og fyrirtækjum með TTS.ai