Frjáls AI Texti í talName
20+ Opinn uppspretta módel, 107+ raddir, 32+ Engin reikningur krafist.
Allt sem þú þarft fyrir Voice AI
30+ verkfæri sem knúin eru af opnum AI módelum
20+ AI Voice módel
Alhliða safn af opnum uppruna TTS módel í einum vettvangi
Kokoro Free
Kokoro er 82 milljón breyta texta-til-tal líkan sem kýlir vel yfir þyngdarflokki sínum. Þrátt fyrir litla stærð sína framleiðir það ótrúlega náttúrulega og tjáningarmikla ræðu. Kokoro styður mörg tungumál, þar á meðal ensku, japönsku, kínversku og kóresku með ýmsum tjáningarmiklum röddum. Það keyrir ótrúlega hratt - býr til hljóð næstum 100x hraðar en í rauntíma á GPU.
Best fyrir: Hágæða TTS með lágmarks leynd, straumspilunarforrit
Prófaðu ókeypis
Piper Free
Piper er léttur texti-til-tal vél þróað af Rhasspy sem notar VITS og barkakýli arkitektúr.Það keyrir algerlega á CPU, sem gerir það tilvalið fyrir brún tæki, heimili sjálfvirkni, og forrit sem krefjast offline TTS.Með yfir 100 raddir yfir 30 + tungumálum, Piper skilar náttúrulega hljóðandi ræðu á rauntíma hraða jafnvel á Raspberry Pi 4.
Best fyrir: Fljótur forskoðun, aðgengi og innbyggð forrit
Prófaðu ókeypis
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) er samsíða enda-til-enda TTS aðferð sem býr til meira náttúrulega hljóma hljóð en núverandi tveggja stigs módel.Það samþykkir afbrigðilega ályktun aukin með eðlilegu flæði og andstæða þjálfunarferli, sem skilar verulegum framförum í náttúruleika.
Best fyrir: Texti-í-tal fyrir almenna notkun með náttúrulegri málfræði
Prófaðu ókeypis
MeloTTS Free
MeloTTS eftir MyShell.ai er fjöltyngd TTS bókasafn sem styður ensku (Ameríku, Bretlandi, Indlandi, Ástralíu), spænsku, frönsku, kínversku, japönsku og kóresku. Það er mjög hratt, vinnsla texta á nánast rauntíma hraða á CPU eingöngu. MeloTTS er hannað fyrir framleiðslu notkun og styður bæði CPU og GPU ályktun.
Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS
Prófaðu ókeypis
Bark Standard
Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.
Forritari: Suno · Leyfi: MIT
Prófaðu það
Bark Small Standard
Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.
Forritari: Suno · Leyfi: MIT
Prófaðu það
CosyVoice 2 Standard
Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.
Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0
Prófaðu það
Dia TTS Standard
Multi-hátalara samræða kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.
Forritari: Nari Labs · Leyfi: Apache 2.0
Prófaðu það
Parler TTS Standard
Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.
Forritari: Hugging Face · Leyfi: Apache 2.0
Prófaðu það
GLM-TTS Standard
Ná lægsta staf villa hlutfall meðal opnum uppruna TTS módel.
Forritari: Zhipu AI · Leyfi: GLM-4 License
Prófaðu það
IndexTTS-2 Standard
Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.
Forritari: Index Team · Leyfi: Bilibili Model License
Prófaðu það
Spark TTS Standard
Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.
Forritari: SparkAudio · Leyfi: CC BY-NC-SA 4.0
Prófaðu það
GPT-SoVITS Standard
Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.
Forritari: RVC-Boss · Leyfi: MIT
Prófaðu það
Orpheus Standard
Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.
Forritari: Canopy Labs · Leyfi: Llama 3.2 Community
Prófaðu það
Qwen3 TTS Standard
Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.
Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0
Prófaðu það
CosyVoice 2
Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.
Tungumál: en, zh, ja, ko, fr, de, it, es
Klóna rödd
IndexTTS-2
Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.
Tungumál: en, zh
Klóna rödd
Spark TTS
Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.
Tungumál: en, zh
Klóna rödd
GPT-SoVITS
Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.
Tungumál: en, zh, ja, ko
Klóna rödd
Chatterbox
State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.
Tungumál: en
Klóna rödd
Tortoise TTS
Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.
Tungumál: en
Klóna rödd
OpenVoice
Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.
Tungumál: en, zh, ja, ko, fr, de, es, it
Klóna rödd
Qwen3 TTS
Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.
Tungumál: en, zh, ja, ko, de, fr, ru, pt, es, it
Klóna röddDeveloper-First API
OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.
- OpenAI-samhæft snið
- Streaming TTS fyrir rauntíma forrit
- Hópvinnsla fyrir stór störf
- Webhook tilkynningar
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Einföld, gagnsæ verðlagning
Byrjaðu ókeypis. Scale eins og þú vex.
Frjáls
15 stig
- Kokoro, Piper, VITS, MeloTTS
- 500 stafa takmörk
- 3 gen/klukkustund (enginn reikningur)
Ræsir
500 einingar / mánuður
- Öll 22+ módel
- 100,000 chars per generation
- Raddklónun
Pro
2.000 einingar / mánuður
- Allt í Starter
- API aðgangur
- Forgangsvinnsla
Algengar spurningar (FAQ)
Byrjaðu að nota AI Voice í dag
Taka þátt í höfundum, verktaki og fyrirtækjum með TTS.ai