Frjáls AI Texti í talName

20+ Opinn uppspretta módel, 107+ raddir, 32+ Engin reikningur krafist.

1K+
Höfundar
2K+
kynslóðir
20+
AI módel
107+
raddir
0/500 stafir Frjáls
Eins og TTS.ai? Segðu vinum þínum!

Allt sem þú þarft fyrir Voice AI

30+ verkfæri sem knúin eru af opnum AI módelum

20+ AI Voice módel

Alhliða safn af opnum uppruna TTS módel í einum vettvangi

KokoroKokoro Free

Kokoro er 82 milljón breyta texta-til-tal líkan sem kýlir vel yfir þyngdarflokki sínum. Þrátt fyrir litla stærð sína framleiðir það ótrúlega náttúrulega og tjáningarmikla ræðu. Kokoro styður mörg tungumál, þar á meðal ensku, japönsku, kínversku og kóresku með ýmsum tjáningarmiklum röddum. Það keyrir ótrúlega hratt - býr til hljóð næstum 100x hraðar en í rauntíma á GPU.

Best fyrir: Hágæða TTS með lágmarks leynd, straumspilunarforrit

Prófaðu ókeypis

PiperPiper Free

Piper er léttur texti-til-tal vél þróað af Rhasspy sem notar VITS og barkakýli arkitektúr.Það keyrir algerlega á CPU, sem gerir það tilvalið fyrir brún tæki, heimili sjálfvirkni, og forrit sem krefjast offline TTS.Með yfir 100 raddir yfir 30 + tungumálum, Piper skilar náttúrulega hljóðandi ræðu á rauntíma hraða jafnvel á Raspberry Pi 4.

Best fyrir: Fljótur forskoðun, aðgengi og innbyggð forrit

Prófaðu ókeypis

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) er samsíða enda-til-enda TTS aðferð sem býr til meira náttúrulega hljóma hljóð en núverandi tveggja stigs módel.Það samþykkir afbrigðilega ályktun aukin með eðlilegu flæði og andstæða þjálfunarferli, sem skilar verulegum framförum í náttúruleika.

Best fyrir: Texti-í-tal fyrir almenna notkun með náttúrulegri málfræði

Prófaðu ókeypis

MeloTTSMeloTTS Free

MeloTTS eftir MyShell.ai er fjöltyngd TTS bókasafn sem styður ensku (Ameríku, Bretlandi, Indlandi, Ástralíu), spænsku, frönsku, kínversku, japönsku og kóresku. Það er mjög hratt, vinnsla texta á nánast rauntíma hraða á CPU eingöngu. MeloTTS er hannað fyrir framleiðslu notkun og styður bæði CPU og GPU ályktun.

Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS

Prófaðu ókeypis

BarkBark Standard

Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.

Forritari: Suno · Leyfi: MIT

Prófaðu það

Bark SmallBark Small Standard

Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.

Forritari: Suno · Leyfi: MIT

Prófaðu það

CosyVoice 2CosyVoice 2 Standard

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0

Prófaðu það

Dia TTSDia TTS Standard

Multi-hátalara samræða kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.

Forritari: Nari Labs · Leyfi: Apache 2.0

Prófaðu það

Parler TTSParler TTS Standard

Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.

Forritari: Hugging Face · Leyfi: Apache 2.0

Prófaðu það

GLM-TTSGLM-TTS Standard

Ná lægsta staf villa hlutfall meðal opnum uppruna TTS módel.

Forritari: Zhipu AI · Leyfi: GLM-4 License

Prófaðu það

IndexTTS-2IndexTTS-2 Standard

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Forritari: Index Team · Leyfi: Bilibili Model License

Prófaðu það

Spark TTSSpark TTS Standard

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

Forritari: SparkAudio · Leyfi: CC BY-NC-SA 4.0

Prófaðu það

GPT-SoVITSGPT-SoVITS Standard

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Forritari: RVC-Boss · Leyfi: MIT

Prófaðu það

OrpheusOrpheus Standard

Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.

Forritari: Canopy Labs · Leyfi: Llama 3.2 Community

Prófaðu það

Qwen3 TTSQwen3 TTS Standard

Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.

Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0

Prófaðu það

ChatterboxChatterbox Premium

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Gæði:

Prófaðu það

Tortoise TTSTortoise TTS Premium

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Gæði:

Prófaðu það

StyleTTS 2StyleTTS 2 Premium

Human-stigi texta-til-tal í gegnum stíl dreifingu og andstæðingur-þjálfun.

Gæði:

Prófaðu það

OpenVoiceOpenVoice Premium

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Gæði:

Prófaðu það

Sesame CSMSesame CSM Premium

Samtals tal líkan sem býr til náttúrulega samræður með viðeigandi tímasetningu og tilfinningar.

Gæði:

Prófaðu það

CosyVoice 2CosyVoice 2

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Tungumál: en, zh, ja, ko, fr, de, it, es

Klóna rödd

GLM-TTSGLM-TTS

Ná lægsta staf villa hlutfall meðal opnum uppruna TTS módel.

Tungumál: en, zh

Klóna rödd

IndexTTS-2IndexTTS-2

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Tungumál: en, zh

Klóna rödd

Spark TTSSpark TTS

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

Tungumál: en, zh

Klóna rödd

GPT-SoVITSGPT-SoVITS

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Tungumál: en, zh, ja, ko

Klóna rödd

ChatterboxChatterbox

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Tungumál: en

Klóna rödd

Tortoise TTSTortoise TTS

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Tungumál: en

Klóna rödd

OpenVoiceOpenVoice

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Tungumál: en, zh, ja, ko, fr, de, es, it

Klóna rödd

Qwen3 TTSQwen3 TTS

Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.

Tungumál: en, zh, ja, ko, de, fr, ru, pt, es, it

Klóna rödd

Developer-First API

OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.

  • OpenAI-samhæft snið
  • Streaming TTS fyrir rauntíma forrit
  • Hópvinnsla fyrir stór störf
  • Webhook tilkynningar
Skoða API skjöl
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Einföld, gagnsæ verðlagning

Byrjaðu ókeypis. Scale eins og þú vex.

Frjáls

$0

15 stig

  • Kokoro, Piper, VITS, MeloTTS
  • 500 stafa takmörk
  • 3 gen/klukkustund (enginn reikningur)
Skráðu þig ókeypis

Ræsir

$9/mánuðir

500 einingar / mánuður

  • Öll 22+ módel
  • 100,000 chars per generation
  • Raddklónun
Byrjaðu
Vinsælasta

Pro

$29/mánuðir

2.000 einingar / mánuður

  • Allt í Starter
  • API aðgangur
  • Forgangsvinnsla
Fáðu Pro

Viðskipti

$99/mánuðir

10.000 einingar / mánuður

  • Allt í Pro
  • Magn API
  • Forgangsröð
Fá fyrirtæki

Skoða allar áætlanir þ.mt stafapakka →

Algengar spurningar (FAQ)

TTS.ai er alhliða AI rödd vettvangur, sem býður upp á 22 + texta-til-tal módel, rödd klónun, tal-til-texta, og hljóð verkfæri.Allar gerðir eru opinn uppspretta án söluaðila læsa í.

Já! TTS.ai býður upp á ókeypis texta til tals með Kokoro, Piper, VITS og MeloTTS módelum. Engin reikningur krafist. Skráðu þig til að fá 15.000 ókeypis stafi og aðgang að öllum gerðum. Greiddar áætlanir byrja á $ 9 / mánuði.

Til að fá hraða, notaðu Kokoro eða Piper. Fyrir gæði, reyndu CosyVoice 2 eða StyleTTS 2. Til að klóna rödd, notaðu Chatterbox eða GPT- SoVITS. Fyrir samtal, notaðu Dia TTS. Prófaðu mörg módel á sama texta til að bera saman.

Já. OpenAI-samhæft REST API fyrir TTS, STT, rödd klónun og hljóð verkfæri. Laus á Pro ($ 29 / mo) og Enterprise ($ 99 / mo) áætlanir. Skoða skjöl á tts.ai / api /.

Premium módel eins og CosyVoice 2, StyleTTS 2 og Chatterbox framleiða nánast mannleg gæði ræðu með náttúrulegum tónum og tilfinningum. Frjáls módel eins og Kokoro bjóða upp á framúrskarandi gæði fyrir flest notkunartilfelli.

TTS.ai styður 30 + tungumál yfir líkan bókasafn sitt.Enska hefur breiðasta líkan stuðning, en módel eins og CosyVoice 2 ná kínversku, japönsku og kóresku; GPT-SoVITS meðhöndlar kínversku, japönsku, kóresku og ensku; og MeloTTS styður ensku, spænsku, frönsku, kínversku, japönsku og kóresku.

Já. Öll vinnsla fer fram á sérstökum GPU netþjónum okkar. Við geymum ekki texta innslátt eða myndað hljóð eftir afhendingu. Hlaðið upp raddsýni fyrir klónun er aðeins notað fyrir núverandi setu og er ekki haldið. Við deilum aldrei gögnum þínum með þriðja aðila eða notum það til að þjálfa módel.

Já. Allt hljóð sem myndast á TTS.ai er þitt að nota í atvinnuskyni, þar á meðal fyrir YouTube myndbönd, podcast, hljóðbækur, forrit, auglýsingar og vörur. Líkön okkar eru opinn uppspretta undir leyfilegum leyfum (MIT, Apache 2.0).

TTS.ai býr til hljóð í WAV sniði sjálfgefið fyrir hámarks gæði.Þú getur breytt í MP3, FLAC, OGG eða M4A með því að nota ókeypis Audio Converter tól okkar.API styður að tilgreina valinn framleiðsla snið beint í beiðni.

Hladdu upp stuttu hljóðsýni (eins lítið og 5 sekúndur) af röddinni sem þú vilt klóna, sláðu síðan inn hvaða texta sem er til að búa til tal í þeirri rödd. Gerðir eins og Chatterbox, GPT-SoVITS og CosyVoice 2 styðja raddklónun. Klónað rödd tekur tóninn, hreim og talarstíl.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) þurfa ekki reikning og kosta núll stafi. Standard módel (2.000 stafir / 1K inntak) eru Bark, CosyVoice 2, F5-TTS og Dia. Premium módel (4.000 stafir / 1K inntak) eru OpenVoice, Chatterbox, StyleTTS 2 og Tortoise. Greidd módel bjóða yfirleitt hærri gæði, fleiri raddir og viðbótaraðgerðir eins og raddklónun.

Já. API styður lotuvinnslu til að umbreyta miklu magni af texta í tal. Sendu inn margar beiðnir og sækja niðurstöður ósamstillt með því að nota vinnu UUID. Enterprise áætlanir ($ 99 / mo) fela í sér forgangsröðunaraðgang fyrir hraðari lotuvinnslu. Tilvalið fyrir hljóðbókaframleiðslu, námskeiðsefni og stórfelld röddverkefni.
4.0/5 (8)

Byrjaðu að nota AI Voice í dag

Taka þátt í höfundum, verktaki og fyrirtækjum með TTS.ai