Free AI Texti í talName

31+ Opinn uppspretta módel, 231+ raddir, 34+ Engin reikningur krafist.

8K+
Höfundar
30K+
kynslóðir
31+
AI módel
231+
raddir
0/500 stafir · Sign up for 5,000 per generation → Frjáls
Elska TTS.ai? Segðu vinum þínum!

Allt sem þú þarft fyrir Voice AI

30+ verkfæri sem knúin eru af opnum AI módelum

31+ AI Voice módel

Alhliða safn af opnum uppruna TTS módel í einum vettvangi

KokoroKokoro Frjáls

Kokoro er 82 milljón breyta texta-til-tal líkan sem kýlir vel yfir þyngdarflokki sínum. Þrátt fyrir litla stærð sína, framleiðir það ótrúlega náttúrulega og tjáningarmikla ræðu. Kokoro styður mörg tungumál, þar á meðal ensku, japönsku, kínversku og kóresku með ýmsum tjáningarmiklum raddir. Það keyrir ótrúlega hratt - framleiðir hljóð næstum 100x hraðar en rauntíma á GPU.

Best fyrir: Hágæða TTS með lágmarks leynd, straumspilunarforrit

Prófaðu ókeypis

PiperPiper Frjáls

Piper er léttur texti-til-tal vél þróað af Rhasspy sem notar VITS og barkakýli arkitektúr.Það keyrir algerlega á CPU, sem gerir það tilvalið fyrir brún tæki, heimili sjálfvirkni, og forrit sem krefjast offline TTS.Með yfir 100 raddir yfir 30 + tungumálum, Piper skilar náttúrulega hljóðandi ræðu á rauntíma hraða jafnvel á Raspberry Pi 4.

Best fyrir: Fljótur forskoðun, aðgengi og innbyggð forrit

Prófaðu ókeypis

VITSVITS Frjáls

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) er samsíða enda-til-enda TTS aðferð sem býr til meira náttúrulegt hljóma hljóð en núverandi tveggja stigs módel.Það samþykkir breytilegt ályktun aukið með eðlilegum flæði og andstæða þjálfunarferli, sem skilar verulegum framförum í náttúruleika.

Best fyrir: Texti-í-tal fyrir almenna notkun með náttúrulegri orðræðu

Prófaðu ókeypis

MeloTTSMeloTTS Frjáls

MeloTTS eftir MyShell.ai er fjöltyngd TTS bókasafn sem styður ensku (Ameríku, Bretlandi, Indlandi, Ástralíu), spænsku, frönsku, kínversku, japönsku og kóresku. Það er mjög hratt, vinnsla texta á nánast rauntíma hraða á CPU eingöngu. MeloTTS er hannað til framleiðslunotkunar og styður bæði CPU og GPU ályktun.

Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS

Prófaðu ókeypis

OuteTTSOuteTTS Frjáls

OuteTTS stækkar stór tungumál líkan með texta-til-tal getu en varðveita upprunalega arkitektúr. Það styður margar bakenda þar á meðal llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, og jafnvel vafra ályktun í gegnum Transformers.js.

Best fyrir: Edge dreifing, vafra-undirstaða TTS, lágmarks umhverfi

Prófaðu ókeypis

Pocket TTSPocket TTS Frjáls

Pocket TTS eftir Kyutai (hönnuðir Moshi) er samþætt 100M breytu texta-til-tal líkan sem kýlir vel yfir þyngd þess. Það keyrir á skilvirkan hátt á CPU, styður núll-skot rödd klónun frá einum hljóð sýni, og framleiðir náttúrulega hljóma ræðu.

Best fyrir: Létt dreifing, CPU-aðeins umhverfi, fljótur rödd klónun

Prófaðu ókeypis

Kitten TTSKitten TTS Frjáls

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Best fyrir: Fast lightweight TTS, edge deployment, low-latency applications

Prófaðu ókeypis

BarkBark Sjálfgefið

Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.

Forritari: Suno · Leyfi: MIT

Prófaðu það

Bark SmallBark Small Sjálfgefið

Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.

Forritari: Suno · Leyfi: MIT

Prófaðu það

CosyVoice 2CosyVoice 2 Sjálfgefið

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0

Prófaðu það

Dia TTSDia TTS Sjálfgefið

Multi-hátalara samtal kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.

Forritari: Nari Labs · Leyfi: Apache 2.0

Prófaðu það

Parler TTSParler TTS Sjálfgefið

Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.

Forritari: Hugging Face · Leyfi: Apache 2.0

Prófaðu það

GLM-TTSGLM-TTS Sjálfgefið

Ná lægsta staf villa hlutfall meðal opnum uppruna TTS módel.

Forritari: Zhipu AI · Leyfi: GLM-4 License

Prófaðu það

IndexTTS-2IndexTTS-2 Sjálfgefið

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Forritari: Index Team · Leyfi: Bilibili Model License

Prófaðu það

Spark TTSSpark TTS Sjálfgefið

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

Forritari: SparkAudio · Leyfi: CC BY-NC-SA 4.0

Prófaðu það

GPT-SoVITSGPT-SoVITS Sjálfgefið

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Forritari: RVC-Boss · Leyfi: MIT

Prófaðu það

OrpheusOrpheus Sjálfgefið

Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.

Forritari: Canopy Labs · Leyfi: Llama 3.2 Community

Prófaðu það

Qwen3 TTSQwen3 TTS Sjálfgefið

Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.

Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0

Prófaðu það

Chatterbox TurboChatterbox Turbo Sjálfgefið

Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.

Forritari: Resemble AI · Leyfi: MIT

Prófaðu það

Dia 2Dia 2 Sjálfgefið

Streaming-fyrsta samtals TTS með multi-hátalara samtal og paralinguistic vísbendingu.

Forritari: Nari Labs · Leyfi: Apache 2.0

Prófaðu það

VoxCPMVoxCPM Sjálfgefið

Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.

Forritari: OpenBMB · Leyfi: Apache 2.0

Prófaðu það

TADATADA Sjálfgefið

Zero-ofskynjanir TTS með texta-acoustic tvískiptur samræmingu, 5x hraðar en sambærileg LLM TTS.

Forritari: Hume AI · Leyfi: MIT

Prófaðu það

VibeVoiceVibeVoice Sjálfgefið

Microsoft líkan fyrir efni í langri mynd með mörgum hátölurum eins og podcast og hljóðbækur.

Forritari: Microsoft · Leyfi: MIT

Prófaðu það

CosyVoice3CosyVoice3 Sjálfgefið

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Forritari: Alibaba (FunAudioLLM) · Leyfi: Apache 2.0

Prófaðu það

ChatterboxChatterbox Premium

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Gæði:

Prófaðu það

Tortoise TTSTortoise TTS Premium

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Gæði:

Prófaðu það

StyleTTS 2StyleTTS 2 Premium

Human-stigi texta-til-tal í gegnum stíl dreifingu og andstæðingur-þjálfun.

Gæði:

Prófaðu það

OpenVoiceOpenVoice Premium

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Gæði:

Prófaðu það

Sesame CSMSesame CSM Premium

Samtals tal líkan sem býr til náttúrulega samræður með viðeigandi tímasetningu og tilfinningar.

Gæði:

Prófaðu það

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Gæði:

Prófaðu það

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Gæði:

Prófaðu það

CosyVoice 2CosyVoice 2

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Tungumál: en, zh, ja, ko, fr, de, it, es

Klóna rödd

GLM-TTSGLM-TTS

Ná lægsta staf villa hlutfall meðal opnum uppruna TTS módel.

Tungumál: en, zh

Klóna rödd

IndexTTS-2IndexTTS-2

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Tungumál: en, zh

Klóna rödd

Spark TTSSpark TTS

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

Tungumál: en, zh

Klóna rödd

GPT-SoVITSGPT-SoVITS

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Tungumál: en, zh, ja, ko

Klóna rödd

ChatterboxChatterbox

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Tungumál: en

Klóna rödd

Tortoise TTSTortoise TTS

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Tungumál: en

Klóna rödd

OpenVoiceOpenVoice

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Tungumál: en, zh, ja, ko, fr, de, es, it

Klóna rödd

Qwen3 TTSQwen3 TTS

Fjöltyng TTS Fjarvistarsönnunar með raddklónun, forstilltum raddum og raddhönnun úr texta.

Tungumál: en, zh, ja, ko, de, fr, ru, pt, es, it

Klóna rödd

Chatterbox TurboChatterbox Turbo

Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.

Tungumál: en

Klóna rödd

VoxCPMVoxCPM

Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.

Tungumál: en, zh

Klóna rödd

OuteTTSOuteTTS

LLM-undirstaða TTS sem keyrir á CPU, GPU, eða vafra í gegnum llama.cpp og Transformers.js.

Tungumál: en

Klóna rödd

Pocket TTSPocket TTS

Léttur 100M breytu líkan með Kyutai með rödd klónun úr einu sýni.

Tungumál: en, fr

Klóna rödd

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Tungumál: en, zh, ja, ko, de, es, fr, it, ru

Klóna rödd

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Tungumál: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Klóna rödd

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Tungumál: en, zh

Klóna rödd

Developer-First API

OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.

  • OpenAI-samhæft snið
  • Streaming TTS fyrir rauntíma forrit
  • Hópvinnsla fyrir stór störf
  • Webhook tilkynningar
Skoða API skjöl
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Einföld, gagnsæ verðlagning

Byrjaðu ókeypis. Scale eins og þú vex.

Frjáls

$0

15 stig

  • Kokoro, Piper, VITS, MeloTTS
  • 500 stafa takmörk
  • 3 gen/klukkustund (enginn reikningur)
Skráðu þig ókeypis

Ræsir

$9/mánuðir

500 einingar / mánuður

  • Öll 22+ módel
  • 100.000 stafir á kynslóð
  • Raddklónun
Byrjaðu
Vinsælasta

Pro

$29/mánuðir

2.000 einingar / mánuður

  • Allt í Starter
  • API aðgangur
  • Forgangsvinnsla
Fáðu Pro

Viðskipti

$99/mánuðir

10.000 einingar / mánuður

  • Allt í Pro
  • Magn API
  • Forgangsröð
Fá fyrirtæki

Skoða allar áætlanir þ.mt stafapakka →

Algengar spurningar (FAQ)

TTS.ai er alhliða AI rödd vettvangur, sem býður upp á 22 + texta-til-tal módel, radd klónun, tal-til-texta og hljóð verkfæri.Allar gerðir eru opinn uppspretta með enga söluaðila læsa í.

Já! TTS.ai býður upp á ókeypis texta til tals með Kokoro, Piper, VITS og MeloTTS módelum. Engin reikningur krafist. Skráðu þig til að fá 15.000 ókeypis stafi og aðgang að öllum gerðum. Greiddar áætlanir byrja á $ 9 / mánuði.

Til að fá hraða, notaðu Kokoro eða Piper. Fyrir gæði, reyndu CosyVoice 2 eða StyleTTS 2. Til að klóna rödd, notaðu Chatterbox eða GPT- SoVITS. Fyrir samtal, notaðu Dia TTS. Prófaðu mörg módel á sama texta til að bera saman.

Já. OpenAI-samhæft REST API fyrir TTS, STT, raddklónun og hljóðverkfæri. Fáanlegt á Pro ($ 29 / mo) og Enterprise ($ 99 / mo) áætlunum. Skoða skjöl á tts.ai / api /.

Premium módel eins og CosyVoice 2, StyleTTS 2 og Chatterbox framleiða nánast mannleg gæði ræðu með náttúrulegum tónum og tilfinningum. Frjáls módel eins og Kokoro bjóða upp á framúrskarandi gæði fyrir flest notkunartilfelli.

TTS.ai styður 30+ tungumál í gegnum líkan bókasafn sitt.Enska hefur breiðasta líkan stuðning, en módel eins og CosyVoice 2 ná yfir kínversku, japönsku og kóresku; GPT-SoVITS meðhöndlar kínversku, japönsku, kóresku og ensku; og MeloTTS styður ensku, spænsku, frönsku, kínversku, japönsku og kóresku.

Já. Öll vinnsla fer fram á sérstökum GPU netþjónum okkar. Við geymum ekki texta innslátt eða myndað hljóð eftir afhendingu. Hlaðið upp raddsýni fyrir klónun er aðeins notað fyrir núverandi setu og er ekki haldið. Við deilum aldrei gögnum þínum með þriðja aðila eða notum það til að þjálfa módel.

Já. Allt hljóð sem myndast á TTS.ai er þitt að nota í atvinnuskyni, þar á meðal fyrir YouTube myndbönd, podcast, hljóðbækur, forrit, auglýsingar og vörur. Líkön okkar eru opinn uppspretta undir leyfilegum leyfum (MIT, Apache 2.0).

TTS.ai býr sjálfkrafa til hljóð í WAV sniði fyrir hámarksgæði. Þú getur breytt í MP3, FLAC, OGG eða M4A með því að nota ókeypis hljóðbreytitólið okkar. API styður að tilgreina valinn framleiðsla snið beint í beiðninni.

Hladdu upp stuttu hljóðsýni (eins lítið og 5 sekúndur) af röddinni sem þú vilt klóna, sláðu síðan inn hvaða texta sem er til að búa til tal í þeirri rödd. Gerðir eins og Chatterbox, GPT-SoVITS og CosyVoice 2 styðja raddklónun. Klónað rödd tekur tóninn, hreim og talarstíl.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) þurfa ekki reikning og kosta núll stafi. Standard módel (2.000 stafir / 1K inntak) eru Bark, CosyVoice 2, F5-TTS og Dia. Premium módel (4.000 stafir / 1K inntak) eru OpenVoice, Chatterbox, StyleTTS 2 og Tortoise. Greidd módel bjóða yfirleitt hærri gæði, fleiri raddir og viðbótaraðgerðir eins og raddklónun.

Já. API styður lotuvinnslu til að umbreyta miklu magni af texta í tal. Sendu inn margar beiðnir og sækja niðurstöður ósamstillt með því að nota vinnu UUID. Enterprise áætlanir ($ 99 / mo) fela í sér forgangsröðunaraðgang fyrir hraðari lotuvinnslu. Tilvalið fyrir hljóðbókaframleiðslu, námskeiðsefni og stórfelld röddverkefni.
4.1/5 (21)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Byrjaðu að nota AI Voice í dag

Taka þátt í höfundum, verktaki og fyrirtækjum með TTS.ai