Free AI Texti í talName

33+ Opinn uppspretta módel, 273+ raddir, 33+ Engin reikningur krafist.

17K+
Höfundar
70K+
kynslóðir
33+
AI módel
273+
raddir
Elska TTS.ai? Segðu vinum þínum!

Allt sem þú þarft fyrir Voice AI

30+ verkfæri sem knúin eru af opnum AI módelum

33+ AI Voice módel

Alhliða safn af opnum uppruna TTS módel í einum vettvangi

KokoroKokoro Frjáls

Kokoro er 82 milljón breyta texta-til-tal líkan sem kýlir vel yfir þyngdarflokki sínum. Þrátt fyrir litla stærð sína, framleiðir það ótrúlega náttúrulega og tjáningarmikla ræðu. Kokoro styður mörg tungumál, þar á meðal ensku, japönsku, kínversku og kóresku með ýmsum tjáningarmiklum raddir. Það keyrir ótrúlega hratt - framleiðir hljóð næstum 100x hraðar en rauntíma á GPU.

Best fyrir: Hágæða TTS með lágmarks leynd, straumspilunarforrit

Prófaðu ókeypis

PiperPiper Frjáls

Piper er léttur texti-til-tal vél þróað af Rhasspy sem notar VITS og barkakýli arkitektúr.Það keyrir algerlega á CPU, sem gerir það tilvalið fyrir brún tæki, heimili sjálfvirkni, og forrit sem krefjast offline TTS.Með yfir 100 raddir yfir 30 + tungumálum, Piper skilar náttúrulega hljóðandi ræðu á rauntíma hraða jafnvel á Raspberry Pi 4.

Best fyrir: Fljótur forskoðun, aðgengi og innbyggð forrit

Prófaðu ókeypis

VITSVITS Frjáls

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) er samsíða enda-til-enda TTS aðferð sem býr til meira náttúrulegt hljóma hljóð en núverandi tveggja stigs módel.Það samþykkir breytilegt ályktun aukið með eðlilegum flæði og andstæða þjálfunarferli, sem skilar verulegum framförum í náttúruleika.

Best fyrir: Texti-í-tal fyrir almenna notkun með náttúrulegri orðræðu

Prófaðu ókeypis

MeloTTSMeloTTS Frjáls

MeloTTS eftir MyShell.ai er fjöltyngd TTS bókasafn sem styður ensku (Ameríku, Bretlandi, Indlandi, Ástralíu), spænsku, frönsku, kínversku, japönsku og kóresku. Það er mjög hratt, vinnsla texta á nánast rauntíma hraða á CPU eingöngu. MeloTTS er hannað til framleiðslunotkunar og styður bæði CPU og GPU ályktun.

Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS

Prófaðu ókeypis

Kani TTS 2Kani TTS 2 Frjáls

Kani-TTS-2 eftir NineNineSix er öfgafullur léttur 400M breytu líkan byggt á Liquid AI LFM2 bakgrunni með NVIDIA NanoCodec. Það keyrir í aðeins 3GB VRAM og framleiðir ~ 10 sekúndur af ræðu á ~ 2 sekúndum á A100 (RTF 0.2). Núverandi opinbera útgáfa skiptir aðeins ensku `kani-tts-2-en` skoðunarstað og afhjúpar ekki hátalara-embed krókinn sem þarf til raddklónunar - notaðu Chatterbox / IndexTTS2 / F5-TTS til klónunar eða Kokoro / MeloTTS fyrir ekki ensku.

Best fyrir: Fast English kynslóð á lágmarks VRAM vélbúnaði, fljótur forskoðun

Prófaðu ókeypis

OuteTTSOuteTTS Frjáls

OuteTTS stækkar stór tungumál líkan með texta-til-tal getu en varðveita upprunalega arkitektúr. Það styður margar bakenda þar á meðal llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, og jafnvel vafra ályktun í gegnum Transformers.js.

Best fyrir: Edge dreifing, vafra-undirstaða TTS, lágmarks umhverfi

Prófaðu ókeypis

Pocket TTSPocket TTS Frjáls

Pocket TTS eftir Kyutai (hönnuðir Moshi) er samþætt 100M breytu texta-til-tal líkan sem kýlir vel yfir þyngd þess. Það keyrir á skilvirkan hátt á CPU, styður núll-skot rödd klónun frá einum hljóð sýni, og framleiðir náttúrulega hljóma ræðu.

Best fyrir: Létt dreifing, CPU-aðeins umhverfi, fljótur rödd klónun

Prófaðu ókeypis

Kitten TTSKitten TTS Frjáls

Kitten TTS frá KittenML er mjög létt texta-í-tal líkan byggt á ONNX. Með afbrigðum frá 15M til 80M breytur (25-80 MB á disknum), það skilar hágæða rödd myndun á CPU án þess að þurfa GPU. Lögun 8 innbyggð raddir, stillanleg tal hraða og innbyggður texti forvinnslu fyrir tölur, gjaldmiðla og einingar. Tilvalið fyrir brún dreifingu og lág-leynd forrit.

Best fyrir: Fljótur léttur TTS, brún dreifing, lágmarks leynd forrit

Prófaðu ókeypis

Ming-Omni TTSMing-Omni TTS Frjáls

Ming-omni-tts-0.5B eftir inclusionAI er samþætt omni-modal tal líkan byggt á BailingMM þéttum bak við Patch-by-Patch flæði-samsvarandi hljóð afkóðari.Býr 44.1kHz framleiðsla (nær CD gæði), styður núll-skot rödd klónun frá 3 + sekúndu tilvísun, og inniheldur innbyggt tilfinning / mállýsku / BGM stjórna með JSON leiðbeiningar.Frábær stöðugleiki - 0,83% WER á kínverskum viðmiðunum.

Best fyrir: High-trúmennska tvítyngd frásögn, tilfinningalega stjórnað rödd leika, kínverska hljóðbók efni

Prófaðu ókeypis

MOSS-TTS NanoMOSS-TTS Nano Frjáls

MOSS-TTS-Nano-100M er samþætt 100M-breytu afbrigði OpenMOSS af MOSS-TTS fjölskyldunni, sem deilir töf-spennu arkitektúr. Skiptir hámarksgæðum 8B líkansins fyrir ~ 80x minni þyngd og verulega lægri VRAM á beiðni, sem gerir það hentugur fyrir frjáls-lag og há-flæði dreifingu.

Best fyrir: Free-tier TTS, framleiðsla í miklu magni, gagnvirk notkun með litlum leynd

Prófaðu ókeypis

BarkBark Sjálfgefið

Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.

Forritari: Suno · Leyfi: MIT

Prófaðu það

Bark SmallBark Small Sjálfgefið

Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.

Forritari: Suno · Leyfi: MIT

Prófaðu það

CosyVoice 2CosyVoice 2 Sjálfgefið

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0

Prófaðu það

Dia TTSDia TTS Sjálfgefið

Multi-hátalara samtal kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.

Forritari: Nari Labs · Leyfi: Apache 2.0

Prófaðu það

Parler TTSParler TTS Sjálfgefið

Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.

Forritari: Hugging Face · Leyfi: Apache 2.0

Prófaðu það

IndexTTS-2IndexTTS-2 Sjálfgefið

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Forritari: Index Team · Leyfi: Bilibili Model License

Prófaðu það

Spark TTSSpark TTS Sjálfgefið

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

Forritari: SparkAudio · Leyfi: CC BY-NC-SA 4.0

Prófaðu það

GPT-SoVITSGPT-SoVITS Sjálfgefið

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Forritari: RVC-Boss · Leyfi: MIT

Prófaðu það

OrpheusOrpheus Sjálfgefið

Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.

Forritari: Canopy Labs · Leyfi: Llama 3.2 Community

Prófaðu það

Qwen3 TTSQwen3 TTS Sjálfgefið

Fjöltyng TTS Fjarvistarsönnun með forstilltum raddir og raddhönnun úr texta.

Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0

Prófaðu það

VieNeu-TTS-v2VieNeu-TTS-v2 Sjálfgefið

Víetnamska + enska kóðaskipti TTS með 7 forstilltum raddum og núll-skot radd klónun. CPU-aðeins, engin GPU krafist.

Forritari: Phạm Nguyễn Ngọc Bảo · Leyfi: Apache 2.0

Prófaðu það

Chatterbox TurboChatterbox Turbo Sjálfgefið

Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.

Forritari: Resemble AI · Leyfi: MIT

Prófaðu það

VoxCPMVoxCPM Sjálfgefið

Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.

Forritari: OpenBMB · Leyfi: Apache 2.0

Prófaðu það

VibeVoiceVibeVoice Sjálfgefið

Microsoft líkan fyrir efni í langri mynd með mörgum hátölurum eins og podcast og hljóðbækur.

Forritari: Microsoft · Leyfi: MIT

Prófaðu það

CosyVoice3CosyVoice3 Sjálfgefið

Næsta kynslóð fjöltyngdar TTS með tvískiptri straumspilun, tilfinningastjórnun og núll-skot raddklónun.

Forritari: Alibaba (FunAudioLLM) · Leyfi: Apache 2.0

Prófaðu það

NAMAA Saudi TTSNAMAA Saudi TTS Sjálfgefið

Fyrsta opna Saudi-Arabía TTS. Native Saudi mállýska með Chatterbox-gæði rödd klónun.

Forritari: NAMAA Space · Leyfi: MIT

Prófaðu það

Darwin TTSDarwin TTS Sjálfgefið

Cross-modal Qwen3-TTS afbrigði með FFN þyngd blandað úr Qwen3-1.7B tungumál líkan fyrir skarpari fjöltyngd klónun.

Forritari: FINAL-Bench · Leyfi: Apache 2.0

Prófaðu það

MOSS-TTSDMOSS-TTSD Sjálfgefið

Multi-hátalara samræður áframhaldandi líkan - búa podcast-stíl samtöl með allt að 5 hátalara og 60 mínútur af samfelldu hljóði.

Forritari: OpenMOSS · Leyfi: Apache 2.0

Prófaðu það

ChatterboxChatterbox Premium

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Gæði:

Prófaðu það

Tortoise TTSTortoise TTS Premium

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Gæði:

Prófaðu það

StyleTTS 2StyleTTS 2 Premium

Human-stigi texta-til-tal í gegnum stíl dreifingu og andstæðingur-þjálfun.

Gæði:

Prófaðu það

OpenVoiceOpenVoice Premium

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Gæði:

Prófaðu það

Sesame CSMSesame CSM Premium

Samtals tal líkan sem býr til náttúrulega samræður með viðeigandi tímasetningu og tilfinningar.

Gæði:

Prófaðu það

CosyVoice 2CosyVoice 2

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Tungumál: en, zh, ja, ko, fr, de, it, es

Klóna rödd

IndexTTS-2IndexTTS-2

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Tungumál: en, zh

Klóna rödd

Spark TTSSpark TTS

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

Tungumál: en, zh

Klóna rödd

GPT-SoVITSGPT-SoVITS

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Tungumál: en, zh, ja, ko

Klóna rödd

ChatterboxChatterbox

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Tungumál: en

Klóna rödd

Tortoise TTSTortoise TTS

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Tungumál: en

Klóna rödd

OpenVoiceOpenVoice

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Tungumál: en, zh, ja, ko, fr, es

Klóna rödd

VieNeu-TTS-v2VieNeu-TTS-v2

Víetnamska + enska kóðaskipti TTS með 7 forstilltum raddum og núll-skot radd klónun. CPU-aðeins, engin GPU krafist.

Tungumál: vi, en

Klóna rödd

Chatterbox TurboChatterbox Turbo

Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.

Tungumál: en

Klóna rödd

VoxCPMVoxCPM

Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.

Tungumál: en, zh

Klóna rödd

OuteTTSOuteTTS

LLM-undirstaða TTS sem keyrir á CPU, GPU, eða vafra í gegnum llama.cpp og Transformers.js.

Tungumál: en

Klóna rödd

Pocket TTSPocket TTS

Léttur 100M breytu líkan með Kyutai með rödd klónun úr einu sýni.

Tungumál: en, fr

Klóna rödd

CosyVoice3CosyVoice3

Næsta kynslóð fjöltyngdar TTS með tvískiptri straumspilun, tilfinningastjórnun og núll-skot raddklónun.

Tungumál: en, zh, ja, ko, de, es, fr, it, ru

Klóna rödd

NAMAA Saudi TTSNAMAA Saudi TTS

Fyrsta opna Saudi-Arabía TTS. Native Saudi mállýska með Chatterbox-gæði rödd klónun.

Tungumál: ar

Klóna rödd

Darwin TTSDarwin TTS

Cross-modal Qwen3-TTS afbrigði með FFN þyngd blandað úr Qwen3-1.7B tungumál líkan fyrir skarpari fjöltyngd klónun.

Tungumál: en, ko, ja, zh

Klóna rödd

MOSS-TTSDMOSS-TTSD

Multi-hátalara samræður áframhaldandi líkan - búa podcast-stíl samtöl með allt að 5 hátalara og 60 mínútur af samfelldu hljóði.

Tungumál: en, zh

Klóna rödd

Ming-Omni TTSMing-Omni TTS

Compact 0.5B omni-modal tal líkan frá inclusionAI með hár-trúverðugleiki 44.1kHz framleiðsla og núll-skot rödd klónun.

Tungumál: en, zh

Klóna rödd

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS afbrigði - sama arkitektúr, 80x minni, frjáls-tier leynd.

Tungumál: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Klóna rödd

Developer-First API

OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.

  • OpenAI-samhæft snið
  • Streaming TTS fyrir rauntíma forrit
  • Hópvinnsla fyrir stór störf
  • Webhook tilkynningar
Skoða API skjöl
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Einföld, gagnsæ verðlagning

Byrjaðu ókeypis. Scale eins og þú vex.

Frjáls

$0

15.000 stafir + 5.000/dag

  • 7 ókeypis módel þar á meðal Kokoro
  • 5.000 stafir á kynslóð
  • API aðgangur innifalinn
Skráðu þig ókeypis

Ræsir

$9/mánuðir

500 einingar / mánuður

  • Öll 22+ módel
  • 100.000 stafir á kynslóð
  • Raddklónun
Byrjaðu
Vinsælasta

Pro

$29/mánuðir

2.000 einingar / mánuður

  • Allt í Starter
  • API aðgangur
  • Forgangsvinnsla
Fáðu Pro

Viðskipti

$99/mánuðir

10.000 einingar / mánuður

  • Allt í Pro
  • Magn API
  • Forgangsröð
Fá fyrirtæki

Skoða allar áætlanir þ.mt stafapakka →

Algengar spurningar (FAQ)

TTS.ai er alhliða AI rödd vettvangur, sem býður upp á 22 + texta-til-tal módel, radd klónun, tal-til-texta og hljóð verkfæri.Allar gerðir eru opinn uppspretta með enga söluaðila læsa í.

Já! TTS.ai býður upp á ókeypis texta til tals með Kokoro, Piper, VITS og MeloTTS módelum. Engin reikningur krafist. Skráðu þig til að fá 15.000 ókeypis stafi og aðgang að öllum gerðum. Greiddar áætlanir byrja á $ 9 / mánuði.

Til að fá hraða, notaðu Kokoro eða Piper. Fyrir gæði, reyndu CosyVoice 2 eða StyleTTS 2. Til að klóna rödd, notaðu Chatterbox eða GPT- SoVITS. Fyrir samtal, notaðu Dia TTS. Prófaðu mörg módel á sama texta til að bera saman.

Já. OpenAI-samhæft REST API fyrir TTS, STT, raddklónun og hljóðverkfæri. Innifalið í öllum áætlunum, þar á meðal ókeypis, með takmörkum sem eru mismunandi eftir stigum (Free: 10 req / mín, Lite: 20, Starter: 30, Pro: 60, Business: 300).

Premium módel eins og CosyVoice 2, StyleTTS 2 og Chatterbox framleiða nánast mannleg gæði ræðu með náttúrulegum tónum og tilfinningum. Frjáls módel eins og Kokoro bjóða upp á framúrskarandi gæði fyrir flest notkunartilfelli.

TTS.ai styður 30+ tungumál í gegnum líkan bókasafn sitt.Enska hefur breiðasta líkan stuðning, en módel eins og CosyVoice 2 ná yfir kínversku, japönsku og kóresku; GPT-SoVITS meðhöndlar kínversku, japönsku, kóresku og ensku; og MeloTTS styður ensku, spænsku, frönsku, kínversku, japönsku og kóresku.

Já. Öll vinnsla fer fram á sérstökum GPU netþjónum okkar. Við geymum ekki texta innslátt eða myndað hljóð eftir afhendingu. Hlaðið upp raddsýni fyrir klónun er aðeins notað fyrir núverandi setu og er ekki haldið. Við deilum aldrei gögnum þínum með þriðja aðila eða notum það til að þjálfa módel.

Já. Allt hljóð sem myndast á TTS.ai er þitt að nota í atvinnuskyni, þar á meðal fyrir YouTube myndbönd, podcast, hljóðbækur, forrit, auglýsingar og vörur. Líkön okkar eru opinn uppspretta undir leyfilegum leyfum (MIT, Apache 2.0).

TTS.ai býr sjálfkrafa til hljóð í WAV sniði fyrir hámarksgæði. Þú getur breytt í MP3, FLAC, OGG eða M4A með því að nota ókeypis hljóðbreytitólið okkar. API styður að tilgreina valinn framleiðsla snið beint í beiðninni.

Hladdu upp stuttu hljóðsýni (eins lítið og 5 sekúndur) af röddinni sem þú vilt klóna, sláðu síðan inn hvaða texta sem er til að búa til tal í þeirri rödd. Gerðir eins og Chatterbox, GPT-SoVITS og CosyVoice 2 styðja raddklónun. Klónað rödd tekur tóninn, hreim og talarstíl.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) þurfa ekki reikning og kosta núll stafi. Standard módel (2.000 stafir / 1K inntak) eru Bark, CosyVoice 2, F5-TTS og Dia. Premium módel (4.000 stafir / 1K inntak) eru OpenVoice, Chatterbox, StyleTTS 2 og Tortoise. Greidd módel bjóða yfirleitt hærri gæði, fleiri raddir og viðbótaraðgerðir eins og raddklónun.

Já. API styður lotuvinnslu til að umbreyta miklu magni af texta í tal. Sendu inn margar beiðnir og sækja niðurstöður ósamstillt með því að nota vinnu UUID. Viðskiptaáætlunin ($ 99 / mánuði) og hærri inniheldur forgangsröðunaraðgang fyrir hraðari lotuvinnslu. Tilvalið fyrir framleiðslu hljóðbóka, námskeiðsefni og stórfelld röddverkefni.
4.1/5 (42)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Byrjaðu að nota AI Voice í dag

Taka þátt í höfundum, verktaki og fyrirtækjum með TTS.ai