Free AI Test għal Diskors

20+ mudelli b’sors miftuħ, 107+ vuċijiet, 32+ L-ebda kont meħtieġ.

1K+
kreaturi
2K+
ġenerazzjonijiet
20+
Mudelli tal-AI
107+
vuċijiet
0/500 karattri Liberi
Bħal TTS.ai? Għid lill-ħbieb tiegħek!

Kollox għandek bżonn għall-vuċi AI

30+ għodda mħaddma minn mudelli tal-AI b'sors miftuħ

20+ Mudelli tal-Vuċi AI

L-aktar kollezzjoni komprensiva ta' mudelli TTS b'sors miftuħ f'pjattaforma waħda

KokoroKokoro Free

Kokoro huwa 82 miljun parametru test-to-diskors mudell li punches sew fuq il-klassi tal-piż tagħha. Minkejja d-daqs żgħir tagħha, tipproduċi diskors notevoli naturali u espressiv. Kokoro jappoġġja lingwi multipli inklużi l-Ingliż, Ġappuniż, Ċiniż, u Korean b'varjetà ta' vuċijiet espressivi.

L-aħjar għal: Kwalità għolja TTS b'latenza minima, applikazzjonijiet streaming

Ipprova b'xejn

PiperPiper Free

Piper huwa softwer li jbiddel it-test f’diskors, żviluppat minn Rhasspy, li juża l-arkitettura VITS u l-arkitettura tal-larinġ. Dan jaħdem kompletament fuq il-CPU, u għalhekk huwa ideali għal apparati tat-tarf, awtomazzjoni tad-dar, u applikazzjonijiet li jeħtieġu TTS offline.

L-aħjar għal: Quick previews, aċċessibbiltà, u applikazzjonijiet inkorporati

Ipprova b'xejn

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) huwa metodu parallel TTS end-to-end li jiġġenera awdjo b'ħoss aktar naturali mill-mudelli kurrenti f'żewġ stadji.Tadotta inferenza variazzjonali miżjuda bi flussi ta' normalizzazzjoni u proċess ta' taħriġ avversarju, li jikseb titjib sinifikanti fin-naturalezza.

L-aħjar għal: Test-to-speech għal skopijiet ġenerali bi prożodija naturali

Ipprova b'xejn

MeloTTSMeloTTS Free

MeloTTS minn MyShell.ai hija librerija TTS multilingwi li tappoġġja l-Ingliż (Amerikan, Brittaniku, Indjan, Awstraljan), l-Ispanjol, il-Franċiż, Ċiniż, Ġappuniż, u Korean. Huwa estremament mgħaġġel, ipproċessar test fi kważi veloċità fil-ħin reali fuq CPU waħdu.MeloTTS huwa ddisinjat għall-użu tal-produzzjoni u jappoġġja kemm CPU u GPU inferenza.

L-aħjar għal: Applikazzjonijiet tal-produzzjoni li jeħtieġu veloċi, multilingwi TTS

Ipprova b'xejn

BarkBark Standard

Mudell tat-test għall-awdjo bbażat fuq trasformatur li jiġġenera diskors realistiku, mużika u effetti tal-ħoss.

Żviluppatur: Suno · Liċenzja: MIT

Ipprovaha

Bark SmallBark Small Standard

Verżjoni eħfef tal-Qoxra b'inferenza aktar mgħaġġla u użu tal-memorja aktar baxxa.

Żviluppatur: Suno · Liċenzja: MIT

Ipprovaha

CosyVoice 2CosyVoice 2 Standard

TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.

Żviluppatur: Alibaba (Tongyi Lab) · Liċenzja: Apache 2.0

Ipprovaha

Dia TTSDia TTS Standard

Mudell tal-ġenerazzjoni tad-djalogu b'ħafna kelliema li joħloq konversazzjonijiet naturali bejn kelliema.

Żviluppatur: Nari Labs · Liċenzja: Apache 2.0

Ipprovaha

Parler TTSParler TTS Standard

Tiddeskrivi l-vuċi li tixtieq fil-lingwa naturali u Parler jiġġenera diskors li jaqblu.

Żviluppatur: Hugging Face · Liċenzja: Apache 2.0

Ipprovaha

GLM-TTSGLM-TTS Standard

Jilħaq l-aktar rata baxxa ta ’żball tal-karattru fost il-mudelli TTS b’sors miftuħ.

Żviluppatur: Zhipu AI · Liċenzja: GLM-4 License

Ipprovaha

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.

Żviluppatur: Index Team · Liċenzja: Bilibili Model License

Ipprovaha

Spark TTSSpark TTS Standard

TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.

Żviluppatur: SparkAudio · Liċenzja: CC BY-NC-SA 4.0

Ipprovaha

GPT-SoVITSGPT-SoVITS Standard

Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.

Żviluppatur: RVC-Boss · Liċenzja: MIT

Ipprovaha

OrpheusOrpheus Standard

Mudell emozzjonali TTS fil-livell tal-bniedem imħarreġ fuq 100K sigħat ta' dejta tad-diskors.

Żviluppatur: Canopy Labs · Liċenzja: Llama 3.2 Community

Ipprovaha

Qwen3 TTSQwen3 TTS Standard

TTS multilingwi ta ’Alibaba b’ikklonjar tal-vuċi, vuċijiet issettjati minn qabel, u disinn tal-vuċi mit-test.

Żviluppatur: Alibaba (Qwen) · Liċenzja: Apache 2.0

Ipprovaha

ChatterboxChatterbox Premium

Stat-tal-aħħar żero-shot kklonjar vuċi mal-kontroll emozzjoni minn Resemble AI.

Kwalità:

Ipprovaha

Tortoise TTSTortoise TTS Premium

Test-to-speech b'ħafna vuċijiet iffokat fuq il-kwalità b'arkitettura autoregressiva.

Kwalità:

Ipprovaha

StyleTTS 2StyleTTS 2 Premium

Test-to-speech fil-livell tal-bniedem permezz ta’ diffużjoni tal-istil u taħriġ kontradittorju.

Kwalità:

Ipprovaha

OpenVoiceOpenVoice Premium

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u l-aċċent.

Kwalità:

Ipprovaha

Sesame CSMSesame CSM Premium

Mudell ta’ diskors konversazzjonali li jiġġenera djalogu naturali biż-żmien u l-emozzjoni xierqa.

Kwalità:

Ipprovaha

CosyVoice 2CosyVoice 2

TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.

Lingwi: en, zh, ja, ko, fr, de, it, es

Il-vuċi tal-klonu

GLM-TTSGLM-TTS

Jilħaq l-aktar rata baxxa ta ’żball tal-karattru fost il-mudelli TTS b’sors miftuħ.

Lingwi: en, zh

Il-vuċi tal-klonu

IndexTTS-2IndexTTS-2

Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.

Lingwi: en, zh

Il-vuċi tal-klonu

Spark TTSSpark TTS

TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.

Lingwi: en, zh

Il-vuċi tal-klonu

GPT-SoVITSGPT-SoVITS

Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.

Lingwi: en, zh, ja, ko

Il-vuċi tal-klonu

ChatterboxChatterbox

Stat-tal-aħħar żero-shot kklonjar vuċi mal-kontroll emozzjoni minn Resemble AI.

Lingwi: en

Il-vuċi tal-klonu

Tortoise TTSTortoise TTS

Test-to-speech b'ħafna vuċijiet iffokat fuq il-kwalità b'arkitettura autoregressiva.

Lingwi: en

Il-vuċi tal-klonu

OpenVoiceOpenVoice

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u l-aċċent.

Lingwi: en, zh, ja, ko, fr, de, es, it

Il-vuċi tal-klonu

Qwen3 TTSQwen3 TTS

TTS multilingwi ta ’Alibaba b’ikklonjar tal-vuċi, vuċijiet issettjati minn qabel, u disinn tal-vuċi mit-test.

Lingwi: en, zh, ja, ko, de, fr, ru, pt, es, it

Il-vuċi tal-klonu

L-ewwel API tal-iżviluppatur

OpenAI-kompatibbli REST API. One endpoint, 22+ mudelli. Streaming appoġġ għall-applikazzjonijiet fil-ħin reali.

  • Format kompatibbli ma’ OpenAI
  • Streaming TTS għall-applikazzjonijiet fil-ħin reali
  • Ipproċessar tal-lott għall-impjiegi kbar
  • Notifiki tal-webhook
Ara d-dokumenti tal-API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Sempliċi, Prezzijiet trasparenti

Ibda b'xejn. Skala kif tikber.

Liberi

$0

15-il kreditu

  • Kokoro, Piper, VITS, MeloTTS
  • Limitu ta’ 500 karattru
  • 3 gen/siegħa (l-ebda kont)
Irreġistra b'xejn

Starter

$9/6 xhur

500 kreditu / xahar

  • Kollha 22+ mudelli
  • 100,000 chars per generation
  • Klonazzjoni tal-vuċi
Ibda
L-aktar popolari

Għal

$29/6 xhur

2,000 kreditu/xahar

  • Kollox fi Starter
  • Aċċess għall-API
  • Ipproċessar ta’ prijorità
Ikseb Pro

Negozju

$99/6 xhur

10,000 kreditu/xahar

  • Kollox fil-Pro
  • API bl-ingrossa
  • Kju ta’ prijorità
Ikseb in-Negozju

Ara l-pjanijiet kollha inklużi l-pakketti tal-karattru →

Mistoqsijiet Frekwenti (FAQ)

TTS.ai hija l-aktar pjattaforma komprensiva tal-vuċi tal-AI, li toffri 22 + mudelli ta ’test għal diskors, klonazzjoni tal-vuċi, diskors għal test, u għodod awdjo.Il-mudelli kollha huma sors miftuħ mingħajr lock-in tal-bejjiegħ.

Iva! TTS.ai joffri test b'xejn biex jitkellmu mal-Kokoro, Piper, VITS, u MeloTTS mudelli. l-ebda kont meħtieġ. Sign up biex tikseb 15,000 karattri b'xejn u l-aċċess għall-mudelli kollha. pjanijiet imħallsa jibdew minn $ 9 / xahar.

Għall-veloċità, uża Kokoro jew Piper. Għall-kwalità, ipprova CosyVoice 2 jew StyleTTS 2. Għall-ikklonjar tal-vuċi, uża Chatterbox jew GPT-SoVITS. Għall-dialogu, uża Dia TTS. Ipprova mudelli multipli fuq l-istess test biex tqabbel.

Iva. OpenAI-kompatibbli REST API għal TTS, STT, klonazzjoni vuċi, u l-għodod awdjo. Disponibbli fuq Pro ($29/mo) u l-Intrapriża ($99/mo) pjanijiet. Ara d-dokumentazzjoni fuq tts.ai/api/.

Il-kwalità tal-vuċi tvarja skont il-mudell. Mudelli Premium bħal CosyVoice 2, StyleTTS 2, u Chatterbox jipproduċu diskors ta' kwalità kważi umana b'intonazzjoni u emozzjoni naturali.

TTS.ai jappoġġja 30 + lingwi fil-librerija mudell tagħha.Ingliż għandu l-appoġġ mudell usa', iżda mudelli bħal CosyVoice 2 jkopru Ċiniż, Ġappuniż, u Korean; GPT-SoVITS jimmaniġġja Ċiniż, Ġappuniż, Korean, u l-Ingliż; u MeloTTS jappoġġja l-Ingliż, l-Ispanjol, il-Franċiż, Ċiniż, Ġappuniż, u Korean.

Iva. L-ipproċessar kollu jsir fuq is-servers tal-GPU ddedikati tagħna. Aħna ma naħżnux l-input tat-test tiegħek jew l-awdjo ġġenerat wara l-kunsinna. Kampjuni tal-vuċi mgħobbija għall-ikklonjar jintużaw biss għas-sessjoni attwali u ma jinżammux. Aħna qatt ma naqsmu d-dejta tiegħek ma' partijiet terzi jew nużawha biex inħarrġu mudelli.

Iva. L-awdjo kollha ġġenerati fuq TTS.ai huwa tiegħek għall-użu kummerċjali, inklużi għall-vidjos YouTube, podcasts, kotba awdjo, applikazzjonijiet, reklami, u prodotti. mudelli tagħna huma sors miftuħ taħt liċenzji permissivi (MIT, Apache 2.0). l-ebda royalties jew attribwiment meħtieġa.

TTS.ai jiġġenera awdjo fil-format WAV b'mod awtomatiku għall-kwalità massima. inti tista taqleb għall-MP3, FLAC, OGG, jew M4A bl-użu tagħna ħielsa Awdjo konvertitur għodda. l-API jappoġġja l-ispeċifikazzjoni tiegħek preferut output format direttament fit-talba.

Upload kampjun awdjo qasir (daqsxejn bħal 5 sekondi) tal-vuċi li inti tixtieq li klonu, imbagħad ittajpja kwalunkwe test biex jiġġeneraw diskors f'dak il-vuċi. mudelli bħal Chatterbox, GPT-SoVITS, u CosyVoice 2 appoġġ klonazzjoni vuċi.-vuċi klonat jaqbad ton, aċċent, u l-istil jitkellmu.

Mudelli ħielsa (Kokoro, Piper, VITS, MeloTTS) jeħtieġu l-ebda kont u l-ispiża karattri żero. mudelli standard (2,000 karattri/1K input) jinkludu Bark, CosyVoice 2, F5-TTS, u Dia. mudelli premium (4,000 karattri/1K input) jinkludu OpenVoice, Chatterbox, StyleTTS 2, u Tortoise. mudelli mħallsa ġeneralment joffru kwalità ogħla, aktar vuċijiet, u l-karatteristiċi addizzjonali bħal klonazzjoni vuċi.

Iva. L-API jappoġġja l-ipproċessar tal-lott għall-konverżjoni ta' volumi kbar ta' test għal diskors. Ippreżenta talbiet multipli u rkupra r-riżultati b'mod asinkronu billi tuża UUIDs tax-xogħol. Il-pjanijiet tal-intrapriża ($ 99 / xahar) jinkludu aċċess prijoritarju għall-kju għall-ipproċessar tal-lott aktar mgħaġġel. Ideali għall-produzzjoni tal-awdjobook, kontenut tal-kors, u proġetti ta' voiceover fuq skala kbira.
4.0/5 (8)

Ibda tuża AI Voice Illum

Ingħaqad ma' kreaturi, żviluppaturi u negozji li jużaw TTS.ai