Free AI Test għal Diskors

31+ mudelli b’sors miftuħ, 231+ vuċijiet, 34+ L-ebda kont meħtieġ.

8K+
kreaturi
30K+
ġenerazzjonijiet
31+
Mudelli tal-AI
231+
vuċijiet
0/500 karattri · Sign up for 5,000 per generation → Liberi
Imħabba TTS.ai? Għid lill-ħbieb tiegħek!

Kollox għandek bżonn għall-vuċi AI

30+ għodda mħaddma minn mudelli tal-AI b'sors miftuħ

31+ Mudelli tal-Vuċi AI

L-aktar kollezzjoni komprensiva ta' mudelli TTS b'sors miftuħ f'pjattaforma waħda

KokoroKokoro Free

Kokoro huwa 82 miljun parametru test-to-talk mudell li punches sew fuq il-klassi tal-piż tagħha. Minkejja d-daqs żgħir tagħha, li tipproduċi diskors notevoli naturali u espressiv. Kokoro jappoġġja lingwi multipli inklużi l-Ingliż, Ġappuniż, Ċiniż, u Korean b'varjetà ta' vuċijiet espressivi.

L-aħjar għal: Kwalità għolja TTS b'latenza minima, applikazzjonijiet streaming

Ipprova b'xejn

PiperPiper Free

Piper huwa softwer li jbiddel it-test f’diskors, żviluppat minn Rhasspy, li juża l-arkitettura VITS u l-arkitettura tal-larinġ. Dan jaħdem kompletament fuq il-CPU, u għalhekk huwa ideali għal apparati tat-tarf, awtomazzjoni tad-dar, u applikazzjonijiet li jeħtieġu TTS offline.

L-aħjar għal: Quick previews, aċċessibbiltà, u applikazzjonijiet inkorporati

Ipprova b'xejn

VITSVITS Free

VITS (Inferenza varjazzjonali b’tagħlim avversarju għal Test-to-Speech minn tarf sa tarf) huwa metodu parallel ta’ TTS minn tarf sa tarf li jiġġenera awdjo b’ħoss aktar naturali mill-mudelli kurrenti f’żewġ stadji.Tadotta inferenza varjazzjonali miżjuda bi flussi ta’ normalizzazzjoni u proċess ta’ taħriġ avversarju, li jikseb titjib sinifikanti fin-naturalezza.

L-aħjar għal: Test-to-speech għal skopijiet ġenerali bi prożodija naturali

Ipprova b'xejn

MeloTTSMeloTTS Free

MeloTTS minn MyShell.ai hija librerija TTS multilingwi li tappoġġja l-Ingliż (Amerikan, Brittanniku, Indjan, Awstraljan), l-Ispanjol, il-Franċiż, Ċiniż, Ġappuniż u Korean. Huwa estremament mgħaġġel, ipproċessar test fi kważi veloċità fil-ħin reali fuq CPU waħdu.MeloTTS huwa ddisinjat għall-użu tal-produzzjoni u jappoġġja kemm CPU u GPU inferenza.

L-aħjar għal: Applikazzjonijiet tal-produzzjoni li jeħtieġu veloċi, multilingwi TTS

Ipprova b'xejn

OuteTTSOuteTTS Free

OuteTTS jestendi mudelli lingwistiċi kbar b'kapaċitajiet ta' test-to-speech filwaqt li jippreserva l-arkitettura oriġinali. Huwa jappoġġja backends multipli inkluż llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, u anke inferenza tal-browser permezz ta' Transformers.js.

L-aħjar għal: Tnedija tat-tarf, TTS ibbażat fuq il-browser, ambjenti b'riżorsi baxxi

Ipprova b'xejn

Pocket TTSPocket TTS Free

Pocket TTS minn Kyutai (kreaturi tal-Moshi) huwa mudell kompatti 100M parametru test-to-diskors li punches sew fuq il-piż tiegħu. Huwa jimxi b'mod effiċjenti fuq CPU, jappoġġja klonazzjoni vuċi żero-shot minn kampjun awdjo wieħed, u jipproduċi diskors naturali-ħoss.

L-aħjar għal: Użu ħafif, ambjenti CPU biss, klonazzjoni tal-vuċi mgħaġġla

Ipprova b'xejn

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

L-aħjar għal: Fast lightweight TTS, edge deployment, low-latency applications

Ipprova b'xejn

BarkBark Standard

Mudell tat-test għall-awdjo bbażat fuq trasformatur li jiġġenera diskors realistiku, mużika u effetti tal-ħoss.

Żviluppatur: Suno · Liċenzja: MIT

Ipprovaha

Bark SmallBark Small Standard

Verżjoni eħfef tal-Qoxra b'inferenza aktar mgħaġġla u użu tal-memorja aktar baxxa.

Żviluppatur: Suno · Liċenzja: MIT

Ipprovaha

CosyVoice 2CosyVoice 2 Standard

TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.

Żviluppatur: Alibaba (Tongyi Lab) · Liċenzja: Apache 2.0

Ipprovaha

Dia TTSDia TTS Standard

Mudell ta' ġenerazzjoni ta' djalogu b'ħafna kelliema li joħloq konversazzjonijiet naturali bejn kelliema.

Żviluppatur: Nari Labs · Liċenzja: Apache 2.0

Ipprovaha

Parler TTSParler TTS Standard

Tiddeskrivi l-vuċi li tixtieq fil-lingwa naturali u Parler jiġġenera diskors li jaqblu.

Żviluppatur: Hugging Face · Liċenzja: Apache 2.0

Ipprovaha

GLM-TTSGLM-TTS Standard

Jilħaq l-aktar rata baxxa ta ’żball tal-karattru fost il-mudelli TTS b’sors miftuħ.

Żviluppatur: Zhipu AI · Liċenzja: GLM-4 License

Ipprovaha

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.

Żviluppatur: Index Team · Liċenzja: Bilibili Model License

Ipprovaha

Spark TTSSpark TTS Standard

TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.

Żviluppatur: SparkAudio · Liċenzja: CC BY-NC-SA 4.0

Ipprovaha

GPT-SoVITSGPT-SoVITS Standard

Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.

Żviluppatur: RVC-Boss · Liċenzja: MIT

Ipprovaha

OrpheusOrpheus Standard

Mudell emozzjonali TTS fil-livell tal-bniedem imħarreġ fuq 100K sigħat ta' dejta tad-diskors.

Żviluppatur: Canopy Labs · Liċenzja: Llama 3.2 Community

Ipprovaha

Qwen3 TTSQwen3 TTS Standard

TTS multilingwi ta ’Alibaba b’ikklonjar tal-vuċi, vuċijiet issettjati minn qabel, u disinn tal-vuċi mit-test.

Żviluppatur: Alibaba (Qwen) · Liċenzja: Apache 2.0

Ipprovaha

Chatterbox TurboChatterbox Turbo Standard

Chatterbox aktar mgħaġġel b'latenza sub-200ms u tags paralinguistic għal daħk, sogħla, u aktar.

Żviluppatur: Resemble AI · Liċenzja: MIT

Ipprovaha

Dia 2Dia 2 Standard

Streaming-ewwel konversazzjonali TTS ma djalogu multi-speaker u cues paralinguistic.

Żviluppatur: Nari Labs · Liċenzja: Apache 2.0

Ipprovaha

VoxCPMVoxCPM Standard

TTS mingħajr tokenizer li jipproduċi awdjo 44.1kHz b'konsistenza tal-paragrafu konxja mill-kuntest.

Żviluppatur: OpenBMB · Liċenzja: Apache 2.0

Ipprovaha

TADATADA Standard

Zero-alluċinazzjoni TTS b'allinjament doppju test-akustika, 5x aktar mgħaġġel minn TTS LLM komparabbli.

Żviluppatur: Hume AI · Liċenzja: MIT

Ipprovaha

VibeVoiceVibeVoice Standard

Mudell Microsoft għal kontenut multi-speaker f'forma twila bħal podcasts u kotba awdjo.

Żviluppatur: Microsoft · Liċenzja: MIT

Ipprovaha

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Żviluppatur: Alibaba (FunAudioLLM) · Liċenzja: Apache 2.0

Ipprovaha

ChatterboxChatterbox Premium

Stat-tal-aħħar żero-shot kklonjar vuċi mal-kontroll emozzjoni minn Resemble AI.

Kwalità:

Ipprovaha

Tortoise TTSTortoise TTS Premium

Test-to-speech b'ħafna vuċijiet iffokat fuq il-kwalità b'arkitettura autoregressiva.

Kwalità:

Ipprovaha

StyleTTS 2StyleTTS 2 Premium

Test-to-speech fil-livell tal-bniedem permezz ta’ diffużjoni tal-istil u taħriġ kontradittorju.

Kwalità:

Ipprovaha

OpenVoiceOpenVoice Premium

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u aċċent.

Kwalità:

Ipprovaha

Sesame CSMSesame CSM Premium

Mudell ta’ diskors konversazzjonali li jiġġenera djalogu naturali biż-żmien u l-emozzjoni xierqa.

Kwalità:

Ipprovaha

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kwalità:

Ipprovaha

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kwalità:

Ipprovaha

CosyVoice 2CosyVoice 2

TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.

Lingwi: en, zh, ja, ko, fr, de, it, es

Il-vuċi tal-klonu

GLM-TTSGLM-TTS

Jilħaq l-aktar rata baxxa ta ’żball tal-karattru fost il-mudelli TTS b’sors miftuħ.

Lingwi: en, zh

Il-vuċi tal-klonu

IndexTTS-2IndexTTS-2

Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.

Lingwi: en, zh

Il-vuċi tal-klonu

Spark TTSSpark TTS

TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.

Lingwi: en, zh

Il-vuċi tal-klonu

GPT-SoVITSGPT-SoVITS

Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.

Lingwi: en, zh, ja, ko

Il-vuċi tal-klonu

ChatterboxChatterbox

Stat-tal-aħħar żero-shot kklonjar vuċi mal-kontroll emozzjoni minn Resemble AI.

Lingwi: en

Il-vuċi tal-klonu

Tortoise TTSTortoise TTS

Test-to-speech b'ħafna vuċijiet iffokat fuq il-kwalità b'arkitettura autoregressiva.

Lingwi: en

Il-vuċi tal-klonu

OpenVoiceOpenVoice

Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u aċċent.

Lingwi: en, zh, ja, ko, fr, de, es, it

Il-vuċi tal-klonu

Qwen3 TTSQwen3 TTS

TTS multilingwi ta ’Alibaba b’ikklonjar tal-vuċi, vuċijiet issettjati minn qabel, u disinn tal-vuċi mit-test.

Lingwi: en, zh, ja, ko, de, fr, ru, pt, es, it

Il-vuċi tal-klonu

Chatterbox TurboChatterbox Turbo

Chatterbox aktar mgħaġġel b'latenza sub-200ms u tags paralinguistic għal daħk, sogħla, u aktar.

Lingwi: en

Il-vuċi tal-klonu

VoxCPMVoxCPM

TTS mingħajr tokenizer li jipproduċi awdjo 44.1kHz b'konsistenza tal-paragrafu konxja mill-kuntest.

Lingwi: en, zh

Il-vuċi tal-klonu

OuteTTSOuteTTS

TTS ibbażat fuq LLM li jaħdem fuq CPU, GPU, jew browser permezz llama.cpp u Transformers.js.

Lingwi: en

Il-vuċi tal-klonu

Pocket TTSPocket TTS

Mudell tal-parametru ħafif 100M minn Kyutai bi klonazzjoni tal-vuċi minn kampjun wieħed.

Lingwi: en, fr

Il-vuċi tal-klonu

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Lingwi: en, zh, ja, ko, de, es, fr, it, ru

Il-vuċi tal-klonu

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Lingwi: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Il-vuċi tal-klonu

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Lingwi: en, zh

Il-vuċi tal-klonu

L-ewwel API għall-iżviluppaturi

OpenAI-kompatibbli REST API. One endpoint, 22+ mudelli. Streaming appoġġ għall-applikazzjonijiet fil-ħin reali.

  • Format kompatibbli ma’ OpenAI
  • Streaming TTS għall-applikazzjonijiet fil-ħin reali
  • Ipproċessar tal-lott għall-impjiegi kbar
  • Notifiki tal-webhook
Ara d-dokumenti tal-API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Sempliċi, Prezzijiet trasparenti

Ibda b'xejn. Skala kif tikber.

Liberi

$0

15-il kreditu

  • Kokoro, Piper, VITS, MeloTTS
  • Limitu ta’ 500 karattru
  • 3 gen/siegħa (l-ebda kont)
Irreġistra b'xejn

Starter

$9/6 xhur

500 kreditu / xahar

  • Kollha 22+ mudelli
  • 100,000 karattru għal kull ġenerazzjoni
  • Klonazzjoni tal-vuċi
Ibda
L-aktar popolari

Għal

$29/6 xhur

2,000 kreditu/xahar

  • Kollox fi Starter
  • Aċċess għall-API
  • Ipproċessar ta’ prijorità
Ikseb Pro

Negozju

$99/6 xhur

10,000 kreditu/xahar

  • Kollox fil-Pro
  • API bl-ingrossa
  • Kju ta’ prijorità
Ikseb in-Negozju

Ara l-pjanijiet kollha inklużi l-pakketti tal-karattru →

Mistoqsijiet Frekwenti (FAQ)

TTS.ai hija l-aktar pjattaforma komprensiva tal-vuċi AI, li toffri 22 + mudelli test-to-diskors, klonazzjoni tal-vuċi, diskors-to-test, u għodod awdjo.Il-mudelli kollha huma open source mingħajr bejjiegħ lock-in.

Iva! TTS.ai joffri test b'xejn biex jitkellmu mal-Kokoro, Piper, VITS, u MeloTTS mudelli. l-ebda kont meħtieġ. Sign up biex tikseb 15,000 karattri b'xejn u l-aċċess għall-mudelli kollha. pjanijiet imħallsa jibdew minn $ 9 / xahar.

Għall-veloċità, uża Kokoro jew Piper. Għall-kwalità, ipprova CosyVoice 2 jew StyleTTS 2. Għall-ikklonjar tal-vuċi, uża Chatterbox jew GPT-SoVITS. Għall-dialogu, uża Dia TTS. Ipprova mudelli multipli fuq l-istess test biex tqabbel.

Iva. OpenAI-kompatibbli REST API għall-TTS, STT, klonazzjoni vuċi, u l-għodod awdjo. Disponibbli fuq Pro ($ 29/mo) u l-Intrapriża ($ 99/mo) pjanijiet. Ara d-dokumentazzjoni fil-tts.ai/api/.

Il-kwalità tal-vuċi tvarja skont il-mudell. Mudelli Premium bħal CosyVoice 2, StyleTTS 2, u Chatterbox jipproduċu diskors ta' kwalità kważi umana b'intonazzjoni u emozzjoni naturali.

TTS.ai jappoġġja 30+ lingwi madwar il-librerija mudell tagħha.Ingliż għandu l-appoġġ mudell usa', iżda mudelli bħal CosyVoice 2 jkopru Ċiniż, Ġappuniż, u Korean; GPT-SoVITS jimmaniġġja Ċiniż, Ġappuniż, Korean, u l-Ingliż; u MeloTTS jappoġġja l-Ingliż, Spanjol, Franċiż, Ċiniż, Ġappuniż, u Korean.

Iva. L-ipproċessar kollu jsir fuq is-servers tal-GPU ddedikati tagħna. Aħna ma naħżnux l-input tat-test tiegħek jew l-awdjo ġġenerat wara l-kunsinna. Kampjuni tal-vuċi mgħobbija għall-ikklonjar jintużaw biss għas-sessjoni attwali u ma jinżammux. Aħna qatt ma naqsmu d-dejta tiegħek ma' partijiet terzi jew nużawha biex inħarrġu mudelli.

Iva. L-awdjo kollha ġġenerati fuq TTS.ai huwa tiegħek għall-użu kummerċjali, inklużi għall-vidjos YouTube, podcasts, kotba awdjo, applikazzjonijiet, reklami, u prodotti. mudelli tagħna huma sors miftuħ taħt liċenzji permissivi (MIT, Apache 2.0). l-ebda royalties jew attribwiment meħtieġa.

TTS.ai jiġġenera awdjo fil-format WAV b'default għall-kwalità massima. inti tista taqleb għall-MP3, FLAC, OGG, jew M4A bl-użu tagħna ħielsa Awdjo konvertitur għodda. l-API jappoġġja li jispeċifikaw format output preferut tiegħek direttament fit-talba.

Upload kampjun awdjo qasir (daqsxejn bħal 5 sekondi) tal-vuċi li inti tixtieq li klonu, imbagħad ittajpja kwalunkwe test biex jiġġeneraw diskors f'dak il-vuċi. mudelli bħal Chatterbox, GPT-SoVITS, u CosyVoice 2 appoġġ klonazzjoni vuċi.-vuċi klonat jaqbad ton, aċċent, u l-istil jitkellmu.

Mudelli ħielsa (Kokoro, Piper, VITS, MeloTTS) jeħtieġu l-ebda kont u l-ispiża karattri żero. mudelli standard (2,000 karattri/1K input) jinkludu Bark, CosyVoice 2, F5-TTS, u Dia. mudelli premium (4,000 karattri/1K input) jinkludu OpenVoice, Chatterbox, StyleTTS 2, u Tortoise. mudelli mħallsa ġeneralment joffru kwalità ogħla, aktar vuċijiet, u l-karatteristiċi addizzjonali bħal klonazzjoni vuċi.

Iva. L-API jappoġġja l-ipproċessar tal-lott għall-konverżjoni ta' volumi kbar ta' test għal diskors. Ippreżenta talbiet multipli u rkupra r-riżultati b'mod asinkronu billi tuża UUIDs tax-xogħol. Il-pjanijiet tal-intrapriża ($ 99 / xahar) jinkludu aċċess prijoritarju għall-kju għall-ipproċessar tal-lott aktar mgħaġġel. Ideali għall-produzzjoni tal-awdjobook, kontenut tal-kors, u proġetti ta' voiceover fuq skala kbira.
4.1/5 (21)

X'nistgħu ntejbu? Il-feedback tiegħek jgħinna nsolvu l-problemi.

Ibda tuża AI Voice Illum

Ingħaqad ma' kreaturi, żviluppaturi u negozji li jużaw TTS.ai