Libera AI Teksto- al- ParoloComment

31+ malfermkodaj modeloj, 231+ voĉoj, 34+ Lingvoj. Neniu konto necesas.

8K+
kreintoj
31K+
generacioj
31+
AI modeloj
231+
voĉoj
0/500 signoj · Sign up for 5,000 per generation → Libera
Ĉu vi ŝatas TTS.ai? Diru al viaj amikoj!

Ĉio, kion vi bezonas por voĉa AIName

Pli ol 30 iloj funkciigitaj per malfermkodaj AI-modeloj

31+ AI- voĉaj modeloj

La plej ampleksa kolekto de malfermkodaj TTS-modeloj en unu platformo

KokoroKokoro Free

Kokoro estas 82-miliona parametra teksto-al-parolo-modelo kiu bone superas sian pezan klason. Spite sian malgrandan grandecon, ĝi produktas rimarkinde naturan kaj esprimplenan paroladon. Kokoro subtenas plurajn lingvojn inkluzive de la angla, japana, ĉina, kaj korea kun vario de esprimplenaj voĉoj. Ĝi funkcias nekredeble rapide — generante sonon preskaŭ 100-oble pli rapide ol realtempa sur GPU.

Plej bona por: Altkvalita TTS kun minimuma prokrasto, fluantaj aplikaĵoj

Provu senpage

PiperPiper Free

Piper estas malpeza teksto-al-vorta motoro evoluigita de Rhasspy kiu uzas VITS kaj larynx arkitekturojn. Ĝi ruliĝas tute sur CPU, kio faras ĝin ideala por periferiaj aparatoj, hejma aŭtomatigo, kaj aplikaĵoj kiuj bezonas senretan TTS. Kun pli ol 100 voĉoj en pli ol 30 lingvoj, Piper liveras nature sonantan paroladon je realtempa rapideco eĉ sur Raspberry Pi 4.

Plej bona por: Rapidaj antaŭrigardoj, alirebleco, kaj enkorpigitaj aplikaĵoj

Provu senpage

VITSVITS Free

VITS (Variaciona Inferigo kun Kontraŭstara Lernado por Fina Fina Tekst- al- Parola Metodo) estas paralela fin- al- fina TTS- metodo kiu generas pli nature sonantan sonon ol nunaj du- paŝaj modeloj. Ĝi adoptas variacionan inferigon plifortigitan per normaligaj fluoj kaj kontraŭstara trejna procezo, atingante signifan plibonigon en natureco.

Plej bona por: Ĝeneraluzebla teksto-al-vorto kun natura prozodioName

Provu senpage

MeloTTSMeloTTS Free

MeloTTS de MyShell. ai estas multlingva TTS- biblioteko subtenanta la anglan (usonan, britan, hindan, aŭstralian), la hispanan, la francan, la ĉinan, la japanan, kaj la korean. Ĝi estas ekstreme rapida, traktante tekston je preskaŭ realtempa rapideco nur per CPU. MeloTTS estas desegnita por produkta uzo kaj subtenas kaj CPU kaj GPU- dedukton.

Plej bona por: Produktivaj aplikaĵoj kiuj bezonas rapidan, multlingvan TTS

Provu senpage

OuteTTSOuteTTS Free

OuteTTS etendas grandajn lingvajn modelojn per tekst-al-parolaj kapabloj dum konservado de la origina arkitekturo. Ĝi subtenas plurajn internajn partojn inkluzive llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, kaj eĉ retumilan inferecon per Transformers.js. Ĝi havas nulan voĉan klonadon per parolantoj konservitaj kiel JSON.

Plej bona por: Edge-disvastigo, retumilo-bazita TTS, malalt-risurcaj medioj

Provu senpage

Pocket TTSPocket TTS Free

Pocket TTS de Kyutai (kreintoj de Moshi) estas kompakta 100M parametra teksto-al-vorta modelo kiu estas multe pli potenca ol ĝia pezo. Ĝi funkcias efike sur CPU, subtenas nulan voĉan klonadon el ununura aŭd-ekzemplo, kaj produktas nature sonantan paroladon. La malgranda modelo faras ĝin ideala por rando-disvastigo kaj malriĉaj rimedoj.

Plej bona por: Malpeza disvastigo, nur CPU-aj medioj, rapida voĉ-klonado

Provu senpage

Kitten TTSKitten TTS Free

Kitten TTS de KittenML estas ultra- malpeza teksto- al- parola modelo konstruita sur ONNX. Kun variantoj de 15M ĝis 80M parametroj (25- 80 MB sur disko), ĝi liveras altkvalitan voĉan sintezon sur CPU sen bezonado de GPU. Ĝi havas 8 enkonstruitajn voĉojn, agordeblan parolrapidecon, kaj enkonstruitan tekstan antaŭtraktadon por nombroj, valutoj, kaj unuoj. Ideala por rando- disvastigo kaj malalt- latentaj aplikaĵoj. Name

Plej bona por: Rapida malpeza TTS, rando- disvastigo, malalt-latenca aplikaĵo

Provu senpage

BarkBark Standard

Transform-bazita teksto-al-aŭda modelo kiu generas realisman paroladon, muzikon, kaj sonajn efektojn.

Programisto: Suno · Licenco: MIT

Provu ĝin

Bark SmallBark Small Standard

Malpeza versio de Bark kun pli rapida deduktado kaj pli malalta memoro-uzo.

Programisto: Suno · Licenco: MIT

Provu ĝin

CosyVoice 2CosyVoice 2 Standard

Alibaba's skalebla streaming TTS kun homa-pareco natureco kaj preskaŭ nula latenteco.

Programisto: Alibaba (Tongyi Lab) · Licenco: Apache 2.0

Provu ĝin

Dia TTSDia TTS Standard

Multi-parolanto dialogo generacio modelo kiu kreas naturajn konversaciojn inter parolantoj.

Programisto: Nari Labs · Licenco: Apache 2.0

Provu ĝin

Parler TTSParler TTS Standard

Priskribu la voĉon kiun vi volas en natura lingvo kaj Parler kreos kongruan paroladon.

Programisto: Hugging Face · Licenco: Apache 2.0

Provu ĝin

GLM-TTSGLM-TTS Standard

Ĝi atingas la plej malaltan karakteran eraroprocenton inter malferm-fontaj TTS-modeloj.

Programisto: Zhipu AI · Licenco: GLM-4 License

Provu ĝin

IndexTTS-2IndexTTS-2 Standard

Ĝenerale oni parolas pri TTT-legilo, kiu havas bonan grafikan interfacon kaj altan rapidecon.

Programisto: Index Team · Licenco: Bilibili Model License

Provu ĝin

Spark TTSSpark TTS Standard

Voĉo klonado TTS kun kontrolata emocio kaj parola stilo tra alvokoj.

Programisto: SparkAudio · Licenco: CC BY-NC-SA 4.0

Provu ĝin

GPT-SoVITSGPT-SoVITS Standard

Kelkaj voĉoj klonado TTS kiu replikas ajnan voĉon de nur 5 sekundoj de aŭdo.

Programisto: RVC-Boss · Licenco: MIT

Provu ĝin

OrpheusOrpheus Standard

100.000 horoj da parolaj datumoj.

Programisto: Canopy Labs · Licenco: Llama 3.2 Community

Provu ĝin

Qwen3 TTSQwen3 TTS Standard

Alibaba's multlingva TTS kun voĉo klonado, antaŭdifinitaj voĉoj, kaj voĉo dezajno de teksto.

Programisto: Alibaba (Qwen) · Licenco: Apache 2.0

Provu ĝin

Chatterbox TurboChatterbox Turbo Standard

Pli rapida Chatterbox kun sub-200ms latenteco kaj paralingvaj etikedoj por ridoj, tuso, kaj pli.

Programisto: Resemble AI · Licenco: MIT

Provu ĝin

Dia 2Dia 2 Standard

Ĝi estas la unua TTS kun multi-parolanta dialogo kaj paralingvistikaj indikoj.

Programisto: Nari Labs · Licenco: Apache 2.0

Provu ĝin

VoxCPMVoxCPM Standard

La 44.1 kHz-a frekvenco estas uzata por la elsendoj de la radiostacio.

Programisto: OpenBMB · Licenco: Apache 2.0

Provu ĝin

TADATADA Standard

La 5-a linio estas pli mallonga ol la 2-a linio, sed pli longa ol la 1-a linio.

Programisto: Hume AI · Licenco: MIT

Provu ĝin

VibeVoiceVibeVoice Standard

Microsoft-modelo por longforma multparolanta enhavo kiel podkastoj kaj aŭdlibroj.

Programisto: Microsoft · Licenco: MIT

Provu ĝin

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Programisto: Alibaba (FunAudioLLM) · Licenco: Apache 2.0

Provu ĝin

ChatterboxChatterbox Premium

Ŝtata-de-la-arto zero-shot voĉo klonado kun emocia kontrolo de Resemble AI.

Kvalito:

Provu ĝin

Tortoise TTSTortoise TTS Premium

Plurvoĉa teksto-al-parolo fokusiĝas je kvalito kun aŭtoregresiva arkitekturo.

Kvalito:

Provu ĝin

StyleTTS 2StyleTTS 2 Premium

Teksto-al-parolo je homa nivelo per stila disvastigo kaj kontraŭstara trejnado.

Kvalito:

Provu ĝin

OpenVoiceOpenVoice Premium

Tuja voĉo klonado kun granulara kontrolo super stilo, emocio, kaj akcento.

Kvalito:

Provu ĝin

Sesame CSMSesame CSM Premium

Konversacia parola modelo generanta naturan dialogon kun taŭga tempo kaj emocio.

Kvalito:

Provu ĝin

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kvalito:

Provu ĝin

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kvalito:

Provu ĝin

CosyVoice 2CosyVoice 2

Alibaba's skalebla streaming TTS kun homa-pareco natureco kaj preskaŭ nula latenteco.

Lingvoj: en, zh, ja, ko, fr, de, it, es

Kloni voĉon

GLM-TTSGLM-TTS

Ĝi atingas la plej malaltan karakteran eraroprocenton inter malferm-fontaj TTS-modeloj.

Lingvoj: en, zh

Kloni voĉon

IndexTTS-2IndexTTS-2

Ĝenerale oni parolas pri TTT-legilo, kiu havas bonan grafikan interfacon kaj altan rapidecon.

Lingvoj: en, zh

Kloni voĉon

Spark TTSSpark TTS

Voĉo klonado TTS kun kontrolata emocio kaj parola stilo tra alvokoj.

Lingvoj: en, zh

Kloni voĉon

GPT-SoVITSGPT-SoVITS

Kelkaj voĉoj klonado TTS kiu replikas ajnan voĉon de nur 5 sekundoj de aŭdo.

Lingvoj: en, zh, ja, ko

Kloni voĉon

ChatterboxChatterbox

Ŝtata-de-la-arto zero-shot voĉo klonado kun emocia kontrolo de Resemble AI.

Lingvoj: en

Kloni voĉon

Tortoise TTSTortoise TTS

Plurvoĉa teksto-al-parolo fokusiĝas je kvalito kun aŭtoregresiva arkitekturo.

Lingvoj: en

Kloni voĉon

OpenVoiceOpenVoice

Tuja voĉo klonado kun granulara kontrolo super stilo, emocio, kaj akcento.

Lingvoj: en, zh, ja, ko, fr, de, es, it

Kloni voĉon

Qwen3 TTSQwen3 TTS

Alibaba's multlingva TTS kun voĉo klonado, antaŭdifinitaj voĉoj, kaj voĉo dezajno de teksto.

Lingvoj: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloni voĉon

Chatterbox TurboChatterbox Turbo

Pli rapida Chatterbox kun sub-200ms latenteco kaj paralingvaj etikedoj por ridoj, tuso, kaj pli.

Lingvoj: en

Kloni voĉon

VoxCPMVoxCPM

La 44.1 kHz-a frekvenco estas uzata por la elsendoj de la radiostacio.

Lingvoj: en, zh

Kloni voĉon

OuteTTSOuteTTS

LLM-bazita TTS kiu ruliĝas sur CPU, GPU, aŭ retumilo tra llama.cpp kaj Transformers.js.

Lingvoj: en

Kloni voĉon

Pocket TTSPocket TTS

100 mm-a diametro de la ĉasio, kun 100 mm-a diametro de la ĉasio.

Lingvoj: en, fr

Kloni voĉon

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Lingvoj: en, zh, ja, ko, de, es, fr, it, ru

Kloni voĉon

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Lingvoj: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Kloni voĉon

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Lingvoj: en, zh

Kloni voĉon

Programisto-unua API

OpenAI-kongrua REST API. Unu finpunkto, pli ol 22 modeloj. Subteno de fluado por realtempaj aplikaĵoj.

  • OpenAI-kongrua formato
  • Flua TTS por realtempaj aplikaĵoj
  • Batch- prilaborado por grandaj taskoj
  • Webhook-atentigoj
Rigardi API- dokumentojn
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Simpla, Travidebla Prezigo

Komencu libera. Skaliĝu dum vi kreskas.

Libera

$0

15, 000 signoj

  • Kokoro, Piper, VITS, MeloTTS
  • Limito de 500 signoj
  • 3 gen/ horo (sen konto)
Aliĝi senpage

Lanĉilo

$9/monatoj

500 kreditoj/monato

  • Ĉiuj 22+ modeloj
  • 100, 000 signoj po generacio
  • Voĉa klonado
Komenci
Plej populara

Pro

$29/monatoj

2,000 kreditoj/monato

  • Ĉio en Startilo
  • API- aliro
  • Prioritata prilaborado
Get Pro

Negoco

$99/monatoj

10,000 kreditoj/monato

  • Ĉio en Pro
  • Bulka API
  • Prioritata vico
Preni taskon

Vidu ĉiujn planojn inkluzive de kreditpakaĵoj →

Oftaj demandoj

TTS.ai estas la plej ampleksa AI-voĉa platformo, kiu ofertas pli ol 22 tekst-al-parolo-modelojn, voĉan klonadon, parolon-al-tekston, kaj aŭdajn ilojn. Ĉiuj modeloj estas malfermkodaj sen vendisto-ŝloso.

Jes! TTS.ai ofertas senpage tekst-al-vortan tradukadon per Kokoro, Piper, VITS, kaj MeloTTS modeloj. Neniu konto necesas. Aliĝi por ricevi 15,000 senpagajn signojn kaj aliron al ĉiuj modeloj. Pagaj planoj komenciĝas je $9/monate.

Por rapideco, uzu Kokoro aŭ Piper. Por kvalito, provu CosyVoice 2 aŭ StyleTTS 2. Por voĉklonado, uzu Chatterbox aŭ GPT- SoVITS. Por dialogo, uzu Dia TTS. Provu plurajn modelojn sur la sama teksto por kompari.

Jes. OpenAI-kongrua REST API por TTS, STT, voĉ-klonado, kaj aŭdaj iloj. Disponebla ĉe Pro ($29/mo) kaj Enterprise ($99/mo) planoj. Vidu dokumentaron ĉe tts.ai/api/.

La voĉkvalito varias laŭ modelo. Premium-modeloj kiel CosyVoice 2, StyleTTS 2, kaj Chatterbox produktas preskaŭ homan kvaliton de parolado kun natura intonacio kaj emocio. Senpagaj modeloj kiel Kokoro ofertas elstaran kvaliton por plej multaj uzadoj.

TTS.ai subtenas pli ol 30 lingvojn tra sia modelbiblioteko. La angla havas la plej ampleksan modelan subtenon, sed modeloj kiel CosyVoice 2 kovras la ĉinan, japanan kaj korean; GPT-SoVITS pritraktas la ĉinan, japanan, korean kaj la anglan; kaj MeloTTS subtenas la anglan, hispanan, francan, ĉinan, japanan kaj korean.

Jes. Ĉiuj prilaboradoj okazas sur niaj dediĉitaj GPU- serviloj. Ni ne konservas vian tekstan enmeton aŭ generitan sonon post liverado. Alŝutitaj voĉaj specimenoj por klonado estas uzataj nur por la nuna seanco kaj ne estas konservitaj. Ni neniam kunhavas viajn datumojn kun triaj aŭ uzas ilin por trejni modelojn.

Jes. Ĉiuj sonoj kreitaj per TTS.ai estas viaj por komerca uzo, inkluzive por YouTube-videoj, podkastoj, aŭdlibroj, aplikaĵoj, reklamoj kaj produktoj. Niaj modeloj estas malfermkodaj laŭ permesaj permesiloj (MIT, Apache 2.0). Neniu rajto aŭ atribuo necesas.

TTS.ai defaŭlte generas sonon en WAV-formato por maksimuma kvalito. Vi povas konverti al MP3, FLAC, OGG, aŭ M4A uzante nian senpagan sonkonvertilon. La API subtenas specifi vian preferatan eligoformaton rekte en la peto.

Alŝutu mallongan sonspecimenon (ne pli ol 5 sekundoj) de la voĉo kiun vi volas kloni, tiam tajpu iun ajn tekston por generi parolon en tiu voĉo. Modeloj kiel Chatterbox, GPT-SoVITS, kaj CosyVoice 2 subtenas voĉan klonadon. La klonita voĉo kaptas tonon, akĉenton, kaj parolan stilon.

Senpagaj modeloj (Kokoro, Piper, VITS, MeloTTS) ne postulas konton kaj kostas nulon da kreditoj. Normalaj modeloj (2 kreditoj/1K signoj) inkluzivas Bark, CosyVoice 2, F5-TTS, kaj Dia. Premium-modeloj (4 kreditoj/1K signoj) inkluzivas OpenVoice, Chatterbox, StyleTTS 2, kaj Tortoise. Pagaj modeloj ĝenerale ofertas pli altan kvaliton, pli da voĉoj, kaj aldonajn funkciojn kiel voĉklonado.

Jes. La API subtenas batch-procezon por konverti grandajn volumojn de teksto al parolado. Sendu plurajn petojn kaj retrovu rezultojn nesinkrone uzante laborajn UUID-ojn. Enterprise-planoj ($99/mo) inkluzivas prioritatan aliron al vicoj por pli rapida batch-procezado. Ideala por produktado de sonlibroj, kursa enhavo, kaj grandskalaj voĉaj projektoj.
4.1/5 (21)

What could we improve? Your feedback helps us fix issues.

Komenci uzi AI-voĉon hodiaŭ

Aliĝi al kreintoj, programistoj kaj entreprenoj uzantaj TTS.ai