Libera AI Teksto- al- ParoloComment

22+ malfermkodaj modeloj, 100+ voĉoj, 32+ Lingvoj. Neniu konto necesas.

0/500 signoj Libera
Neniu kreditkarto 50 liberaj kreditoj 32+ lingvoj Komerca uzo OK
0:00 / 0:00
Elŝuti sonon Ligo eksvalidiĝas post 24 horoj
Kiel TTS.ai? Diru al viaj amikoj!

22+ AI voĉaj modeloj

La plej ampleksa kolekto de malfermkodaj TTS-modeloj en unu platformo

KokoroKokoro Free

Kokoro estas 82-miliona parametra teksto-al-parolo-modelo kiu bone superas sian pezan klason. Spite sian malgrandan grandecon, ĝi produktas rimarkinde naturan kaj esprimplenan paroladon. Kokoro subtenas plurajn lingvojn inkluzive de la angla, japana, ĉina, kaj korea kun vario de esprimplenaj voĉoj. Ĝi funkcias nekredeble rapide — generante sonon preskaŭ 100-oble pli rapide ol realtempa sur GPU.

Plej bona por: Altkvalita TTS kun minimuma prokrasto, fluantaj aplikaĵoj

Provu senpage

PiperPiper Free

Piper estas malpeza teksto-al-vorta motoro evoluigita de Rhasspy kiu uzas VITS kaj larynx arkitekturojn. Ĝi ruliĝas tute sur CPU, kio faras ĝin ideala por periferiaj aparatoj, hejma aŭtomatigo, kaj aplikaĵoj kiuj bezonas senretan TTS. Kun pli ol 100 voĉoj en pli ol 30 lingvoj, Piper liveras nature sonantan paroladon je realtempa rapideco eĉ sur Raspberry Pi 4.

Plej bona por: Rapidaj antaŭrigardoj, alirebleco, kaj enkorpigitaj aplikaĵoj

Provu senpage

VITSVITS Free

VITS (Variaciona Inferigo kun Kontraŭstara Lernado por Fina Fina Tekst- al- Parola Metodo) estas paralela fin- al- fina TTS- metodo kiu generas pli nature sonantan sonon ol nunaj du- paŝaj modeloj. Ĝi adoptas variacionan inferigon plifortigitan per normaligaj fluoj kaj kontraŭstara trejna procezo, atingante signifan plibonigon en natureco.

Plej bona por: Ĝeneraluzebla teksto-al-vorto kun natura prozodioName

Provu senpage

MeloTTSMeloTTS Free

MeloTTS de MyShell. ai estas multlingva TTS- biblioteko subtenanta la anglan (usonan, britan, hindan, aŭstralian), la hispanan, la francan, la ĉinan, la japanan, kaj la korean. Ĝi estas ekstreme rapida, traktante tekston je preskaŭ realtempa rapideco nur per CPU. MeloTTS estas desegnita por produkta uzo kaj subtenas kaj CPU kaj GPU- dedukton.

Plej bona por: Produktivaj aplikaĵoj kiuj bezonas rapidan, multlingvan TTS

Provu senpage

BarkBark Standard

Transform-bazita teksto-al-aŭda modelo kiu generas realisman paroladon, muzikon, kaj sonajn efektojn.

Programisto: Suno · Licenco: MIT

Provu ĝin

Bark SmallBark Small Standard

Malpeza versio de Bark kun pli rapida deduktado kaj pli malalta memoro-uzo.

Programisto: Suno · Licenco: MIT

Provu ĝin

CosyVoice 2CosyVoice 2 Standard

Alibaba's skalebla streaming TTS kun homa-pareco natureco kaj preskaŭ nula latenteco.

Programisto: Alibaba (Tongyi Lab) · Licenco: Apache 2.0

Provu ĝin

Dia TTSDia TTS Standard

Multi-parolanto dialogo generacio modelo kiu kreas naturajn konversaciojn inter parolantoj.

Programisto: Nari Labs · Licenco: Apache 2.0

Provu ĝin

Parler TTSParler TTS Standard

Priskribu la voĉon kiun vi volas en natura lingvo kaj Parler kreos kongruan paroladon.

Programisto: Hugging Face · Licenco: Apache 2.0

Provu ĝin

IndexTTS-2IndexTTS-2 Standard

Ĝenerale oni parolas pri TTT-legilo, kiu havas bonan grafikan interfacon kaj altan rapidecon.

Programisto: Index Team · Licenco: Apache 2.0

Provu ĝin

Spark TTSSpark TTS Standard

Voĉo klonado TTS kun kontrolata emocio kaj parola stilo tra alvokoj.

Programisto: SparkAudio · Licenco: Apache 2.0

Provu ĝin

GPT-SoVITSGPT-SoVITS Standard

Kelkaj voĉoj klonado TTS kiu replikas ajnan voĉon de nur 5 sekundoj de aŭdo.

Programisto: RVC-Boss · Licenco: MIT

Provu ĝin

OrpheusOrpheus Standard

100.000 horoj da parolaj datumoj.

Programisto: Canopy Labs · Licenco: Llama 3.2 Community

Provu ĝin

Qwen3 TTSQwen3 TTS Standard

Alibaba's multlingva TTS kun voĉo klonado, antaŭdifinitaj voĉoj, kaj voĉo dezajno de teksto.

Programisto: Alibaba (Qwen) · Licenco: Apache 2.0

Provu ĝin

ChatterboxChatterbox Premium

Ŝtata-de-la-arto zero-shot voĉo klonado kun emocia kontrolo de Resemble AI.

Kvalito:

Provu ĝin

Tortoise TTSTortoise TTS Premium

Plurvoĉa teksto-al-parolo fokusiĝas je kvalito kun aŭtoregresiva arkitekturo.

Kvalito:

Provu ĝin

StyleTTS 2StyleTTS 2 Premium

Teksto-al-parolo je homa nivelo per stila disvastigo kaj kontraŭstara trejnado.

Kvalito:

Provu ĝin

OpenVoiceOpenVoice Premium

Tuja voĉo klonado kun granulara kontrolo super stilo, emocio, kaj akcento.

Kvalito:

Provu ĝin

CosyVoice 2CosyVoice 2

Alibaba's skalebla streaming TTS kun homa-pareco natureco kaj preskaŭ nula latenteco.

Lingvoj: en, zh, ja, ko, fr, de, it, es

Kloni voĉon

IndexTTS-2IndexTTS-2

Ĝenerale oni parolas pri TTT-legilo, kiu havas bonan grafikan interfacon kaj altan rapidecon.

Lingvoj: en, zh

Kloni voĉon

Spark TTSSpark TTS

Voĉo klonado TTS kun kontrolata emocio kaj parola stilo tra alvokoj.

Lingvoj: en, zh

Kloni voĉon

GPT-SoVITSGPT-SoVITS

Kelkaj voĉoj klonado TTS kiu replikas ajnan voĉon de nur 5 sekundoj de aŭdo.

Lingvoj: en, zh, ja, ko

Kloni voĉon

ChatterboxChatterbox

Ŝtata-de-la-arto zero-shot voĉo klonado kun emocia kontrolo de Resemble AI.

Lingvoj: en

Kloni voĉon

Tortoise TTSTortoise TTS

Plurvoĉa teksto-al-parolo fokusiĝas je kvalito kun aŭtoregresiva arkitekturo.

Lingvoj: en

Kloni voĉon

OpenVoiceOpenVoice

Tuja voĉo klonado kun granulara kontrolo super stilo, emocio, kaj akcento.

Lingvoj: en, zh, ja, ko, fr, de, es, it

Kloni voĉon

Qwen3 TTSQwen3 TTS

Alibaba's multlingva TTS kun voĉo klonado, antaŭdifinitaj voĉoj, kaj voĉo dezajno de teksto.

Lingvoj: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloni voĉon

Programisto-unua API

OpenAI-kongrua REST API. Unu finpunkto, pli ol 22 modeloj. Subteno de fluado por realtempaj aplikaĵoj.

  • OpenAI-kongrua formato
  • Flua TTS por realtempaj aplikaĵoj
  • Batch- prilaborado por grandaj taskoj
  • Webhook-atentigoj
Rigardi API- dokumentojn
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Simpla, Travidebla Prezigo

Komencu libera. Skaliĝu dum vi kreskas.

Libera

$0

50 kreditoj

  • Kokoro, Piper, VITS, MeloTTS
  • Limito de 500 signoj
  • 3 gen/ horo (sen konto)
Aliĝi senpage

Lanĉilo

$9/monatoj

500 kreditoj/monato

  • Ĉiuj 22+ modeloj
  • Limito de 5000 signoj
  • Voĉa klonado
Komenci
Plej populara

Pro

$29/monatoj

2,000 kreditoj/monato

  • Ĉio en Startilo
  • API- aliro
  • Prioritata prilaborado
Get Pro

Enterpriseusa. kgm

$99/monatoj

10,000 kreditoj/monato

  • Ĉio en Pro
  • Bulka API
  • Prioritata vico
Kontakti Vendistojn

Vidu ĉiujn planojn inkluzive de kreditpakaĵoj →

Oftaj demandoj

TTS.ai estas la plej ampleksa AI-voĉa platformo, kiu ofertas pli ol 22 tekst-al-parolo-modelojn, voĉan klonadon, parolon-al-tekston, kaj aŭdajn ilojn. Ĉiuj modeloj estas malfermkodaj sen vendisto-ŝloso.

Jes! TTS.ai ofertas senpagan tekst-al-parolon kun Kokoro, Piper, VITS, kaj MeloTTS modeloj. Neniu konto necesas. Registriĝu por ricevi 50 senpagajn kreditojn kaj aliron al ĉiuj modeloj. Pagaj planoj komenciĝas je $9/monate.

Por rapideco, uzu Kokoro aŭ Piper. Por kvalito, provu CosyVoice 2 aŭ StyleTTS 2. Por voĉklonado, uzu Chatterbox aŭ GPT- SoVITS. Por dialogo, uzu Dia TTS. Provu plurajn modelojn sur la sama teksto por kompari.

Jes. OpenAI-kongrua REST API por TTS, STT, voĉ-klonado, kaj aŭdaj iloj. Disponebla ĉe Pro ($29/mo) kaj Enterprise ($99/mo) planoj. Vidu dokumentaron ĉe tts.ai/api/.

La voĉkvalito varias laŭ modelo. Premium-modeloj kiel CosyVoice 2, StyleTTS 2, kaj Chatterbox produktas preskaŭ homan kvaliton de parolado kun natura intonacio kaj emocio. Senpagaj modeloj kiel Kokoro ofertas elstaran kvaliton por plej multaj uzadoj.

TTS.ai subtenas pli ol 30 lingvojn tra sia modelbiblioteko. La angla havas la plej ampleksan modelan subtenon, sed modeloj kiel CosyVoice 2 kovras la ĉinan, japanan kaj korean; GPT-SoVITS pritraktas la ĉinan, japanan, korean kaj la anglan; kaj MeloTTS subtenas la anglan, hispanan, francan, ĉinan, japanan kaj korean.

Jes. Ĉiuj prilaboradoj okazas sur niaj dediĉitaj GPU- serviloj. Ni ne konservas vian tekstan enmeton aŭ generitan sonon post liverado. Alŝutitaj voĉaj specimenoj por klonado estas uzataj nur por la nuna seanco kaj ne estas konservitaj. Ni neniam kunhavas viajn datumojn kun triaj aŭ uzas ilin por trejni modelojn.

Jes. Ĉiuj sonoj kreitaj per TTS.ai estas viaj por komerca uzo, inkluzive por YouTube-videoj, podkastoj, aŭdlibroj, aplikaĵoj, reklamoj kaj produktoj. Niaj modeloj estas malfermkodaj laŭ permesaj permesiloj (MIT, Apache 2.0). Neniu rajto aŭ atribuo necesas.

TTS.ai defaŭlte generas sonon en WAV-formato por maksimuma kvalito. Vi povas konverti al MP3, FLAC, OGG, aŭ M4A uzante nian senpagan sonkonvertilon. La API subtenas specifi vian preferatan eligoformaton rekte en la peto.

Alŝutu mallongan sonspecimenon (ne pli ol 5 sekundoj) de la voĉo kiun vi volas kloni, tiam tajpu iun ajn tekston por generi parolon en tiu voĉo. Modeloj kiel Chatterbox, GPT-SoVITS, kaj CosyVoice 2 subtenas voĉan klonadon. La klonita voĉo kaptas tonon, akĉenton, kaj parolan stilon.

Senpagaj modeloj (Kokoro, Piper, VITS, MeloTTS) ne postulas konton kaj kostas nulon da kreditoj. Normalaj modeloj (2 kreditoj/1K signoj) inkluzivas Bark, CosyVoice 2, F5-TTS, kaj Dia. Premium-modeloj (4 kreditoj/1K signoj) inkluzivas OpenVoice, Chatterbox, StyleTTS 2, kaj Tortoise. Pagaj modeloj ĝenerale ofertas pli altan kvaliton, pli da voĉoj, kaj aldonajn funkciojn kiel voĉklonado.

Jes. La API subtenas batch-procezon por konverti grandajn volumojn de teksto al parolado. Sendu plurajn petojn kaj retrovu rezultojn nesinkrone uzante laborajn UUID-ojn. Enterprise-planoj ($99/mo) inkluzivas prioritatan aliron al vicoj por pli rapida batch-procezado. Ideala por produktado de sonlibroj, kursa enhavo, kaj grandskalaj voĉaj projektoj.
5.0/5 (1)

Komenci uzi AI-voĉon hodiaŭ

Aliĝi al kreintoj, programistoj kaj entreprenoj uzantaj TTS.ai