Malfermkoda teksto- al- parolmodeloName

Ĉiu TTS- modelo sur nia platformo estas malfermkoda kun komerce favoraj permesiloj. MIT, Apache 2. 0 — neniu proprietrajta ŝlosilo, neniu uza limigo, neniu surpriza licenca kotizo. Uzu ilin tra nia gastigita API, aŭ mem gastigu ilin sur via propra infrastrukturo kun plena kontrolo.

Malferma fonto MIT-permesilo Apache Mem- gastigebla GitHub

Provu nun

0/500
Libera kun Kokoro, Piper, VITS, MeloTTS
Your generated audio will appear here
Generita
0:00 0:00
Elŝuti
Kiel TTS.ai? Diru al viaj amikoj!

Liberkoda TTS- avantaĝoj

Kial malfermkodaj modeloj gravas por viaj projektoj

Ĉiuj malfermkodaj licencoj

Ĉiu modelo en TTS.ai uzas permesan malfermkodan permesilon. Neniuj proprietaj nigraj skatoloj, neniuj vendisto-ŝlosoj, neniuj neatenditaj licencaj kotizoj.

MIT / Apache

Modeloj estas licencitaj sub MIT aŭ Apache 2. 0, la plej permesaj malfermkodaj permesiloj. Komerce uzi, modifi, redistribui — sen limigoj.

Mem- gastigebla

Elŝuti iun ajn modelon kaj ruli ĝin sur via propra aparataro. Plena kontrolo super viaj datumoj, latenco, kaj infrastrukturo. Neniu nuba dependeco necesas.

GPU optimumigita

Modeloj estas optimumigitaj por NVIDIA GPUoj kun CUDA subteno. Piper ruliĝas nur sur CPU. Plej modeloj bezonas 2-8GB VRAM por efika deduktado.

Komunuma prizorgo

Aktivaj malfermkodaj komunumoj prizorgas kaj plibonigas tiujn modelojn. Bonvenaj estas kontribuoj — sendu erarojn, plibonigojn, kaj novajn voĉojn ĉe GitHub.

Komerca uzo OK

Ĉiuj modeloj permesas komercan uzon laŭ siaj licencoj. Konstruu produktojn, vendu servojn, kaj kreu komercan enhavon sen rajtigoj aŭ uzkostoj.

Nia katalogo de malfermitkodaj modeloj

Ĉiu modelo, ĝia licenco, kaj kion ĝi faras plej bone

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Plej bona por: Apache 2.0 — plej bona kvalito libera modelo, 82M parametroj, facila por mem gastigi

Provu Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Plej bona por: MIT — nur CPU, perfekta por periferiaj aparatoj kaj enkorpigita mem- gastigado

Provu Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Plej bona por: MIT — fundamenta arkitekturo uzata de multaj malsupraj modeloj

Provu VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Plej bona por: MIT — unikaj kapabloj de aŭdgenerado trans la norma TTS

Provu Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Voĉa klonado

Plej bona por: Apache 2.0 — maksimuma kvalito, amplekse studita referenca realigo

Provu Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Voĉa klonado

Plej bona por: MIT — malfermkoda voĉklonado kun granula stilkontrolo

Provu OpenVoice

Kiel uzi malfermkodan TTS

Uzi nian gastigantan API aŭ lanĉi modelojn mem

1

Esploras malfermkodajn modelojn

Rigardu nian katalogon de pli ol 20 malfermkodaj TTS-modeloj. Ĉiu modelopaĝo montras la permesilon, arkitekturon, kapablojn, kaj mem-gastigajn postulojn.

2

Provu en via retumilo

Testu iun ajn modelon rekte sur TTS.ai sen instali ion ajn. Niaj GPU-serviloj pritraktas la prilaboradon, do vi povas taksi la kvaliton antaŭ ol decidi pri mem-gastigado.

3

Mem- gastigi aŭ uzi nian API

Kloni modelajn deponejojn de GitHub kaj ruli lokajn, aŭ uzi nian gastigantan API por produktado. Mem-hostado donas plenan kontrolon; nia API provizas administritan infrastrukturon.

4

Konstrui vian aplikaĵon

Integri TTS en vian produkton uzante mem-gastigatajn modelojn aŭ nian REST API. Ĉiuj modeloj estas komerce uzeblaj sen licencaj kotizoj aŭ rajtigoj.

Komparo de permesiloj

Ĉiuj modeloj en TTS.ai uzas komerce-amikajn malfermkodajn licencojn

& Modelo: Licenco Komerca uzo Ŝanĝo Memkomputilo Atribuo
Kokoro Apache 2.0 Necesa
Piper MIT Opcia
VITS MIT Opcia
MeloTTS MIT Opcia
Chatterbox MIT Opcia
Tortoise TTS Apache 2.0 Necesa
StyleTTS 2 MIT Opcia
OpenVoice MIT Opcia
Sesame CSM Apache 2.0 Necesa
Orpheus Llama 3.2 "Built with Llama"

Mem- gastigado kontraŭ gastigita API

Ruli modelojn mem aŭ lasi nin prizorgi la infrastrukturon

Self- Host sur via aparataro

Ĉiu modelo en TTS.ai estas havebla kiel malfermkoda projekto ĉe GitHub aŭ Hugging Face. Elŝutu la pezojn, instalu la dependecojn, kaj lanĉu inferecon sur viaj propraj GPUoj. Vi havas plenan kontrolon pri latenco, privateco, kaj skalado.

  • Plena datuma privateco - la sono neniam forlasas vian servilon
  • Neniu kosto por ĉiu peto post komenca agordo
  • Propra agordado de viaj propraj datumoj
  • Bezonas GPU- aparataron (NVIDIA rekomendita)
  • Vi administras ĝisdatigojn, skaladon, kaj dependecojn

Uzi TTS. ai gastigita API

Akiru tujan aliron al ĉiuj 24+ modeloj tra ununura REST API. Ni prizorgas GPU-provizon, modelajn ĝisdatigojn, vicadministradon, kaj skaladon. Unu API-ŝlosilo donas al vi aliron al ĉiu modelo — ne necesas administri apartajn disvolviĝojn.

  • Neniu GPU- aparataro bezonata
  • Ĉiuj 24+ modeloj tra unu API
  • Aŭtomata ĝisdatigo kaj plibonigo de modeloj
  • 99. 9% disponebleco kun redunda infrastrukturo
  • Pagu nur por tio, kion vi uzas

Rapidstarto: API aŭ mem- gastiganto

Uzi nian gastigantan API, aŭ instali Kokoron loke en kelkaj minutoj

Opcio 1: TTS.ai gastigita API Plej facila
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opcio 2: mem- gastiganto kun pip Plena kontrolo
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Malferma fonto, malmultekosta

Nia gastigita API faras malfermkodan TTS-on alirebla sen administri GPU-ojn.

Libera tavolo

$0

50 kreditoj je aliĝo

  • 4 malfermitkodaj modeloj senpage
  • Neniu aliĝo por baza uzo
  • Komerca uzo permesita

Lanĉilo

$9

500 kreditoj/monato

  • Ĉiuj 24+ malfermkodaj modeloj
  • Voĉa klonado
  • API- aliro

Pro

$29

2000 kreditoj/monato

  • Prioritata GPU- prilaborado
  • Ĉiuj premium-modeloj
  • Subteno por entreprenoj
Vidu plenan priskribon

Oftaj demandoj

Oftaj demandoj pri malfermkoda teksto-al-vorto

Jes. Ĉiu modelo en TTS.ai uzas permesan malfermkodan permesilon — aŭ MIT aŭ Apache 2.0. Ni specife ekskludas modelojn kun limigitaj permesiloj (kiel CPML de Coqui aŭ nekomerca CC-BY-NC). Vi povas kontroli la permesilon de ĉiu modelo en ĝia GitHub-deponejo.

Ambaŭ estas permesaj malfermkodaj permesiloj kiuj permesas komercan uzon, modifadon kaj redistribuadon. Apache 2. 0 aldonas eksplicitajn patentajn permesojn kaj postulas deklari ŝanĝojn se vi modifas la kodon. MIT estas pli simpla kun malpli da postuloj. Ambaŭ estas komercemaj.

Jes. Ĉiu modelo povas esti mem-gastigata. Klonu la modelan deponejon de GitHub, instalu dependecojn, elŝutu modelajn pezojn, kaj lanĉu dedukton. Ni provizas dokumentaron por ĉiu modelo mem-gastigaj postuloj inkluzive de GPU, RAM, kaj Pitona versio.

Postuloj varias laŭ modelo. Piper bezonas neniun GPU (nur CPU). Kokoro kaj MeloTTS bezonas 1-2GB VRAM. Plej multaj normaj modeloj bezonas 4GB VRAM. Tortoise kaj Sesame CSM bezonas 8GB. NVIDIA RTX 3060 (12GB) povas ruli plej multajn modelojn komforte.

Jes. Malfermkodaj licencoj permesas modifadon inkluzive de finpolurado. Modeloj kiel GPT-SoVITS kaj Bark disponigas finpolurajn skriptojn. Vi povas trejni modelojn sur viaj propraj voĉaj datumoj por krei proprajn voĉojn aŭ plibonigi rendimenton por specifaj lingvoj.

La plej bonaj malfermkodaj modeloj (Kokoro, StyleTTS 2, Chatterbox) nun egalas aŭ superas komercajn servojn kiel ElevenLabs kaj Google TTS laŭ kvalitaj kriterioj. La ĉefa avantaĝo de komercaj servoj estas administrita infrastrukturo kaj subteno, ne sonkvalito.

Ni jam ekskludis ilin. XTTS/XTTS-v2 (Coqui's CPML — nekomerca), F5-TTS (CC-BY-NC — nekomerca), kaj Higgs-v2 (Boson License — restrikta) estis ĉiuj forigitaj. Ĉiu modelo en TTS.ai estas kontrolita por komerca uzo.

Jes. Plej multaj modeloj akceptas kontribuojn de la komunumo per GitHub. Vi povas sendi eraroraportojn, voĉajn registraĵojn por novaj lingvoj, kodajn plibonigojn, kaj dokumentaron. Kontrolu la GitHub-deponejon de ĉiu modelo por kontribuaj gvidlinioj kaj aktivaj problemoj.

Ŝargi modelojn laŭ postulo kaj malŝargi kiam neaktiva por kunhavigi GPU-memoron. Nia GPU-servilo ruligas pli ol 20 modelojn sur 4x Tesla P40 (96GB totala VRAM) uzante dinamikan ŝargadon. Por mem-gastigado, ununura 24GB GPU povas servi 3-5 modelojn samtempe.

Multaj modeloj provizas oficialajn Docker-bildojn aŭ Docker-dosierojn. Por ruli plurajn modelojn, vi povas konstrui propran Docker-agordon per NVIDIA Container Toolkit por GPU-aliro. Nia API-servila arkitekturo povas servi kiel referenca realigo.

Plej multaj modeloj bezonas Pitonon 3.10-3.12. Coqui TTS (VITS) specife bezonas Pitonon 3.11. Ni rekomendas Pitonon 3.12 por plej multaj modeloj. Kontrolu la dosierujon requirements.txt de ĉiu modelo por ekzakta versia kongrueco.

Jes. La permesiloj MIT kaj Apache 2. 0 eksplicite permesas komercan uzon. Vi povas konstrui SaaS- produktojn, poŝtelefonajn aplikaĵojn, ludojn kaj servojn uzante tiujn modelojn sen permesil- kotizoj, rajt- pagoj, aŭ atribuo- postuloj (kvankam atribuo estas aprezata).
5.0/5 (1)

Provu malfermkodan TTS hodiaŭ

24+ malfermkodaj modeloj, ĉiuj komerce licencitaj. Uzu nian API aŭ mem-gastigadon — la elekto estas via.