Raporti cimon / funkcipeton

Malfermkoda teksto- al- parolmodeloName

Ĉiu TTS- modelo sur nia platformo estas malfermkoda kun komerce favoraj permesiloj. MIT, Apache 2. 0 — neniu proprietrajta ŝlosilo, neniu uza limigo, neniu surpriza licenca kotizo. Uzu ilin tra nia gastigita API, aŭ mem gastigu ilin sur via propra infrastrukturo kun plena kontrolo.

Malferma fonto MIT-permesilo Apache Mem- gastigebla GitHub

Plena TTS-redaktilo API-dokumentoj

Provu nun

0/500

Libera kun Kokoro, Piper, VITS, MeloTTS

Via generita sono aperos tie ĉi

Malfermi plenan TTS-redaktilon

Liberkoda TTS- avantaĝoj

Kial malfermkodaj modeloj gravas por viaj projektoj

Ĉiuj malfermkodaj licencoj

Ĉiu modelo en TTS.ai uzas permesan malfermkodan permesilon. Neniuj proprietaj nigraj skatoloj, neniuj vendisto-ŝlosoj, neniuj neatenditaj licencaj kotizoj.

MIT / Apache

Modeloj estas licencitaj sub MIT aŭ Apache 2. 0, la plej permesaj malfermkodaj permesiloj. Komerce uzi, modifi, redistribui — sen limigoj.

Mem- gastigebla

Elŝuti iun ajn modelon kaj ruli ĝin sur via propra aparataro. Plena kontrolo super viaj datumoj, latenco, kaj infrastrukturo. Neniu nuba dependeco necesas.

GPU optimumigita

Modeloj estas optimumigitaj por NVIDIA GPUoj kun CUDA subteno. Piper ruliĝas nur sur CPU. Plej modeloj bezonas 2-8GB VRAM por efika deduktado.

Komunuma prizorgo

Aktivaj malfermkodaj komunumoj prizorgas kaj plibonigas tiujn modelojn. Bonvenaj estas kontribuoj — sendu erarojn, plibonigojn, kaj novajn voĉojn ĉe GitHub.

Komerca uzo OK

Ĉiuj modeloj permesas komercan uzon laŭ siaj licencoj. Konstruu produktojn, vendu servojn, kaj kreu komercan enhavon sen rajtigoj aŭ uzkostoj.

Nia katalogo de malfermitkodaj modeloj

Ĉiu modelo, ĝia licenco, kaj kion ĝi faras plej bone

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Plej bona por: Apache 2.0 — plej bona kvalito libera modelo, 82M parametroj, facila por mem gastigi

Provu Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Plej bona por: MIT — nur CPU, perfekta por periferiaj aparatoj kaj enkorpigita mem- gastigado

Provu Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Plej bona por: MIT — fundamenta arkitekturo uzata de multaj malsupraj modeloj

Provu VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Plej bona por: MIT — unikaj kapabloj de aŭdgenerado trans la norma TTS

Provu Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Voĉa klonado

Plej bona por: Apache 2.0 — maksimuma kvalito, amplekse studita referenca realigo

Provu Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Voĉa klonado

Plej bona por: MIT — malfermkoda voĉklonado kun granula stilkontrolo

Provu OpenVoice

Kiel uzi malfermkodan TTS

Uzi nian gastigantan API aŭ lanĉi modelojn mem

Esploras malfermkodajn modelojn

Rigardu nian katalogon de pli ol 20 malfermkodaj TTS-modeloj. Ĉiu modelopaĝo montras la permesilon, arkitekturon, kapablojn, kaj mem-gastigajn postulojn.

Provu en via retumilo

Testu iun ajn modelon rekte sur TTS.ai sen instali ion ajn. Niaj GPU-serviloj pritraktas la prilaboradon, do vi povas taksi la kvaliton antaŭ ol decidi pri mem-gastigado.

Mem- gastigi aŭ uzi nian API

Kloni modelajn deponejojn de GitHub kaj ruli lokajn, aŭ uzi nian gastigantan API por produktado. Mem-hostado donas plenan kontrolon; nia API provizas administritan infrastrukturon.

Konstrui vian aplikaĵon

Integri TTS en vian produkton uzante mem-gastigatajn modelojn aŭ nian REST API. Ĉiuj modeloj estas komerce uzeblaj sen licencaj kotizoj aŭ rajtigoj.

Komparo de permesiloj

Ĉiuj modeloj en TTS.ai uzas komerce-amikajn malfermkodajn licencojn

& Modelo:	Licenco	Atribuo
Kokoro	Apache 2.0	Necesa
Piper	MIT	Opcia
VITS	MIT	Opcia
MeloTTS	MIT	Opcia
Chatterbox	MIT	Opcia
Tortoise TTS	Apache 2.0	Necesa
StyleTTS 2	MIT	Opcia
OpenVoice	MIT	Opcia
Sesame CSM	Apache 2.0	Necesa
Orpheus	Llama 3.2	"Built with Llama"

Provu ĉi tiujn modelojn senpage

Mem- gastigado kontraŭ gastigita API

Ruli modelojn mem aŭ lasi nin prizorgi la infrastrukturon

Self- Host sur via aparataro

Ĉiu modelo en TTS.ai estas havebla kiel malfermkoda projekto ĉe GitHub aŭ Hugging Face. Elŝutu la pezojn, instalu la dependecojn, kaj lanĉu inferecon sur viaj propraj GPUoj. Vi havas plenan kontrolon pri latenco, privateco, kaj skalado.

Plena datuma privateco - la sono neniam forlasas vian servilon
Neniu kosto por ĉiu peto post komenca agordo
Propra agordado de viaj propraj datumoj
Bezonas GPU- aparataron (NVIDIA rekomendita)
Vi administras ĝisdatigojn, skaladon, kaj dependecojn

Uzi la gastigantan API de TTS.ai

Akiru tujan aliron al ĉiuj 20+ modeloj tra ununura REST API. Ni prizorgas GPU-provizon, modelajn ĝisdatigojn, vicadministradon, kaj skaladon. Unu API-ŝlosilo donas al vi aliron al ĉiu modelo — ne necesas administri apartajn disvolviĝojn.

Neniu GPU- aparataro bezonata
Ĉiuj 20+ modeloj tra unu API
Aŭtomata ĝisdatigo kaj plibonigo de modeloj
99. 9% disponebleco kun redunda infrastrukturo
Pagu nur por tio, kion vi uzas

Anstataŭe uzi gastigantan API

Rapidstarto: API aŭ mem- gastiganto

Uzi nian gastigantan API, aŭ instali Kokoron loke en kelkaj minutoj

Opcio 1: TTS.ai gastigita API Plej facila

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opcio 2: mem- gastiganto kun pip Plena kontrolo

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Montri API- dokumentaron

Malferma fonto, malmultekosta

Nia gastigita API faras malfermkodan TTS-on alirebla sen administri GPU-ojn.

Libera tavolo

15, 000 signoj ĉe enskribo

4 malfermitkodaj modeloj senpage
Neniu aliĝo por baza uzo
Komerca uzo permesita

Lanĉilo

500 kreditoj/monato

Ĉiuj 20+ malfermkodaj modeloj
Voĉa klonado
API- aliro

Pro

$29

2000 kreditoj/monato

Prioritata GPU- prilaborado
Ĉiuj premium-modeloj
Subteno por entreprenoj

Vidu plenan priskribon

Oftaj demandoj

Oftaj demandoj pri malfermkoda teksto-al-vorto

Jes. Ĉiu modelo en TTS.ai uzas permesan malfermkodan permesilon — aŭ MIT aŭ Apache 2.0. Ni specife ekskludas modelojn kun limigitaj permesiloj (kiel CPML de Coqui aŭ nekomerca CC-BY-NC). Vi povas kontroli la permesilon de ĉiu modelo en ĝia GitHub-deponejo.

Ambaŭ estas permesaj malfermkodaj permesiloj kiuj permesas komercan uzon, modifadon kaj redistribuadon. Apache 2. 0 aldonas eksplicitajn patentajn permesojn kaj postulas deklari ŝanĝojn se vi modifas la kodon. MIT estas pli simpla kun malpli da postuloj. Ambaŭ estas komercemaj.

Jes. Ĉiu modelo povas esti mem-gastigata. Klonu la modelan deponejon de GitHub, instalu dependecojn, elŝutu modelajn pezojn, kaj lanĉu dedukton. Ni provizas dokumentaron por ĉiu modelo mem-gastigaj postuloj inkluzive de GPU, RAM, kaj Pitona versio.

Postuloj varias laŭ modelo. Piper bezonas neniun GPU (nur CPU). Kokoro kaj MeloTTS bezonas 1-2GB VRAM. Plej multaj normaj modeloj bezonas 4GB VRAM. Tortoise kaj Sesame CSM bezonas 8GB. NVIDIA RTX 3060 (12GB) povas ruli plej multajn modelojn komforte.

Jes. Malfermkodaj licencoj permesas modifadon inkluzive de finpolurado. Modeloj kiel GPT-SoVITS kaj Bark disponigas finpolurajn skriptojn. Vi povas trejni modelojn sur viaj propraj voĉaj datumoj por krei proprajn voĉojn aŭ plibonigi rendimenton por specifaj lingvoj.

La plej bonaj malfermkodaj modeloj (Kokoro, StyleTTS 2, Chatterbox) nun egalas aŭ superas komercajn servojn kiel ElevenLabs kaj Google TTS laŭ kvalitaj kriterioj. La ĉefa avantaĝo de komercaj servoj estas administrita infrastrukturo kaj subteno, ne sonkvalito.

Ni jam ekskludis ilin. XTTS/XTTS-v2 (Coqui's CPML — nekomerca), F5-TTS (CC-BY-NC — nekomerca), kaj Higgs-v2 (Boson License — restrikta) estis ĉiuj forigitaj. Ĉiu modelo en TTS.ai estas kontrolita por komerca uzo.

Jes. Plej multaj modeloj akceptas kontribuojn de la komunumo per GitHub. Vi povas sendi eraroraportojn, voĉajn registraĵojn por novaj lingvoj, kodajn plibonigojn, kaj dokumentaron. Kontrolu la GitHub-deponejon de ĉiu modelo por kontribuaj gvidlinioj kaj aktivaj problemoj.

Ŝargi modelojn laŭ postulo kaj malŝargi kiam neaktiva por kunhavigi GPU-memoron. Nia GPU-servilo ruligas pli ol 20 modelojn sur 4x Tesla P40 (96GB totala VRAM) uzante dinamikan ŝargadon. Por mem-gastigado, ununura 24GB GPU povas servi 3-5 modelojn samtempe.

Multaj modeloj provizas oficialajn Docker-bildojn aŭ Docker-dosierojn. Por ruli plurajn modelojn, vi povas konstrui propran Docker-agordon per NVIDIA Container Toolkit por GPU-aliro. Nia API-servila arkitekturo povas servi kiel referenca realigo.

Plej multaj modeloj bezonas Pitonon 3.10-3.12. Coqui TTS (VITS) specife bezonas Pitonon 3.11. Ni rekomendas Pitonon 3.12 por plej multaj modeloj. Kontrolu la dosierujon requirements.txt de ĉiu modelo por ekzakta versia kongrueco.

Jes. La permesiloj MIT kaj Apache 2. 0 eksplicite permesas komercan uzon. Vi povas konstrui SaaS- produktojn, poŝtelefonajn aplikaĵojn, ludojn kaj servojn uzante tiujn modelojn sen permesil- kotizoj, rajt- pagoj, aŭ atribuo- postuloj (kvankam atribuo estas aprezata).

5.0/5 (1)

Provu malfermkodan TTS hodiaŭ

20+ malfermkodaj modeloj, ĉiuj komerce licencitaj. Uzu nian API aŭ mem-gastigadon — la elekto estas via.

Aliĝi senpage Rigardi prezojn

Malfermkoda teksto- al- parolmodeloName

Provu nun

Ĉu vi ŝatas TTS.ai? Diru al viaj amikoj!

Liberkoda TTS- avantaĝoj

Ĉiuj malfermkodaj licencoj

MIT / Apache

Mem- gastigebla

GPU optimumigita

Komunuma prizorgo

Komerca uzo OK

Nia katalogo de malfermitkodaj modeloj

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Kiel uzi malfermkodan TTS

Esploras malfermkodajn modelojn

Provu en via retumilo

Mem- gastigi aŭ uzi nian API

Konstrui vian aplikaĵon

Komparo de permesiloj

Mem- gastigado kontraŭ gastigita API

Self- Host sur via aparataro

Uzi la gastigantan API de TTS.ai

Rapidstarto: API aŭ mem- gastiganto

Malferma fonto, malmultekosta

Libera tavolo

Lanĉilo

Pro

Oftaj demandoj

Ĉu ĉiuj TTS.ai modeloj vere estas malferma fonto?

Kio estas la diferenco inter la permesiloj MIT kaj Apache 2.0?

Ĉu mi povas mem gastigi tiujn modelojn sur mia propra servilo?

Kiun grafikan procesoron mi bezonas por mem gastigi TTS-modelojn?

Ĉu mi povas plibonigi malfermkodajn TTS-modelojn?

Kiel malferm-fontaj TTS-modeloj komparas al komercaj servoj?

Ĉu ekzistas modeloj kun limigitaj permesiloj, kiujn mi evitu?

Ĉu mi povas kontribui al tiuj malfermkodaj modeloj?

Kiel mi rulas plurajn modelojn sur unu GPU-servilo?

Ĉu ekzistas Docker-bildo por mem-gastigado?

Kiun version de Pitono mi bezonas por memgastigado?

Ĉu mi povas konstrui komercan produkton uzante tiujn modelojn?

Provu malfermkodan TTS hodiaŭ