Ilmoita vika / Ominaisuuspyyntö

Avaa lähdekoodin teksti puhemalleille

Jokainen alustamme TTS-malli on avoin lähdekoodi, jossa on kaupallisesti edulliset lisenssit. MIT, Apache 2.0 – ei omalukitusta, ei käyttörajoituksia, ei yllätyslupamaksuja. Käytä niitä isäntärajapintamme kautta tai itseisännät niitä omassa infrastruktuurissasi täysin hallinnassasi.

Avaa lähdekoodi MIT-lisenssi Apache 2.0 Omaehtoinen GitHub

Täysi TTS-muokkain API-lääkärit

Kokeile nyt

0/500

Vapaa Kokoron, Piperin, VITS:n, MeloTTS:n kanssa

Luomasi ääni näkyy tässä

Avaa täysi TTS-muokkain

Avoimen lähdekoodin TTS-edut

Miksi avoimen lähdekoodin malleilla on merkitystä projekteillesi

Kaikki avoimen lähdekoodin lisenssit

Jokainen TTS.ain malli käyttää sallivaa avoimen lähdekoodin lisenssiä. Ei omia mustia laatikoita, ei myyjän lukitusta, ei odottamattomia lisenssimaksuja.

MIT / Apache 2.0

Mallit on lisensoitu MIT:n tai Apache 2.0:n, sallivimpien avoimen lähdekoodin lisenssien, nojalla. Käytä kaupallisesti, muokkaa, jaa – ei rajoituksia.

Omaehtoinen

Lataa mikä tahansa malli ja käytä sitä omalla laitteistollasi. Tietojesi, latenssisi ja infrastruktuurisi täysi hallinta. Pilviriippuvuus ei ole tarpeen.

GPU optimoitu

Mallit on optimoitu NVIDIA GPU -laitteille CUDA-tuella. Piper toimii vain suorittimella. Useimmat mallit tarvitsevat 2-8GB VRAM-muistia tehokasta päättelyä varten.

Yhteisöä ylläpidetään

Aktiiviset avoimen lähdekoodin yhteisöt ylläpitävät ja parantavat näitä malleja. Lahjoitukset ovat tervetulleita – lähettävät vikoja, parannuksia ja uusia ääniä GitHubille.

Kaupallinen käyttö OK

Kaikki mallit mahdollistavat lisenssiensä mukaisen kaupallisen käytön. Rakenna tuotteita, myy palveluita ja luo kaupallista sisältöä ilman rojalteja tai käyttömaksuja.

Avoimen lähdekoodin malliluettelo

Jokainen malli, sen lisenssi ja se, mitä se tekee parhaiten

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Nopea 5/5

Paras: Apache 2.0 – paras laatuvapaa malli, 82M paraamia, helppo itseisäntä

Kokeile Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Nopea 3/5

Paras: MIT – vain prosessori, täydellinen reunalaitteisiin ja itseohjautuviin laitteisiin

Kokeile Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Nopea 3/5

Paras: MIT – monien alapään mallien käyttämä perusarkkitehtuuri

Kokeile VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Hitaasti 4/5

Paras: MIT – TTS-standardia paremmat ainutlaatuiset äänentuotantoominaisuudet

Kokeile Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Hitaasti 5/5 Äänien kloonaus

Paras: Apache 2.0 – huippulaatua, laajalti tutkittu referenssitoteutus

Kokeile Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Keskikoko 4/5 Äänien kloonaus

Paras: MIT – avoimen lähdekoodin äänikloonaus rakeisella tyyliohjauksella

Kokeile OpenVoice

Miten avoimen lähdekoodin TTS:ää käytetään

Käytä isännöityä API-rajapintaamme tai suorita mallit itse

Tutki Open-Source-malleja

Selaile 20+ avoimen lähdekoodin TTS-malleja. Jokainen mallisivu näyttää lisenssin, arkkitehtuurin, kyvyt ja omatoimisuuden vaatimukset.

Kokeile selaintasi

Testaa mikä tahansa malli suoraan TTS.aihin asentamatta mitään. GPU-palvelimemme käsittelevät käsittelyä, jotta voit arvioida laatua ennen kuin sitoudut itseesi.

Itsehosti tai käytä API:tä

Kloonimalli repoaa GitHubilta ja toimii paikallisesti tai käyttää isäntärajapintaamme tuotannossa. Itseohjautuvuus antaa täyden hallinnan; API tarjoaa hallinnoidun infrastruktuurin.

Rakenna sovellusta

Integroi TTS tuotteeseesi itseohjautuvilla malleilla tai REST APIlla. Kaikki mallit ovat kaupallisesti käyttökelpoisia ilman lisenssimaksuja tai rojalteja.

Lisenssin vertailu

Kaikki TTS.ai mallin mallit käyttävät kaupallisesti edullisia avoimen lähdekoodin lisenssejä

Malli	Lisenssi	Nimeäminen
Kokoro	Apache 2.0	Vaadittu
Piper	MIT	Valinnainen
VITS	MIT	Valinnainen
MeloTTS	MIT	Valinnainen
Chatterbox	MIT	Valinnainen
Tortoise TTS	Apache 2.0	Vaadittu
StyleTTS 2	MIT	Valinnainen
OpenVoice	MIT	Valinnainen
Sesame CSM	Apache 2.0	Vaadittu
Orpheus	Llama 3.2	"Built with Llama"

Kokeile näitä malleja ilmaiseksi

Self-Hosting vs Hosted API

Suorita mallit itse tai anna meidän hoitaa infrastruktuuri

Omaehtoisuus laitteille

Jokainen TTS.ain malli on saatavilla avoimen lähdekoodin projektina GitHubissa tai Hugging Facessa. Lataa painot, asenna riippuvuudet ja tee päätelmä omilla GPU:illasi. Sinulla on täysi kontrolli latenssista, yksityisyydestä ja kavennuksesta.

Täysi tietosuoja – ääni ei koskaan poistu palvelimelta
Ei per-pyyntökuluja alkuperäisen asennuksen jälkeen
Mukautettu hienosäätö omiin tietoihin
Vaatii GPU-laitteistoa (NVIDIA suositellaan)
Hallitset päivityksiä, kavennuksia ja riippuvuuksia

Käytä TTS.ai Hosted API:tä

Tutustu kaikkiin 20+-malleihin yhdellä REST API-rajapinnalla. Käsittelemme GPU-tarjontaa, mallipäivityksiä, jononhallintaa ja skaalaamista. Yksi API-avain mahdollistaa pääsyn jokaiseen malliin – ei tarvitse hallita erillisiä käyttökohteita.

GPU-laitteistoa ei tarvita
Kaikki 20+-mallia yhden API:n kautta
Automaattiset mallipäivitykset ja -parannukset
99,9 prosentin käyttöaika, kun infrastruktuuria ei ole hyödynnetty
Maksa vain siitä, mitä käytät

Käytä hosted-rajapintaa sen sijaan

Pikakäynnistys: API tai itsepalvelu

Käytä isännöityä API:tä tai asenna Kokoro paikallisesti muutamassa minuutissa

Vaihtoehto 1: TTS.ai Hosted API Helpoin

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Vaihtoehto 2: Self-Host pip Täysi hallinta

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Näytä API-dokumentaatio

Avoin lähdekoodi, edullinen hinnoittelu

Isännöity APImme mahdollistaa avoimen lähdekoodin TTS:n käytön ilman GPU:iden hallintaa.

Vapaa Tier

50 opintopistettä ilmoittautumisesta

4 avoimen lähdekoodin mallia ilmaiseksi
Ei ilmoittautumista peruskäyttöön
Kaupallinen käyttö sallittu

Käynnistin

500 000 merkkiä/kuukausi

Kaikki 20+ avoimen lähdekoodin mallit
Äänien kloonaus
API-yhteys

Pro

$29

2 miljoonaa merkkiä kuukaudessa

Ensisijainen GPU-käsittely
Kaikki premium-mallit
Yritystuki

Näkemys täydestä hinnoittelusta

Usein kysyttyjä kysymyksiä

Yleisiä kysymyksiä avoimen lähdekoodin tekstistä puheeseen

Kyllä. Jokaisessa mallissa TTS.ai:ssa käytetään sallivaa avoimen lähdekoodin lisenssiä, joko MIT:tä tai Apache 2.0:a. Erityisesti suljemme pois mallit, joilla on rajoittavat lisenssit (kuten Coquin CPML tai ei-kaupallinen CC-BY-NC). Voit tarkistaa jokaisen mallin lisenssin GitHub-arkistosta.

Molemmat ovat sallivia avoimen lähdekoodin lisenssejä, jotka mahdollistavat kaupallisen käytön, muuttamisen ja uudelleenjaon. Apache 2.0 lisää patenttiavustuksia ja edellyttää muutoksia, jos koodia muokataan. MIT on yksinkertaisempi, kun vaatimuksia on vähemmän. Molemmat ovat liikeystävällisiä.

Kyllä. Jokainen malli voi olla itseohjautuva. Kloonata GitHubin mallivaraston, asentaa riippuvuuksia, ladata mallipainoja ja ajaa päättelyä. Toimitamme dokumentin kunkin mallin itseohjautuvista vaatimuksista, kuten GPU-, RAM- ja Python-versiosta.

Vaatimukset vaihtelevat mallien mukaan. Piper ei tarvitse GPU:ta (vain CPU). Kokoro ja MeloTTS tarvitsevat 1-2GB VRAM-muistia. Useimmat vakiomallit tarvitsevat 4GB VRAM-muistia. Tortoise ja Seesame CSM tarvitsevat 8GB:tä. NVIDIA RTX 3060 (12GB) -mallilla voi ajaa useimmat mallit mukavasti.

Kyllä. Avoimen lähdekoodin lisenssit mahdollistavat muokkauksen, mukaan lukien hienosäätö. GPT-SoVITS- ja Bark-mallit tarjoavat hienosäätöskriptejä. Voit kouluttaa malleja omilla äänitiedoillasi, jotta voit luoda mukautettuja ääniä tai parantaa tiettyjen kielten suorituskykyä.

Huipputason avoimen lähdekoodin mallit (Kokoro, Styletts 2, Chatterbox) vastaavat tai ylittävät nyt ElevenLabsin ja Google TTS:n kaltaiset kaupalliset palvelut laatuvertailuissa. Kaupallisten palvelujen tärkein etu on hallinnoitu infrastruktuuri ja tuki, ei äänenlaatu.

Ne on jo suljettu pois. XTTS/XTTS-v2 (Coqui's CPML – ei-kaupallinen), F5-TTS (CC-BY-NC – ei-kaupallinen) ja Higgs-v2 (Boson License – rajoittava) poistettiin. Jokainen TTS.ai:n malli on todennettu kaupalliselta käytöltä turvalliseksi.

Kyllä. Useimmat mallit hyväksyvät yhteisön lahjoitukset GitHub-palvelun kautta. Voit lähettää virheilmoituksia, äänitallenteita uusille kielille, koodin parannuksia ja dokumentointia varten. Tarkista jokaisen mallin GitHub-arkiston lahjoitusohjeet ja aktiiviset kysymykset.

Lataa mallit tilauksesta ja pura, kun GPU-muistia ei voi jakaa. GPU-palvelimellamme on 20+-mallia 4x Tesla P40 (96GB total VRAM) dynaamisella kuormauksella. Yksi 24GB GPU voi toimia samanaikaisesti 3-5-mallilla.

Monissa malleissa on virallisia Docker-kuvia tai Dockerfile-tiedostoja. Useiden mallien pyörittämiseen voit rakentaa NVIDIA Container Toolkit -ohjelmiston GPU-käyttöösi. API-palvelinarkkitehtuurimme voi toimia vertailutoteutuksena.

Useimmat mallit vaativat Python 3.10–3.12. Coqui TTS (VITS) tarvitsee nimenomaan Python 3.11. Suosittelemme Python 3.12 useimmille malleille. Tarkista jokaisen mallin vaatimukset.txt tarkan version yhteensopivuudesta.

Kyllä. MIT- ja Apache 2.0 -lisenssit mahdollistavat nimenomaan kaupallisen käytön. SaaS-tuotteita, mobiilisovelluksia, pelejä ja palveluja voi rakentaa käyttämällä näitä malleja ilman lisenssimaksuja, rojalteja tai palkkiovaatimuksia (vaikka arvostettavaa on).

5.0/5 (1)

Kokeile avointa lähdekoodia TTS tänään

20+ avoimen lähdekoodin mallit, kaikki kaupallisesti luvallisia. Käytä API-rajapintaamme tai omaa isäntää – valinta on sinun.

Rekisteröidy ilmaiseksi Näkymän hinnoittelu

Avaa lähdekoodin teksti puhemalleille

Kokeile nyt

Rakasta TTS.aita, kerro ystävillesi!

Avoimen lähdekoodin TTS-edut

Kaikki avoimen lähdekoodin lisenssit

MIT / Apache 2.0

Omaehtoinen

GPU optimoitu

Yhteisöä ylläpidetään

Kaupallinen käyttö OK

Avoimen lähdekoodin malliluettelo

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Miten avoimen lähdekoodin TTS:ää käytetään

Tutki Open-Source-malleja

Kokeile selaintasi

Itsehosti tai käytä API:tä

Rakenna sovellusta

Lisenssin vertailu

Self-Hosting vs Hosted API

Omaehtoisuus laitteille

Käytä TTS.ai Hosted API:tä

Pikakäynnistys: API tai itsepalvelu

Avoin lähdekoodi, edullinen hinnoittelu

Vapaa Tier

Käynnistin

Pro

Usein kysyttyjä kysymyksiä

Ovatko kaikki TTS.ai mallia todella avoimia?

Mitä eroa on MIT:n ja Apache 2.0:n luvilla?

Voinko itse isännöidä näitä malleja omalla palvelimellani?

Mitä GPU:ta tarvitsen itseohjautuviin TTS-malleihin?

Voinko hienosäätää avoimen lähdekoodin TTS-malleja?

Miten avoimen lähdekoodin TTS-malleja verrataan kaupallisiin palveluihin?

Onko olemassa malleja, joilla on rajoittavat luvat, joita minun pitäisi välttää?

Voinko osallistua näihin avoimen lähdekoodin malleihin?

Miten pyöritän useita malleja yhdellä GPU-palvelimella?

Onko Docker-kuvaa itsensä isännäksi?

Mitä Python-versiota tarvitsen itseohjautumiseen?

Voinko rakentaa kaupallisen tuotteen näiden mallien avulla?

Kokeile avointa lähdekoodia TTS tänään