Avaa lähdekoodin teksti puhemalleille

Jokainen alustamme TTS-malli on avoin lähdekoodi, jossa on kaupallisesti edulliset lisenssit. MIT, Apache 2.0 – ei omalukitusta, ei käyttörajoituksia, ei yllätyslupamaksuja. Käytä niitä isäntärajapintamme kautta tai itseisännät niitä omassa infrastruktuurissasi täysin hallinnassasi.

Avaa lähdekoodi MIT-lisenssi Apache 2.0 Omaehtoinen GitHub

Kokeile nyt

Vapaa Kokoron, Piperin, VITS:n, MeloTTS:n kanssa
Luomasi ääni näkyy tässä
Luotu
Lataa
Rakasta TTS.aita, kerro ystävillesi!

Avoimen lähdekoodin TTS-edut

Miksi avoimen lähdekoodin malleilla on merkitystä projekteillesi

Kaikki avoimen lähdekoodin lisenssit

Jokainen TTS.ain malli käyttää sallivaa avoimen lähdekoodin lisenssiä. Ei omia mustia laatikoita, ei myyjän lukitusta, ei odottamattomia lisenssimaksuja.

MIT / Apache 2.0

Mallit on lisensoitu MIT:n tai Apache 2.0:n, sallivimpien avoimen lähdekoodin lisenssien, nojalla. Käytä kaupallisesti, muokkaa, jaa – ei rajoituksia.

Omaehtoinen

Lataa mikä tahansa malli ja käytä sitä omalla laitteistollasi. Tietojesi, latenssisi ja infrastruktuurisi täysi hallinta. Pilviriippuvuus ei ole tarpeen.

GPU optimoitu

Mallit on optimoitu NVIDIA GPU -laitteille CUDA-tuella. Piper toimii vain suorittimella. Useimmat mallit tarvitsevat 2-8GB VRAM-muistia tehokasta päättelyä varten.

Yhteisöä ylläpidetään

Aktiiviset avoimen lähdekoodin yhteisöt ylläpitävät ja parantavat näitä malleja. Lahjoitukset ovat tervetulleita – lähettävät vikoja, parannuksia ja uusia ääniä GitHubille.

Kaupallinen käyttö OK

Kaikki mallit mahdollistavat lisenssiensä mukaisen kaupallisen käytön. Rakenna tuotteita, myy palveluita ja luo kaupallista sisältöä ilman rojalteja tai käyttömaksuja.

Avoimen lähdekoodin malliluettelo

Jokainen malli, sen lisenssi ja se, mitä se tekee parhaiten

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Paras: Apache 2.0 – paras laatuvapaa malli, 82M paraamia, helppo itseisäntä

Kokeile Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Paras: MIT – vain prosessori, täydellinen reunalaitteisiin ja itseohjautuviin laitteisiin

Kokeile Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Paras: MIT – monien alapään mallien käyttämä perusarkkitehtuuri

Kokeile VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Paras: MIT – TTS-standardia paremmat ainutlaatuiset äänentuotantoominaisuudet

Kokeile Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Äänien kloonaus

Paras: Apache 2.0 – huippulaatua, laajalti tutkittu referenssitoteutus

Kokeile Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Äänien kloonaus

Paras: MIT – avoimen lähdekoodin äänikloonaus rakeisella tyyliohjauksella

Kokeile OpenVoice

Miten avoimen lähdekoodin TTS:ää käytetään

Käytä isännöityä API-rajapintaamme tai suorita mallit itse

1

Tutki Open-Source-malleja

Selaile 20+ avoimen lähdekoodin TTS-malleja. Jokainen mallisivu näyttää lisenssin, arkkitehtuurin, kyvyt ja omatoimisuuden vaatimukset.

2

Kokeile selaintasi

Testaa mikä tahansa malli suoraan TTS.aihin asentamatta mitään. GPU-palvelimemme käsittelevät käsittelyä, jotta voit arvioida laatua ennen kuin sitoudut itseesi.

3

Itsehosti tai käytä API:tä

Kloonimalli repoaa GitHubilta ja toimii paikallisesti tai käyttää isäntärajapintaamme tuotannossa. Itseohjautuvuus antaa täyden hallinnan; API tarjoaa hallinnoidun infrastruktuurin.

4

Rakenna sovellusta

Integroi TTS tuotteeseesi itseohjautuvilla malleilla tai REST APIlla. Kaikki mallit ovat kaupallisesti käyttökelpoisia ilman lisenssimaksuja tai rojalteja.

Lisenssin vertailu

Kaikki TTS.ai mallin mallit käyttävät kaupallisesti edullisia avoimen lähdekoodin lisenssejä

Malli Lisenssi Kaupallinen käyttö Muutos Itsekehotus Nimeäminen
Kokoro Apache 2.0 Vaadittu
Piper MIT Valinnainen
VITS MIT Valinnainen
MeloTTS MIT Valinnainen
Chatterbox MIT Valinnainen
Tortoise TTS Apache 2.0 Vaadittu
StyleTTS 2 MIT Valinnainen
OpenVoice MIT Valinnainen
Sesame CSM Apache 2.0 Vaadittu
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs Hosted API

Suorita mallit itse tai anna meidän hoitaa infrastruktuuri

Omaehtoisuus laitteille

Jokainen TTS.ain malli on saatavilla avoimen lähdekoodin projektina GitHubissa tai Hugging Facessa. Lataa painot, asenna riippuvuudet ja tee päätelmä omilla GPU:illasi. Sinulla on täysi kontrolli latenssista, yksityisyydestä ja kavennuksesta.

  • Täysi tietosuoja – ääni ei koskaan poistu palvelimelta
  • Ei per-pyyntökuluja alkuperäisen asennuksen jälkeen
  • Mukautettu hienosäätö omiin tietoihin
  • Vaatii GPU-laitteistoa (NVIDIA suositellaan)
  • Hallitset päivityksiä, kavennuksia ja riippuvuuksia

Käytä TTS.ai Hosted API:tä

Tutustu kaikkiin 20+-malleihin yhdellä REST API-rajapinnalla. Käsittelemme GPU-tarjontaa, mallipäivityksiä, jononhallintaa ja skaalaamista. Yksi API-avain mahdollistaa pääsyn jokaiseen malliin – ei tarvitse hallita erillisiä käyttökohteita.

  • GPU-laitteistoa ei tarvita
  • Kaikki 20+-mallia yhden API:n kautta
  • Automaattiset mallipäivitykset ja -parannukset
  • 99,9 prosentin käyttöaika, kun infrastruktuuria ei ole hyödynnetty
  • Maksa vain siitä, mitä käytät

Pikakäynnistys: API tai itsepalvelu

Käytä isännöityä API:tä tai asenna Kokoro paikallisesti muutamassa minuutissa

Vaihtoehto 1: TTS.ai Hosted API Helpoin
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Vaihtoehto 2: Self-Host pip Täysi hallinta
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Avoin lähdekoodi, edullinen hinnoittelu

Isännöity APImme mahdollistaa avoimen lähdekoodin TTS:n käytön ilman GPU:iden hallintaa.

Vapaa Tier

$0

50 opintopistettä ilmoittautumisesta

  • 4 avoimen lähdekoodin mallia ilmaiseksi
  • Ei ilmoittautumista peruskäyttöön
  • Kaupallinen käyttö sallittu

Käynnistin

$9

500 000 merkkiä/kuukausi

  • Kaikki 20+ avoimen lähdekoodin mallit
  • Äänien kloonaus
  • API-yhteys

Pro

$29

2 miljoonaa merkkiä kuukaudessa

  • Ensisijainen GPU-käsittely
  • Kaikki premium-mallit
  • Yritystuki
Näkemys täydestä hinnoittelusta

Usein kysyttyjä kysymyksiä

Yleisiä kysymyksiä avoimen lähdekoodin tekstistä puheeseen

Kyllä. Jokaisessa mallissa TTS.ai:ssa käytetään sallivaa avoimen lähdekoodin lisenssiä, joko MIT:tä tai Apache 2.0:a. Erityisesti suljemme pois mallit, joilla on rajoittavat lisenssit (kuten Coquin CPML tai ei-kaupallinen CC-BY-NC). Voit tarkistaa jokaisen mallin lisenssin GitHub-arkistosta.

Molemmat ovat sallivia avoimen lähdekoodin lisenssejä, jotka mahdollistavat kaupallisen käytön, muuttamisen ja uudelleenjaon. Apache 2.0 lisää patenttiavustuksia ja edellyttää muutoksia, jos koodia muokataan. MIT on yksinkertaisempi, kun vaatimuksia on vähemmän. Molemmat ovat liikeystävällisiä.

Kyllä. Jokainen malli voi olla itseohjautuva. Kloonata GitHubin mallivaraston, asentaa riippuvuuksia, ladata mallipainoja ja ajaa päättelyä. Toimitamme dokumentin kunkin mallin itseohjautuvista vaatimuksista, kuten GPU-, RAM- ja Python-versiosta.

Vaatimukset vaihtelevat mallien mukaan. Piper ei tarvitse GPU:ta (vain CPU). Kokoro ja MeloTTS tarvitsevat 1-2GB VRAM-muistia. Useimmat vakiomallit tarvitsevat 4GB VRAM-muistia. Tortoise ja Seesame CSM tarvitsevat 8GB:tä. NVIDIA RTX 3060 (12GB) -mallilla voi ajaa useimmat mallit mukavasti.

Kyllä. Avoimen lähdekoodin lisenssit mahdollistavat muokkauksen, mukaan lukien hienosäätö. GPT-SoVITS- ja Bark-mallit tarjoavat hienosäätöskriptejä. Voit kouluttaa malleja omilla äänitiedoillasi, jotta voit luoda mukautettuja ääniä tai parantaa tiettyjen kielten suorituskykyä.

Huipputason avoimen lähdekoodin mallit (Kokoro, Styletts 2, Chatterbox) vastaavat tai ylittävät nyt ElevenLabsin ja Google TTS:n kaltaiset kaupalliset palvelut laatuvertailuissa. Kaupallisten palvelujen tärkein etu on hallinnoitu infrastruktuuri ja tuki, ei äänenlaatu.

Ne on jo suljettu pois. XTTS/XTTS-v2 (Coqui's CPML – ei-kaupallinen), F5-TTS (CC-BY-NC – ei-kaupallinen) ja Higgs-v2 (Boson License – rajoittava) poistettiin. Jokainen TTS.ai:n malli on todennettu kaupalliselta käytöltä turvalliseksi.

Kyllä. Useimmat mallit hyväksyvät yhteisön lahjoitukset GitHub-palvelun kautta. Voit lähettää virheilmoituksia, äänitallenteita uusille kielille, koodin parannuksia ja dokumentointia varten. Tarkista jokaisen mallin GitHub-arkiston lahjoitusohjeet ja aktiiviset kysymykset.

Lataa mallit tilauksesta ja pura, kun GPU-muistia ei voi jakaa. GPU-palvelimellamme on 20+-mallia 4x Tesla P40 (96GB total VRAM) dynaamisella kuormauksella. Yksi 24GB GPU voi toimia samanaikaisesti 3-5-mallilla.

Monissa malleissa on virallisia Docker-kuvia tai Dockerfile-tiedostoja. Useiden mallien pyörittämiseen voit rakentaa NVIDIA Container Toolkit -ohjelmiston GPU-käyttöösi. API-palvelinarkkitehtuurimme voi toimia vertailutoteutuksena.

Useimmat mallit vaativat Python 3.10–3.12. Coqui TTS (VITS) tarvitsee nimenomaan Python 3.11. Suosittelemme Python 3.12 useimmille malleille. Tarkista jokaisen mallin vaatimukset.txt tarkan version yhteensopivuudesta.

Kyllä. MIT- ja Apache 2.0 -lisenssit mahdollistavat nimenomaan kaupallisen käytön. SaaS-tuotteita, mobiilisovelluksia, pelejä ja palveluja voi rakentaa käyttämällä näitä malleja ilman lisenssimaksuja, rojalteja tai palkkiovaatimuksia (vaikka arvostettavaa on).
5.0/5 (1)

Mitä voisimme parantaa? Palautteesi auttaa meitä korjaamaan ongelmia.

Kokeile avointa lähdekoodia TTS tänään

20+ avoimen lähdekoodin mallit, kaikki kaupallisesti luvallisia. Käytä API-rajapintaamme tai omaa isäntää – valinta on sinun.