Atverti pradinio kodo tekstą kalbos modeliams
Kiekvienas TTS modelis mūsų platformoje yra atviras šaltinis su komerciniais leidimais. MIT, Apache 2.0 — nėra patentuotas užraktas, jokių naudojimo apribojimų, jokių staigmenų licencijavimo mokesčių. Naudokite juos per mūsų kompiuterizuotą API, arba savarankiškai juos priimti į savo infrastruktūrą su visiškai kontroliuoti.
Pabandykite dabar
Atviro kodo TTS nauda
Kodėl jūsų projektams svarbūs atvirojo kodo modeliai
Visi atvirojo šaltinio licencijuoti failai
Kiekvienas modelis TTS.ai naudoja leistiną atviro kodo licenciją. Nėra patentuotų juodųjų dėžių, nėra pardavėjo užrakto, jokių netikėtų licencijų mokesčių.
MIT / Apache 2. 0
Modeliai yra licencijuoti pagal MIT arba Apache 2.0, labiausiai leistina atviro šaltinio licencijos. Naudokite komerciniais, keisti, platinti — be apribojimų.
Savarankiškas
Atsisiųskite bet kokį modelį ir paleiskite jį savo aparatūroje. Pilna kontrolė dėl jūsų duomenų, latentiškumo ir infrastruktūros. Nėra debesų priklausomybės nereikia.
Optimizuotas GPU
Modeliai optimizuojami NVIDIA GPU su CUDA palaikymu. Piper veikia tik su procesoriumi. Daugumai modelių reikia 2-8GB VRAM efektyviam įvedimui.
Bendruomenė palaikoma
Aktyvus atviro šaltinio bendruomenės išlaikyti ir pagerinti šiuos modelius. Įnašai laukiami — pateikti klaidų, patobulinimai, ir nauji balsai GitHub.
Naudojimas komerciniais tikslais
Visi modeliai leidžia komerciniais tikslais naudoti pagal savo licencijas. Sukurti produktus, parduoti paslaugas, ir sukurti komercinį turinį be autorinių ar naudojimo mokesčius.
Mūsų atviro kodo modelio katalogas
Kiekvienas modelis, jo licencija, ir ką ji daro geriausiai
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Geriausias už: Apache 2.0 — geriausios kokybės nemokamas modelis, 82M params, lengva sau-host
Bandyti Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Geriausias už: MIT – tik procesorius, idealiai tinka briaunų įrenginiams ir įmontuotam saviraiškos įrenginiui
Bandyti Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Geriausias už: MIT – daugelio paskesnių modelių pagrindinė architektūra
Bandyti VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Geriausias už: MIT – unikalūs garso generavimo pajėgumai, viršijantys standartinius TTS
Bandyti Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Geriausias už: Apache 2.0 – maksimali kokybė, plačiai ištirtas orientacinis įgyvendinimas
Bandyti Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Geriausias už: MIT – atvirojo kodo balso klonavimas su granuliuoto stiliaus valdymu
Bandyti OpenVoiceKaip naudoti atvirojo kodo TTS
Naudokite savo kompiuterizuotą API arba naudokite modelius patys
Tyrinėti atvirojo kodo modelius
Naršykite mūsų 20+ atviro kodo TTS modelių katalogą. Kiekvienas modelis puslapis rodo licenciją, architektūrą, galimybes, ir saviprieglobos reikalavimus.
Pabandykite naršyklėje
Testuoti bet kokį modelį tiesiogiai TTS.ai be instaliavimo nieko. Mūsų GPU serveriai rankena apdorojimas, todėl jūs galite įvertinti kokybę prieš įsipareigoti savarankiškai-hosting.
Savarankiškai arba naudoti mūsų API
Klonas modelis atpirkimo iš GitHub ir paleisti vietoje, arba naudoti mūsų prieglobos API gamybai. Savarankiškas naudojimas suteikia visišką kontrolę; mūsų API teikia valdomą infrastruktūrą.
Sukurti savo programą
Integruokite TTS į savo produktą, naudodami savarankiškai priimamus modelius arba mūsų REST API. Visi modeliai yra komerciškai naudojami be licencijavimo mokesčio ar autorinio atlyginimo.
Licencijos palyginimas
Visi TTS.ai modelių naudoti komerciniais tikslais atvirojo kodo licencijas
| Pavyzdys | Licencija | Komercinis naudojimas | Pakeitimas | Savarankiškas | Įnašas |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Reikalinga | |||
| Piper | MIT | Neprivaloma | |||
| VITS | MIT | Neprivaloma | |||
| MeloTTS | MIT | Neprivaloma | |||
| Chatterbox | MIT | Neprivaloma | |||
| Tortoise TTS | Apache 2.0 | Reikalinga | |||
| StyleTTS 2 | MIT | Neprivaloma | |||
| OpenVoice | MIT | Neprivaloma | |||
| Sesame CSM | Apache 2.0 | Reikalinga | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Savarankiškai samdoma ir priimama API
Paleiskite modelius patys arba leiskite mums tvarkyti infrastruktūrą
Savarankiškai naudoti jūsų aparatinę įrangą
Kiekvienas modelis TTS.ai yra prieinamas kaip atviro kodo projektas GitHub arba Hugging Face. Parsisiųsti svorį, įdiegti priklausomybes, ir paleisti iš savo GPU. Jūs turite visą kontrolę dėl latentiškumo, privatumo, ir mastelio.
- Pilnas duomenų privatumas — garso niekada nepalieka serverio
- Po pradinės sąrankos išlaidų pagal prašymą skaičius
- Pasirinktas patikslinimas pagal savo duomenis
- Reikalauja GPU techninės įrangos (rekomenduojama NVIDIA)
- Jūs valdote atnaujinimus, mastelio, ir priklausomybes
Naudoti TTS.ai kompiuterizuotą API
Greitą prieigą prie visų 20+ modelių gauname per vieną REST API. Mes tvarkome GPU aprūpinimą, modelių atnaujinimus, eilės valdymą ir mastelį. Vienas API raktas suteikia jums prieigą prie kiekvieno modelio – nereikia valdyti atskirų diegimų.
- Nereikia GPU aparatūros
- Visi 20+ modeliai per vieną API
- Automatinis modelio atnaujinimas ir patobulinimai
- 99,9 % darbo su nereikalinga infrastruktūra
- Mokėti tik už tai, ką naudojate
Greitas paleidimas: API arba savijauta
Naudokite mūsų kompiuterizuotą API, arba įdiegti Kokoro vietoje per minutes
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Atviras šaltinis, priimtina kaina
Mūsų įdiegta API užtikrina atvirojo kodo TTS prieinamumą nevaldant GPU.
Laisvoji pakopa
$0
15 kreditų užsiregistravus
- 4 atvirojo kodo modeliai nemokamai
- Neprisiregistruojama pagrindiniam naudojimui
- Leidžiama naudoti komerciniais tikslais
Pradžia
$9
500 000 ženklų per mėnesį
- Visi 20+ atvirojo kodo modeliai
- Balso klonavimas
- API prieiga
Pro
$29
2 000 000 ženklų per mėnesį
- Prioritetinis GPU tvarkymas
- Visi aukščiausios kokybės modeliai
- Parama įmonėms
Dažnai užduodami klausimai
Dažni klausimai apie atviro kodo tekstą kalbėti
Ką mes galėtume pagerinti? Jūsų atsiliepimai padeda mums išspręsti problemas.
Pabandykite atverti šaltinį TTS šiandien
20+ atviro kodo modeliai, visi komerciškai licencijuoti. Naudokite mūsų API arba savihost — pasirinkimas yra jūsų.