Pranešti apie klaidą / funkcijų užklausą

Atverti pradinio kodo tekstą kalbos modeliams

Kiekvienas TTS modelis mūsų platformoje yra atviras šaltinis su komerciniais leidimais. MIT, Apache 2.0 — nėra patentuotas užraktas, jokių naudojimo apribojimų, jokių staigmenų licencijavimo mokesčių. Naudokite juos per mūsų kompiuterizuotą API, arba savarankiškai juos priimti į savo infrastruktūrą su visiškai kontroliuoti.

Atverti šaltinį MIT licencija Apache 2. 0 Savarankiškas GitHub

Visas TTS redaktorius API dok.

Pabandykite dabar

0/500

Nemokamai su Kokoro, Piper, VITS, MeloTTS

Jūsų sugeneruotas garsas bus rodomas čia

Atverti pilną TTS redaktorių

Atviro kodo TTS nauda

Kodėl jūsų projektams svarbūs atvirojo kodo modeliai

Visi atvirojo šaltinio licencijuoti failai

Kiekvienas modelis TTS.ai naudoja leistiną atviro kodo licenciją. Nėra patentuotų juodųjų dėžių, nėra pardavėjo užrakto, jokių netikėtų licencijų mokesčių.

MIT / Apache 2. 0

Modeliai yra licencijuoti pagal MIT arba Apache 2.0, labiausiai leistina atviro šaltinio licencijos. Naudokite komerciniais, keisti, platinti — be apribojimų.

Savarankiškas

Atsisiųskite bet kokį modelį ir paleiskite jį savo aparatūroje. Pilna kontrolė dėl jūsų duomenų, latentiškumo ir infrastruktūros. Nėra debesų priklausomybės nereikia.

Optimizuotas GPU

Modeliai optimizuojami NVIDIA GPU su CUDA palaikymu. Piper veikia tik su procesoriumi. Daugumai modelių reikia 2-8GB VRAM efektyviam įvedimui.

Bendruomenė palaikoma

Aktyvus atviro šaltinio bendruomenės išlaikyti ir pagerinti šiuos modelius. Įnašai laukiami — pateikti klaidų, patobulinimai, ir nauji balsai GitHub.

Naudojimas komerciniais tikslais

Visi modeliai leidžia komerciniais tikslais naudoti pagal savo licencijas. Sukurti produktus, parduoti paslaugas, ir sukurti komercinį turinį be autorinių ar naudojimo mokesčius.

Mūsų atviro kodo modelio katalogas

Kiekvienas modelis, jo licencija, ir ką ji daro geriausiai

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Greitas 5/5

Geriausias už: Apache 2.0 — geriausios kokybės nemokamas modelis, 82M params, lengva sau-host

Bandyti Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Greitas 3/5

Geriausias už: MIT – tik procesorius, idealiai tinka briaunų įrenginiams ir įmontuotam saviraiškos įrenginiui

Bandyti Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Greitas 3/5

Geriausias už: MIT – daugelio paskesnių modelių pagrindinė architektūra

Bandyti VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Lėtas 4/5

Geriausias už: MIT – unikalūs garso generavimo pajėgumai, viršijantys standartinius TTS

Bandyti Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Lėtas 5/5 Balso klonavimas

Geriausias už: Apache 2.0 – maksimali kokybė, plačiai ištirtas orientacinis įgyvendinimas

Bandyti Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Vidutinis 4/5 Balso klonavimas

Geriausias už: MIT – atvirojo kodo balso klonavimas su granuliuoto stiliaus valdymu

Bandyti OpenVoice

Kaip naudoti atvirojo kodo TTS

Naudokite savo kompiuterizuotą API arba naudokite modelius patys

Tyrinėti atvirojo kodo modelius

Naršykite mūsų 20+ atviro kodo TTS modelių katalogą. Kiekvienas modelis puslapis rodo licenciją, architektūrą, galimybes, ir saviprieglobos reikalavimus.

Pabandykite naršyklėje

Testuoti bet kokį modelį tiesiogiai TTS.ai be instaliavimo nieko. Mūsų GPU serveriai rankena apdorojimas, todėl jūs galite įvertinti kokybę prieš įsipareigoti savarankiškai-hosting.

Savarankiškai arba naudoti mūsų API

Klonas modelis atpirkimo iš GitHub ir paleisti vietoje, arba naudoti mūsų prieglobos API gamybai. Savarankiškas naudojimas suteikia visišką kontrolę; mūsų API teikia valdomą infrastruktūrą.

Sukurti savo programą

Integruokite TTS į savo produktą, naudodami savarankiškai priimamus modelius arba mūsų REST API. Visi modeliai yra komerciškai naudojami be licencijavimo mokesčio ar autorinio atlyginimo.

Licencijos palyginimas

Visi TTS.ai modelių naudoti komerciniais tikslais atvirojo kodo licencijas

Pavyzdys	Licencija	Įnašas
Kokoro	Apache 2.0	Reikalinga
Piper	MIT	Neprivaloma
VITS	MIT	Neprivaloma
MeloTTS	MIT	Neprivaloma
Chatterbox	MIT	Neprivaloma
Tortoise TTS	Apache 2.0	Reikalinga
StyleTTS 2	MIT	Neprivaloma
OpenVoice	MIT	Neprivaloma
Sesame CSM	Apache 2.0	Reikalinga
Orpheus	Llama 3.2	"Built with Llama"

Išmėginkite šiuos modelius nemokamai

Savarankiškai samdoma ir priimama API

Paleiskite modelius patys arba leiskite mums tvarkyti infrastruktūrą

Savarankiškai naudoti jūsų aparatinę įrangą

Kiekvienas modelis TTS.ai yra prieinamas kaip atviro kodo projektas GitHub arba Hugging Face. Parsisiųsti svorį, įdiegti priklausomybes, ir paleisti iš savo GPU. Jūs turite visą kontrolę dėl latentiškumo, privatumo, ir mastelio.

Pilnas duomenų privatumas — garso niekada nepalieka serverio
Po pradinės sąrankos išlaidų pagal prašymą skaičius
Pasirinktas patikslinimas pagal savo duomenis
Reikalauja GPU techninės įrangos (rekomenduojama NVIDIA)
Jūs valdote atnaujinimus, mastelio, ir priklausomybes

Naudoti TTS.ai kompiuterizuotą API

Greitą prieigą prie visų 20+ modelių gauname per vieną REST API. Mes tvarkome GPU aprūpinimą, modelių atnaujinimus, eilės valdymą ir mastelį. Vienas API raktas suteikia jums prieigą prie kiekvieno modelio – nereikia valdyti atskirų diegimų.

Nereikia GPU aparatūros
Visi 20+ modeliai per vieną API
Automatinis modelio atnaujinimas ir patobulinimai
99,9 % darbo su nereikalinga infrastruktūra
Mokėti tik už tai, ką naudojate

Naudoti mazgą API vietoj

Greitas paleidimas: API arba savijauta

Naudokite mūsų kompiuterizuotą API, arba įdiegti Kokoro vietoje per minutes

1 galimybė: TTS.ai surasta API Lengviausia

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

2 galimybė. Visas valdymas

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Peržiūrėti API dokumentaciją

Atviras šaltinis, priimtina kaina

Mūsų įdiegta API užtikrina atvirojo kodo TTS prieinamumą nevaldant GPU.

Laisvoji pakopa

15 kreditų užsiregistravus

4 atvirojo kodo modeliai nemokamai
Neprisiregistruojama pagrindiniam naudojimui
Leidžiama naudoti komerciniais tikslais

Pradžia

500 000 ženklų per mėnesį

Visi 20+ atvirojo kodo modeliai
Balso klonavimas
API prieiga

Pro

$29

2 000 000 ženklų per mėnesį

Prioritetinis GPU tvarkymas
Visi aukščiausios kokybės modeliai
Parama įmonėms

Rodyti visą kainodarą

Dažnai užduodami klausimai

Dažni klausimai apie atviro kodo tekstą kalbėti

Taip. Kiekvienas modelis TTS.ai naudoja leistiną atviro kodo licenciją — MIT arba Apache 2.0. Mes specialiai atmetame modelius su ribojančiomis licencijomis (pvz., Coqui CPML arba nekomercinis CC-BY-NC). Galite patikrinti kiekvieno modelio licenciją savo GitHub saugyklos.

Abu yra leistini atvirojo kodo licencijos, leidžiančios komercinį naudojimą, modifikavimą ir perskirstymą. Apache 2.0 prideda aiškias patento dotacijas ir reikalauja nurodyti pakeitimus, jei keičiate kodą. MIT yra paprastesnis su mažesniais reikalavimais. Abu yra verslui draugiški.

Taip. Kiekvienas modelis gali būti savistaba. Klonuoti modelio saugyklą iš GitHub, įdiegti priklausomybes, atsisiųsti modelio svoriai, ir paleisti išvadą. Mes pateikiame dokumentus kiekvieno modelio saviraiškos reikalavimus, įskaitant GPU, RAM, ir Python versija.

Reikalavimai skiriasi pagal modelį. Piper reikia ne GPU (tik CPU). Kokoro ir MeloTTS reikia 1-2GB VRAM. Daugumai standartinių modelių reikia 4GB VRAM. Tortoise ir Sesame CSM reikia 8GB. NVIDIA RTX 3060 (12GB) gali veikti patogiai.

Taip. Atvirojo kodo licencijos leidžia modifikavimą, įskaitant koreguojimą. Tokie modeliai kaip GPT-SoVITS ir Bark pateikia koreguojamuosius scenarijus. Galite treniruoti modelius savo balso duomenimis, kad sukurtumėte pasirinktinius balsus arba pagerintumėte tam tikrų kalbų našumą.

Geriausi atvirojo kodo modeliai (Kokoro, StyleTTS 2, Chatterbox) dabar atitinka arba viršija komercines paslaugas, tokias kaip vienuolika darbo vietų ir „Google TTS“ kokybės lyginamuosiuose standartuose. Pagrindinis komercinių paslaugų privalumas yra infrastruktūros valdymas ir palaikymas, o ne garso kokybė.

We have already excluded them. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), and Higgs-v2 (Boson License — restrictive) were all removed. Every model on TTS.ai is verified commercial-use safe.

Taip. Dauguma modelių priima bendruomenės indėlį per GitHub. Jūs galite pateikti klaidų ataskaitas, balso įrašus naujoms kalboms, kodo patobulinimus ir dokumentaciją. Patikrinkite kiekvieno modelio GitHub saugyklą informacijos apie indėlio gaires ir aktyvius klausimus.

Mūsų GPU serveris veikia 20+ modelių 4x Tesla P40 (96GB iš viso VRAM) naudodami dinaminę apkrovą. Vieną 24GB GPU gali vienu metu aptarnauti 3-5 modelius.

Daugelis modelių teikia oficialius Docker vaizdų ar Dockerfiles. Norėdami paleisti kelis modelius, galite sukurti pasirinktinį Docker setup su NVIDIA konteinerio įrankių rinkinį GPU prieigai. Mūsų API serverio architektūra gali būti naudojama kaip atskaitos įgyvendinimas.

Dauguma modelių reikalauja Python 3.10-3.12. Coqui TTS (VITS) specialiai reikia Python 3.11. Mes rekomenduojame Python 3.12 daugumai modelių. Patikrinkite kiekvieno modelio reikalavimus.txt tikslią versiją suderinamumą.

Taip. MIT ir Apache 2.0 licencijos aiškiai leidžia komerciniais tikslais. Galite statyti SaaS produktus, mobiliąsias programėles, žaidimus ir paslaugas, naudojant šiuos modelius be licencijų mokesčių, autorinių atlyginimų ar priskyrimo reikalavimų (nors priskyrimas yra vertinamas).

5.0/5 (1)

Pabandykite atverti šaltinį TTS šiandien

20+ atviro kodo modeliai, visi komerciškai licencijuoti. Naudokite mūsų API arba savihost — pasirinkimas yra jūsų.

Užsiregistruoti nemokamai Rodymo kaina

Atverti pradinio kodo tekstą kalbos modeliams

Pabandykite dabar

Mėgstu TTS.ai? Papasakok draugams!

Atviro kodo TTS nauda

Visi atvirojo šaltinio licencijuoti failai

MIT / Apache 2. 0

Savarankiškas

Optimizuotas GPU

Bendruomenė palaikoma

Naudojimas komerciniais tikslais

Mūsų atviro kodo modelio katalogas

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Kaip naudoti atvirojo kodo TTS

Tyrinėti atvirojo kodo modelius

Pabandykite naršyklėje

Savarankiškai arba naudoti mūsų API

Sukurti savo programą

Licencijos palyginimas

Savarankiškai samdoma ir priimama API

Savarankiškai naudoti jūsų aparatinę įrangą

Naudoti TTS.ai kompiuterizuotą API

Greitas paleidimas: API arba savijauta

Atviras šaltinis, priimtina kaina

Laisvoji pakopa

Pradžia

Pro

Dažnai užduodami klausimai

Ar visi TTS.ai modeliai tikrai atviro kodo?

Koks skirtumas tarp MIT ir Apache 2.0 licencijų?

Ar galiu patiems priimti šiuos modelius savo serveryje?

Ką GPU man reikia savarankiškai priimti TTS modelius?

Ar galiu gerai rasti atviro kodo TTS modelius?

Kaip atvirojo kodo TTS modeliai lyginami su komercinėmis paslaugomis?

Ar yra kokių nors modelių su ribojančiomis licencijomis, kurių turėčiau vengti?

Ar galiu prisidėti prie šių atvirojo kodo modelių?

Kaip paleisti kelis modelius viename GPU serveryje?

Ar yra Dokerio atvaizdas saviraiškos?

Kokios Python versijos man reikia saviprieglobos?

Ar galiu sukurti komercinį produktą, naudojant šiuos modelius?

Pabandykite atverti šaltinį TTS šiandien