Atverti pradinio kodo tekstą kalbos modeliams

Kiekvienas TTS modelis mūsų platformoje yra atviras šaltinis su komerciniais leidimais. MIT, Apache 2.0 — nėra patentuotas užraktas, jokių naudojimo apribojimų, jokių staigmenų licencijavimo mokesčių. Naudokite juos per mūsų kompiuterizuotą API, arba savarankiškai juos priimti į savo infrastruktūrą su visiškai kontroliuoti.

Atverti šaltinį MIT licencija Apache 2. 0 Savarankiškas GitHub

Pabandykite dabar

Nemokamai su Kokoro, Piper, VITS, MeloTTS
Jūsų sugeneruotas garsas bus rodomas čia
Generuotas
Atsiųsti
Mėgstu TTS.ai? Papasakok draugams!

Atviro kodo TTS nauda

Kodėl jūsų projektams svarbūs atvirojo kodo modeliai

Visi atvirojo šaltinio licencijuoti failai

Kiekvienas modelis TTS.ai naudoja leistiną atviro kodo licenciją. Nėra patentuotų juodųjų dėžių, nėra pardavėjo užrakto, jokių netikėtų licencijų mokesčių.

MIT / Apache 2. 0

Modeliai yra licencijuoti pagal MIT arba Apache 2.0, labiausiai leistina atviro šaltinio licencijos. Naudokite komerciniais, keisti, platinti — be apribojimų.

Savarankiškas

Atsisiųskite bet kokį modelį ir paleiskite jį savo aparatūroje. Pilna kontrolė dėl jūsų duomenų, latentiškumo ir infrastruktūros. Nėra debesų priklausomybės nereikia.

Optimizuotas GPU

Modeliai optimizuojami NVIDIA GPU su CUDA palaikymu. Piper veikia tik su procesoriumi. Daugumai modelių reikia 2-8GB VRAM efektyviam įvedimui.

Bendruomenė palaikoma

Aktyvus atviro šaltinio bendruomenės išlaikyti ir pagerinti šiuos modelius. Įnašai laukiami — pateikti klaidų, patobulinimai, ir nauji balsai GitHub.

Naudojimas komerciniais tikslais

Visi modeliai leidžia komerciniais tikslais naudoti pagal savo licencijas. Sukurti produktus, parduoti paslaugas, ir sukurti komercinį turinį be autorinių ar naudojimo mokesčius.

Mūsų atviro kodo modelio katalogas

Kiekvienas modelis, jo licencija, ir ką ji daro geriausiai

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Geriausias už: Apache 2.0 — geriausios kokybės nemokamas modelis, 82M params, lengva sau-host

Bandyti Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Geriausias už: MIT – tik procesorius, idealiai tinka briaunų įrenginiams ir įmontuotam saviraiškos įrenginiui

Bandyti Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Geriausias už: MIT – daugelio paskesnių modelių pagrindinė architektūra

Bandyti VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Geriausias už: MIT – unikalūs garso generavimo pajėgumai, viršijantys standartinius TTS

Bandyti Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Balso klonavimas

Geriausias už: Apache 2.0 – maksimali kokybė, plačiai ištirtas orientacinis įgyvendinimas

Bandyti Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Balso klonavimas

Geriausias už: MIT – atvirojo kodo balso klonavimas su granuliuoto stiliaus valdymu

Bandyti OpenVoice

Kaip naudoti atvirojo kodo TTS

Naudokite savo kompiuterizuotą API arba naudokite modelius patys

1

Tyrinėti atvirojo kodo modelius

Naršykite mūsų 20+ atviro kodo TTS modelių katalogą. Kiekvienas modelis puslapis rodo licenciją, architektūrą, galimybes, ir saviprieglobos reikalavimus.

2

Pabandykite naršyklėje

Testuoti bet kokį modelį tiesiogiai TTS.ai be instaliavimo nieko. Mūsų GPU serveriai rankena apdorojimas, todėl jūs galite įvertinti kokybę prieš įsipareigoti savarankiškai-hosting.

3

Savarankiškai arba naudoti mūsų API

Klonas modelis atpirkimo iš GitHub ir paleisti vietoje, arba naudoti mūsų prieglobos API gamybai. Savarankiškas naudojimas suteikia visišką kontrolę; mūsų API teikia valdomą infrastruktūrą.

4

Sukurti savo programą

Integruokite TTS į savo produktą, naudodami savarankiškai priimamus modelius arba mūsų REST API. Visi modeliai yra komerciškai naudojami be licencijavimo mokesčio ar autorinio atlyginimo.

Licencijos palyginimas

Visi TTS.ai modelių naudoti komerciniais tikslais atvirojo kodo licencijas

Pavyzdys Licencija Komercinis naudojimas Pakeitimas Savarankiškas Įnašas
Kokoro Apache 2.0 Reikalinga
Piper MIT Neprivaloma
VITS MIT Neprivaloma
MeloTTS MIT Neprivaloma
Chatterbox MIT Neprivaloma
Tortoise TTS Apache 2.0 Reikalinga
StyleTTS 2 MIT Neprivaloma
OpenVoice MIT Neprivaloma
Sesame CSM Apache 2.0 Reikalinga
Orpheus Llama 3.2 "Built with Llama"

Savarankiškai samdoma ir priimama API

Paleiskite modelius patys arba leiskite mums tvarkyti infrastruktūrą

Savarankiškai naudoti jūsų aparatinę įrangą

Kiekvienas modelis TTS.ai yra prieinamas kaip atviro kodo projektas GitHub arba Hugging Face. Parsisiųsti svorį, įdiegti priklausomybes, ir paleisti iš savo GPU. Jūs turite visą kontrolę dėl latentiškumo, privatumo, ir mastelio.

  • Pilnas duomenų privatumas — garso niekada nepalieka serverio
  • Po pradinės sąrankos išlaidų pagal prašymą skaičius
  • Pasirinktas patikslinimas pagal savo duomenis
  • Reikalauja GPU techninės įrangos (rekomenduojama NVIDIA)
  • Jūs valdote atnaujinimus, mastelio, ir priklausomybes

Naudoti TTS.ai kompiuterizuotą API

Greitą prieigą prie visų 20+ modelių gauname per vieną REST API. Mes tvarkome GPU aprūpinimą, modelių atnaujinimus, eilės valdymą ir mastelį. Vienas API raktas suteikia jums prieigą prie kiekvieno modelio – nereikia valdyti atskirų diegimų.

  • Nereikia GPU aparatūros
  • Visi 20+ modeliai per vieną API
  • Automatinis modelio atnaujinimas ir patobulinimai
  • 99,9 % darbo su nereikalinga infrastruktūra
  • Mokėti tik už tai, ką naudojate

Greitas paleidimas: API arba savijauta

Naudokite mūsų kompiuterizuotą API, arba įdiegti Kokoro vietoje per minutes

1 galimybė: TTS.ai surasta API Lengviausia
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2 galimybė. Visas valdymas
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Atviras šaltinis, priimtina kaina

Mūsų įdiegta API užtikrina atvirojo kodo TTS prieinamumą nevaldant GPU.

Laisvoji pakopa

$0

15 kreditų užsiregistravus

  • 4 atvirojo kodo modeliai nemokamai
  • Neprisiregistruojama pagrindiniam naudojimui
  • Leidžiama naudoti komerciniais tikslais

Pradžia

$9

500 000 ženklų per mėnesį

  • Visi 20+ atvirojo kodo modeliai
  • Balso klonavimas
  • API prieiga

Pro

$29

2 000 000 ženklų per mėnesį

  • Prioritetinis GPU tvarkymas
  • Visi aukščiausios kokybės modeliai
  • Parama įmonėms
Rodyti visą kainodarą

Dažnai užduodami klausimai

Dažni klausimai apie atviro kodo tekstą kalbėti

Taip. Kiekvienas modelis TTS.ai naudoja leistiną atviro kodo licenciją — MIT arba Apache 2.0. Mes specialiai atmetame modelius su ribojančiomis licencijomis (pvz., Coqui CPML arba nekomercinis CC-BY-NC). Galite patikrinti kiekvieno modelio licenciją savo GitHub saugyklos.

Abu yra leistini atvirojo kodo licencijos, leidžiančios komercinį naudojimą, modifikavimą ir perskirstymą. Apache 2.0 prideda aiškias patento dotacijas ir reikalauja nurodyti pakeitimus, jei keičiate kodą. MIT yra paprastesnis su mažesniais reikalavimais. Abu yra verslui draugiški.

Taip. Kiekvienas modelis gali būti savistaba. Klonuoti modelio saugyklą iš GitHub, įdiegti priklausomybes, atsisiųsti modelio svoriai, ir paleisti išvadą. Mes pateikiame dokumentus kiekvieno modelio saviraiškos reikalavimus, įskaitant GPU, RAM, ir Python versija.

Reikalavimai skiriasi pagal modelį. Piper reikia ne GPU (tik CPU). Kokoro ir MeloTTS reikia 1-2GB VRAM. Daugumai standartinių modelių reikia 4GB VRAM. Tortoise ir Sesame CSM reikia 8GB. NVIDIA RTX 3060 (12GB) gali veikti patogiai.

Taip. Atvirojo kodo licencijos leidžia modifikavimą, įskaitant koreguojimą. Tokie modeliai kaip GPT-SoVITS ir Bark pateikia koreguojamuosius scenarijus. Galite treniruoti modelius savo balso duomenimis, kad sukurtumėte pasirinktinius balsus arba pagerintumėte tam tikrų kalbų našumą.

Geriausi atvirojo kodo modeliai (Kokoro, StyleTTS 2, Chatterbox) dabar atitinka arba viršija komercines paslaugas, tokias kaip vienuolika darbo vietų ir „Google TTS“ kokybės lyginamuosiuose standartuose. Pagrindinis komercinių paslaugų privalumas yra infrastruktūros valdymas ir palaikymas, o ne garso kokybė.

XTTTS/XTTS-v2 (Coqui's CPML – nekomercinis), F5-TTS (CC-BY-NC – nekomercinis) ir Higs-v2 (Bosono licencija – apribojimas) buvo pašalinti. Kiekvienas TTS.ai modelis yra patikrintas komerciniam naudojimui saugiai.

Taip. Dauguma modelių priima bendruomenės indėlį per GitHub. Jūs galite pateikti klaidų ataskaitas, balso įrašus naujoms kalboms, kodo patobulinimus ir dokumentaciją. Patikrinkite kiekvieno modelio GitHub saugyklą informacijos apie indėlio gaires ir aktyvius klausimus.

Mūsų GPU serveris veikia 20+ modelių 4x Tesla P40 (96GB iš viso VRAM) naudodami dinaminę apkrovą. Vieną 24GB GPU gali vienu metu aptarnauti 3-5 modelius.

Daugelis modelių teikia oficialius Docker vaizdų ar Dockerfiles. Norėdami paleisti kelis modelius, galite sukurti pasirinktinį Docker setup su NVIDIA konteinerio įrankių rinkinį GPU prieigai. Mūsų API serverio architektūra gali būti naudojama kaip atskaitos įgyvendinimas.

Dauguma modelių reikalauja Python 3.10-3.12. Coqui TTS (VITS) specialiai reikia Python 3.11. Mes rekomenduojame Python 3.12 daugumai modelių. Patikrinkite kiekvieno modelio reikalavimus.txt tikslią versiją suderinamumą.

Taip. MIT ir Apache 2.0 licencijos aiškiai leidžia komerciniais tikslais. Galite statyti SaaS produktus, mobiliąsias programėles, žaidimus ir paslaugas, naudojant šiuos modelius be licencijų mokesčių, autorinių atlyginimų ar priskyrimo reikalavimų (nors priskyrimas yra vertinamas).
5.0/5 (1)

Ką mes galėtume pagerinti? Jūsų atsiliepimai padeda mums išspręsti problemas.

Pabandykite atverti šaltinį TTS šiandien

20+ atviro kodo modeliai, visi komerciškai licencijuoti. Naudokite mūsų API arba savihost — pasirinkimas yra jūsų.