Atvērt pirmkoda tekstu runas modeļiem

Katrs TTS modelis mūsu platformā ir atvērts avots ar komerciāli draudzīgām licencēm. MIT, Apache 2.0 — nav patentētas bloķēšanas, nav izmantošanas ierobežojumi, nav pārsteiguma licencēšanas maksas. Izmantojiet tos, izmantojot mūsu hosting API, vai patstāvīgi tos savā infrastruktūrā ar pilnīgu kontroli.

Atvērt avotu MIT licence Apache 2. 0 Pašizturīgs GitHub

Pamēģini tagad

Bez taras ar Kokoro, Piper, VITS, MeloTTS
Šeit parādīsies jūsu ģenerētais audio
Ģenerēts
Lejupielādēt
Mīlestība TTS.ai? Stāsti saviem draugiem!

Atvērtā pirmkoda TTS ieguvumi

Kāpēc jūsu projektiem svarīgi ir atvērtā pirmkoda modeļi

Visi atvērtā avota licencētie

Katrs modelis par TTS.ai izmanto atļauto atvērtā pirmkoda licenci. Nav patentētu melno kastes, nav pārdevēja bloķēšana, nav negaidītas licencēšanas maksas.

MIT / Apache 2. 0

Modeļi ir licencēti saskaņā ar MIT vai Apache 2.0, visvairāk pielaidīgs atklātā pirmkoda licences. Izmantot komerciāli, mainīt, pārdalīt — bez ierobežojumiem.

Pašizturīgs

Lejupielādēt jebkuru modeli un palaist to uz savu aparatūru. Pilna kontrole pār jūsu datiem, latentumu un infrastruktūru. Nav mākoņu atkarības nepieciešams.

GPU optimizēta

Modeļi ir optimizēti NVIDIA GPU ar CUDA atbalstu. Piper darbojas tikai ar CPU. Lielākajai daļai modeļu ir nepieciešams 2-8GB VRAM, lai efektīvi iejauktos.

Kopiena uztur

Aktīvas atvērta pirmkoda kopienas uztur un uzlabo šos modeļus. Iemaksas laipni gaidīts — iesniegt kļūdas, uzlabojumi, un jaunas balsis par GitHub.

Komerciālai lietošanai labi

Visi modeļi ļauj komerciāli izmantot saskaņā ar to licencēm. Būvēt produktus, pārdot pakalpojumus, un radīt komerciālu saturu bez autoratlīdzības vai lietošanas maksas.

Mūsu atvērtā pirmkoda modeļa katalogs

Katrs modelis, tā licence, un ko tā dara vislabāk

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Labākais par: Apache 2.0 — labākais kvalitātes bezmaksas modelis, 82M params, viegli patstāvīgs

Mēģināt Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Labākais par: MIT – tikai CPU, ideāli piemērots malas ierīcēm un iebūvēta pašapkalpošanās

Mēģināt Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Labākais par: MIT — daudzu pakārtotu modeļu pamata arhitektūra

Mēģināt VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Labākais par: MIT – unikālas audio ģenerēšanas spējas, kas pārsniedz standarta TTS

Mēģināt Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Balss klonēšana

Labākais par: Apache 2.0 – maksimālā kvalitāte, plaši pētīta atsauces īstenošana

Mēģināt Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Balss klonēšana

Labākais par: MIT – atvērtā koda balss klonēšana ar granulu stila kontroli

Mēģināt OpenVoice

Kā lietot atvērtā pirmkoda TTS

Izmantot mūsu hosting API vai palaist modeļus sevi

1

Atvērto avotu modeļu izpēte

Pārlūkojiet mūsu 20+ atvērtā avota TTS modeļu katalogu. Katrā modeļa lapā parādītas licences, arhitektūras, iespēju un pašapkalpošanās prasības.

2

Mēģiniet pārlūkā

Testēt jebkuru modeli tieši uz TTS.ai bez uzstādīšanas neko. Mūsu GPU serveri rokturi apstrādes, lai jūs varētu novērtēt kvalitāti, pirms apņemties sevi hosting.

3

Pašpatēriņš vai izmantot mūsu API

Klons modelis repozitoriji no GitHub un palaist uz vietas, vai izmantot mūsu hosted API ražošanai. Pašu hostings dod pilnīgu kontroli; mūsu API nodrošina pārvaldīto infrastruktūru.

4

Veidojiet savu programmu

Integrējiet TTS savā produktā, izmantojot pašapkalpošanās modeļus vai mūsu REST API. Visi modeļi ir komerciāli izmantojami bez licencēšanas maksas vai autoratlīdzības.

Licences salīdzinājums

Visi modeļi par TTS.ai izmantot komerciāli draudzīgas atvērtā avota licences

Paraugs Licence Komerciāla izmantošana Grozījumi Pašizpilde Pienākums
Kokoro Apache 2.0 Vajadzīgs
Piper MIT Pēc izvēles
VITS MIT Pēc izvēles
MeloTTS MIT Pēc izvēles
Chatterbox MIT Pēc izvēles
Tortoise TTS Apache 2.0 Vajadzīgs
StyleTTS 2 MIT Pēc izvēles
OpenVoice MIT Pēc izvēles
Sesame CSM Apache 2.0 Vajadzīgs
Orpheus Llama 3.2 "Built with Llama"

Pašapkalpošanās pret hosted API

Palaist modeļus sevi vai ļaujiet mums rīkoties ar infrastruktūru

Pašizpilde ar jūsu aparatūru

Katrs modelis par TTS.ai ir pieejams kā atvērtā avota projekts par GitHub vai Hugging Face. Lejupielādēt svaru, instalēt atkarību, un palaist secinājumus par savu GPU. Jums ir pilnīga kontrole pār latentumu, privātumu un mērogošanu.

  • Pilna datu privātums — audio nekad nepamet jūsu serveri
  • Izmaksu skaits pēc pieprasījuma pēc sākotnējās uzstādīšanas
  • Pielāgota jūsu datu precizēšana
  • Nepieciešama GPU aparatūra (ieteicams NVIDIA)
  • Jūs pārvaldīt atjauninājumus, mērogošana, un atkarības

Lietot TTS.ai datora API

Iegūstiet tūlītēju piekļuvi visiem 20+ modeļiem, izmantojot vienu REST API. Mēs apstrādājam GPU nodrošināšanu, modeļu atjauninājumus, rindas pārvaldību un mērogošanu. Viens API taustiņš dod jums piekļuvi katram modelim — nav nepieciešams pārvaldīt atsevišķus ieviešanas veidus.

  • Nav vajadzīga GPU aparatūra
  • Visi 20+ modeļi, izmantojot vienu API
  • Automātiski modeļu atjauninājumi un uzlabojumi
  • 99,9 % atveseļošanās laiks ar lieku infrastruktūru
  • Maksā tikai par to, ko lietojat

Ātrā palaišana: API vai pašapziņa

Izmantojiet mūsu hosting API, vai instalēt lokāli Kokoro minūtēs

1. risinājums: TTS.ai uztvērējs API Vieglākais
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2. risinājums: pašsaņemšana ar pip Pilnīga kontrole
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Atvērts avots, pieņemama cena

Mūsu hosting API padara atvērtā pirmkoda TTS pieejams bez pārvaldīt GPU.

Brīvais līmenis

$0

15 kredīti pierakstīšanās brīdī

  • 4 atvērtā avota modeļi bez maksas
  • Nav pierakstīšanās pamata lietošanai
  • Atļauta komerciāla izmantošana

Palaist

$9

500 000 rakstzīmju/mēnesī

  • Visi 20+ atklātā pirmkoda modeļi
  • Balss klonēšana
  • API piekļuve

Pro

$29

2 000 000 rakstzīmju/mēnesī

  • Prioritārā GPU apstrāde
  • Visi premium modeļi
  • Atbalsts uzņēmumiem
Skatīt pilnu cenu

Bieži uzdoti jautājumi

Bieži uzdotie jautājumi par atklāto tekstu runāt

Jā. Katrs modelis par TTS.ai izmanto atļauto atklātā pirmkoda licenci — vai nu MIT vai Apache 2.0. Mēs īpaši izslēdzam modeļus ar ierobežojošām licencēm (piemēram, Coqui's CPML vai nekomerciālu CC-BY-NC). Jūs varat pārbaudīt katra modeļa licenci savā GitHub repozitorijā.

Abas ir pieļaujamas atklātā pirmkoda licences, kas ļauj komerciāli izmantot, pārveidot un pārdalīt. Apache 2.0 pievieno skaidras patentu dotācijas un pieprasa norādīt izmaiņas, ja jūs modificējat kodu. MIT ir vienkāršāka ar mazāk prasībām. Abi ir uzņēmējdarbībai draudzīgas.

Jā. Katrs modelis var būt pašapkalpošanās. Clone modeļa repozitorija no GitHub, instalēt atkarību, lejupielādēt modeļa svarus, un palaist inferences. Mēs nodrošinām dokumentāciju katra modeļa pašapkalpošanās prasībām, tostarp GPU, RAM, un Python versija.

Prasības atšķiras pēc modeļa. Piper nav GPU (tikai CPU). Kokoro un MeloTTS ir nepieciešams 1-2GB VRAM. Vairums standarta modeļiem ir nepieciešams 4GB VRAM. Tortoise un Sesame CSM nepieciešams 8GB. NVIDIA RTX 3060 (12GB) var darboties ērti.

Jā. Atvērtā pirmkoda licences ļauj veikt modifikācijas, ieskaitot precizēšanu. Modeļi, piemēram, GPT-SoVITS un Bark, nodrošina precizējošus skriptus. Varat apmācīt modeļus uz saviem balss datiem, lai radītu pielāgotus balsis vai uzlabotu veiktspēju konkrētām valodām.

Labākie atvērtā koda modeļi (Kokoro, StyleTTS 2, Chatterbox) tagad atbilst vai pārsniedz komerciālos pakalpojumus, piemēram, Vienpadsmitlabs un Google TTS kvalitātes kritērijos. Galvenā priekšrocība, ko sniedz komercpakalpojumi, ir pārvaldīta infrastruktūra un atbalsts, nevis audio kvalitāte.

Mēs jau esam tos izslēguši. XTTTS/XTTS-v2 (Coqui's CPML – nekomerciāls), F5-TTS (CC-BY-NC – nekomerciāls) un Higs-v2 (Boson Licence – ierobežojoša). Katrs modelis TTS.ai ir pārbaudīts komerciālai izmantošanai drošs.

Jā. Lielākā daļa modeļu pieņem kopienas ieguldījumu, izmantojot GitHub. Jūs varat iesniegt kļūdu ziņojumus, balss ierakstus jaunām valodām, kodu uzlabojumus un dokumentāciju. Pārbaudiet katra modeļa GitHub repozitoriju attiecībā uz ieguldījuma pamatnostādnēm un aktīviem jautājumiem.

GPU serveris darbina 20+ modeļus ar 4x Tesla P40 (96GB kopā VRAM), izmantojot dinamisku iekraušanu. Pašhostingam 24GB GPU var kalpot 3-5 modeļiem vienlaicīgi.

Daudzi modeļi nodrošina oficiālus Docker attēlus vai Dockerfiles. Lai darbotos ar vairākiem modeļiem, jūs varat izveidot pielāgotu Docker konfigurāciju ar NVIDIA Container Toolkit GPU piekļuvei. Mūsu API servera arhitektūra var kalpot kā atsauces īstenošanu.

Lielākā daļa modeļu prasa Python 3.10-3.12. Coqui TTS (VITS) īpaši nepieciešams Python 3.11. Mēs iesakām Python 3.12 vairumam modeļu. Pārbaudiet katra modeļa prasības.txt precīzas versijas saderības.

Jā. MIT un Apache 2.0 licences skaidri ļauj komerciālo izmantošanu. Jūs varat veidot SaaS produktus, mobilās lietotnes, spēles, un pakalpojumus, izmantojot šos modeļus bez licencēšanas maksas, autoratlīdzības, vai piešķīruma prasības (kaut gan piešķīrums tiek novērtēts).
5.0/5 (1)

Ko mēs varam uzlabot? Jūsu atgriezeniskā saite palīdz mums atrisināt problēmas.

Mēģiniet atvērtā avota TTS šodien

20+ atvērtā pirmkoda modeļi, visi komerciāli licencēti. Izmantojiet mūsu API vai pašapkalpošanās — izvēle ir jūsu.