Ziņot par kļūdu / funkciju pieprasījumu

Atvērt pirmkoda tekstu runas modeļiem

Katrs TTS modelis mūsu platformā ir atvērts avots ar komerciāli draudzīgām licencēm. MIT, Apache 2.0 — nav patentētas bloķēšanas, nav izmantošanas ierobežojumi, nav pārsteiguma licencēšanas maksas. Izmantojiet tos, izmantojot mūsu hosting API, vai patstāvīgi tos savā infrastruktūrā ar pilnīgu kontroli.

Atvērt avotu MIT licence Apache 2. 0 Pašizturīgs GitHub

Pilns TTS redaktors API dokumenti

Pamēģini tagad

Teksts
Faili

0/500

Bez taras ar Kokoro, Piper, VITS, MeloTTS

Šeit parādīsies jūsu ģenerētais audio

Atvērt pilnu TTS redaktoru

Atvērtā pirmkoda TTS ieguvumi

Kāpēc jūsu projektiem svarīgi ir atvērtā pirmkoda modeļi

Visi atvērtā avota licencētie

Katrs modelis par TTS.ai izmanto atļauto atvērtā pirmkoda licenci. Nav patentētu melno kastes, nav pārdevēja bloķēšana, nav negaidītas licencēšanas maksas.

MIT / Apache 2. 0

Modeļi ir licencēti saskaņā ar MIT vai Apache 2.0, visvairāk pielaidīgs atklātā pirmkoda licences. Izmantot komerciāli, mainīt, pārdalīt — bez ierobežojumiem.

Pašizturīgs

Lejupielādēt jebkuru modeli un palaist to uz savu aparatūru. Pilna kontrole pār jūsu datiem, latentumu un infrastruktūru. Nav mākoņu atkarības nepieciešams.

GPU optimizēta

Modeļi ir optimizēti NVIDIA GPU ar CUDA atbalstu. Piper darbojas tikai ar CPU. Lielākajai daļai modeļu ir nepieciešams 2-8GB VRAM, lai efektīvi iejauktos.

Kopiena uztur

Aktīvas atvērta pirmkoda kopienas uztur un uzlabo šos modeļus. Iemaksas laipni gaidīts — iesniegt kļūdas, uzlabojumi, un jaunas balsis par GitHub.

Komerciālai lietošanai labi

Visi modeļi ļauj komerciāli izmantot saskaņā ar to licencēm. Būvēt produktus, pārdot pakalpojumus, un radīt komerciālu saturu bez autoratlīdzības vai lietošanas maksas.

Mūsu atvērtā pirmkoda modeļa katalogs

Katrs modelis, tā licence, un ko tā dara vislabāk

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Labākais par: Apache 2.0 — labākais kvalitātes bezmaksas modelis, 82M params, viegli patstāvīgs

Mēģināt Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Labākais par: MIT – tikai CPU, ideāli piemērots malas ierīcēm un iebūvēta pašapkalpošanās

Mēģināt Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Labākais par: MIT — daudzu pakārtotu modeļu pamata arhitektūra

Mēģināt VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Labākais par: MIT – unikālas audio ģenerēšanas spējas, kas pārsniedz standarta TTS

Mēģināt Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Balss klonēšana

Labākais par: Apache 2.0 – maksimālā kvalitāte, plaši pētīta atsauces īstenošana

Mēģināt Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Balss klonēšana

Labākais par: MIT – atvērtā koda balss klonēšana ar granulu stila kontroli

Mēģināt OpenVoice

Kā lietot atvērtā pirmkoda TTS

Izmantot mūsu hosting API vai palaist modeļus sevi

Atvērto avotu modeļu izpēte

Pārlūkojiet mūsu 20+ atvērtā avota TTS modeļu katalogu. Katrā modeļa lapā parādītas licences, arhitektūras, iespēju un pašapkalpošanās prasības.

Mēģiniet pārlūkā

Testēt jebkuru modeli tieši uz TTS.ai bez uzstādīšanas neko. Mūsu GPU serveri rokturi apstrādes, lai jūs varētu novērtēt kvalitāti, pirms apņemties sevi hosting.

Pašpatēriņš vai izmantot mūsu API

Klons modelis repozitoriji no GitHub un palaist uz vietas, vai izmantot mūsu hosted API ražošanai. Pašu hostings dod pilnīgu kontroli; mūsu API nodrošina pārvaldīto infrastruktūru.

Veidojiet savu programmu

Integrējiet TTS savā produktā, izmantojot pašapkalpošanās modeļus vai mūsu REST API. Visi modeļi ir komerciāli izmantojami bez licencēšanas maksas vai autoratlīdzības.

Licences salīdzinājums

Visi modeļi par TTS.ai izmantot komerciāli draudzīgas atvērtā avota licences

Paraugs	Licence	Pienākums
Kokoro	Apache 2.0	Vajadzīgs
Piper	MIT	Pēc izvēles
VITS	MIT	Pēc izvēles
MeloTTS	MIT	Pēc izvēles
Chatterbox	MIT	Pēc izvēles
Tortoise TTS	Apache 2.0	Vajadzīgs
StyleTTS 2	MIT	Pēc izvēles
OpenVoice	MIT	Pēc izvēles
Sesame CSM	Apache 2.0	Vajadzīgs
Orpheus	Llama 3.2	"Built with Llama"

Izmēģiniet šos modeļus bez maksas

Pašapkalpošanās pret hosted API

Palaist modeļus sevi vai ļaujiet mums rīkoties ar infrastruktūru

Pašizpilde ar jūsu aparatūru

Katrs modelis par TTS.ai ir pieejams kā atvērtā avota projekts par GitHub vai Hugging Face. Lejupielādēt svaru, instalēt atkarību, un palaist secinājumus par savu GPU. Jums ir pilnīga kontrole pār latentumu, privātumu un mērogošanu.

Pilna datu privātums — audio nekad nepamet jūsu serveri
Izmaksu skaits pēc pieprasījuma pēc sākotnējās uzstādīšanas
Pielāgota jūsu datu precizēšana
Nepieciešama GPU aparatūra (ieteicams NVIDIA)
Jūs pārvaldīt atjauninājumus, mērogošana, un atkarības

Lietot TTS.ai datora API

Iegūstiet tūlītēju piekļuvi visiem 20+ modeļiem, izmantojot vienu REST API. Mēs apstrādājam GPU nodrošināšanu, modeļu atjauninājumus, rindas pārvaldību un mērogošanu. Viens API taustiņš dod jums piekļuvi katram modelim — nav nepieciešams pārvaldīt atsevišķus ieviešanas veidus.

Nav vajadzīga GPU aparatūra
Visi 20+ modeļi, izmantojot vienu API
Automātiski modeļu atjauninājumi un uzlabojumi
99,9 % atveseļošanās laiks ar lieku infrastruktūru
Maksā tikai par to, ko lietojat

Izmantot datora API vietā

Ātrā palaišana: API vai pašapziņa

Izmantojiet mūsu hosting API, vai instalēt lokāli Kokoro minūtēs

1. risinājums: TTS.ai uztvērējs API Vieglākais

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

2. risinājums: pašsaņemšana ar pip Pilnīga kontrole

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Skatīt API dokumentāciju

Atvērts avots, pieņemama cena

Mūsu hosting API padara atvērtā pirmkoda TTS pieejams bez pārvaldīt GPU.

Brīvais līmenis

15 kredīti pierakstīšanās brīdī

4 atvērtā avota modeļi bez maksas
Nav pierakstīšanās pamata lietošanai
Atļauta komerciāla izmantošana

Palaist

500 000 rakstzīmju/mēnesī

Visi 20+ atklātā pirmkoda modeļi
Balss klonēšana
API piekļuve

Pro

$29

2 000 000 rakstzīmju/mēnesī

Prioritārā GPU apstrāde
Visi premium modeļi
Atbalsts uzņēmumiem

Skatīt pilnu cenu

Bieži uzdoti jautājumi

Bieži uzdotie jautājumi par atklāto tekstu runāt

Jā. Katrs modelis par TTS.ai izmanto atļauto atklātā pirmkoda licenci — vai nu MIT vai Apache 2.0. Mēs īpaši izslēdzam modeļus ar ierobežojošām licencēm (piemēram, Coqui's CPML vai nekomerciālu CC-BY-NC). Jūs varat pārbaudīt katra modeļa licenci savā GitHub repozitorijā.

Abas ir pieļaujamas atklātā pirmkoda licences, kas ļauj komerciāli izmantot, pārveidot un pārdalīt. Apache 2.0 pievieno skaidras patentu dotācijas un pieprasa norādīt izmaiņas, ja jūs modificējat kodu. MIT ir vienkāršāka ar mazāk prasībām. Abi ir uzņēmējdarbībai draudzīgas.

Jā. Katrs modelis var būt pašapkalpošanās. Clone modeļa repozitorija no GitHub, instalēt atkarību, lejupielādēt modeļa svarus, un palaist inferences. Mēs nodrošinām dokumentāciju katra modeļa pašapkalpošanās prasībām, tostarp GPU, RAM, un Python versija.

Prasības atšķiras pēc modeļa. Piper nav GPU (tikai CPU). Kokoro un MeloTTS ir nepieciešams 1-2GB VRAM. Vairums standarta modeļiem ir nepieciešams 4GB VRAM. Tortoise un Sesame CSM nepieciešams 8GB. NVIDIA RTX 3060 (12GB) var darboties ērti.

Jā. Atvērtā pirmkoda licences ļauj veikt modifikācijas, ieskaitot precizēšanu. Modeļi, piemēram, GPT-SoVITS un Bark, nodrošina precizējošus skriptus. Varat apmācīt modeļus uz saviem balss datiem, lai radītu pielāgotus balsis vai uzlabotu veiktspēju konkrētām valodām.

Labākie atvērtā koda modeļi (Kokoro, StyleTTS 2, Chatterbox) tagad atbilst vai pārsniedz komerciālos pakalpojumus, piemēram, Vienpadsmitlabs un Google TTS kvalitātes kritērijos. Galvenā priekšrocība, ko sniedz komercpakalpojumi, ir pārvaldīta infrastruktūra un atbalsts, nevis audio kvalitāte.

Mēs jau esam tos izslēguši. XTTTS/XTTS-v2 (Coqui's CPML – nekomerciāls), F5-TTS (CC-BY-NC – nekomerciāls) un Higs-v2 (Boson Licence – ierobežojoša). Katrs modelis TTS.ai ir pārbaudīts komerciālai izmantošanai drošs.

Jā. Lielākā daļa modeļu pieņem kopienas ieguldījumu, izmantojot GitHub. Jūs varat iesniegt kļūdu ziņojumus, balss ierakstus jaunām valodām, kodu uzlabojumus un dokumentāciju. Pārbaudiet katra modeļa GitHub repozitoriju attiecībā uz ieguldījuma pamatnostādnēm un aktīviem jautājumiem.

GPU serveris darbina 20+ modeļus ar 4x Tesla P40 (96GB kopā VRAM), izmantojot dinamisku iekraušanu. Pašhostingam 24GB GPU var kalpot 3-5 modeļiem vienlaicīgi.

Daudzi modeļi nodrošina oficiālus Docker attēlus vai Dockerfiles. Lai darbotos ar vairākiem modeļiem, jūs varat izveidot pielāgotu Docker konfigurāciju ar NVIDIA Container Toolkit GPU piekļuvei. Mūsu API servera arhitektūra var kalpot kā atsauces īstenošanu.

Lielākā daļa modeļu prasa Python 3.10-3.12. Coqui TTS (VITS) īpaši nepieciešams Python 3.11. Mēs iesakām Python 3.12 vairumam modeļu. Pārbaudiet katra modeļa prasības.txt precīzas versijas saderības.

Jā. MIT un Apache 2.0 licences skaidri ļauj komerciālo izmantošanu. Jūs varat veidot SaaS produktus, mobilās lietotnes, spēles, un pakalpojumus, izmantojot šos modeļus bez licencēšanas maksas, autoratlīdzības, vai piešķīruma prasības (kaut gan piešķīrums tiek novērtēts).

5.0/5 (1)

Mēģiniet atvērtā avota TTS šodien

20+ atvērtā pirmkoda modeļi, visi komerciāli licencēti. Izmantojiet mūsu API vai pašapkalpošanās — izvēle ir jūsu.

Pierakstīties brīvībā Skatīt cenu

Atvērt pirmkoda tekstu runas modeļiem

Pamēģini tagad

Mīlestība TTS.ai? Stāsti saviem draugiem!

Atvērtā pirmkoda TTS ieguvumi

Visi atvērtā avota licencētie

MIT / Apache 2. 0

Pašizturīgs

GPU optimizēta

Kopiena uztur

Komerciālai lietošanai labi

Mūsu atvērtā pirmkoda modeļa katalogs

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Kā lietot atvērtā pirmkoda TTS

Atvērto avotu modeļu izpēte

Mēģiniet pārlūkā

Pašpatēriņš vai izmantot mūsu API

Veidojiet savu programmu

Licences salīdzinājums

Pašapkalpošanās pret hosted API

Pašizpilde ar jūsu aparatūru

Lietot TTS.ai datora API

Ātrā palaišana: API vai pašapziņa

Atvērts avots, pieņemama cena

Brīvais līmenis

Palaist

Pro

Bieži uzdoti jautājumi

Vai visi TTS.ai modeļi tiešām atvērtā koda?

Kāda ir atšķirība starp MIT un Apache 2.0 licencēm?

Vai es varu paši-host šos modeļus uz mana servera?

Kas GPU man ir nepieciešams, lai pašapkalpošanās TTS modeļus?

Vai es varu izsekot atvērtā koda TTS modeļiem?

Kā atvērtā avota TTS modeļi salīdzina ar komerciāliem pakalpojumiem?

Vai ir kādi modeļi ar ierobežojošām licencēm, no kuriem man vajadzētu izvairīties?

Vai es varu sniegt ieguldījumu šajos atvērtā avota modeļos?

Kā palaist vairākus modeļus uz viena GPU servera?

Vai ir Dokera attēls pašdzīvē?

Kāda Python versija man ir nepieciešams, lai pašapkalpošanās?

Vai es varu veidot komerciālu produktu, izmantojot šos modeļus?

Mēģiniet atvērtā avota TTS šodien