Informa d' errors / Petició de característiques

Obre el text font als models de veu

Cada model TTS de la nostra plataforma és una font oberta amb llicències comercials. MIT, Apache 2. 0 no propietari de blocar, sense restriccions d' ús, ni taxa de llicència sorpresa. Useu- les a través de la nostra API allotjada, o auto- màquina per a ells en la vostra pròpia infraestructura amb tot el control.

Obre l' origen Llicència MIT Apache 2. 0 Auto- Hostible GitHub

Editor TTS complet API Docs

Intenta-ho ara

Text
Fitxers

0/500

Lliure amb Kokoro, Koner, VITS, MeloTTS

Apareixerà aquí el vostre àudio generat

Obre l' editor TTS complet

Open TTS Benewits

Per què els models de codi obert importen els vostres projectes

Totes les llicències de l' Open-Font

Cada model de TTS.ai usa una llicència permissiva de codi obert. No hi ha caixes negres propietari, ni distribuïdores, ni taxa de llicència inesperada.

MIT / Apache 2. 0

Els models són amb llicència de l' MIT o Apache 2. 0, les llicències de codi obert més persistents. Useu comercialment, modifiqueu, redistribuir no restriccions.

Auto- Hostible

Descarrega qualsevol model i executa' l en el vostre propi maquinari. Control complet sobre les vostres dades, retardencs i infraestructures. No es requereix dependència de núvol.

Optimitzat de la GPU

Els models són optimitzats per a les GPUs NVIDIA amb implementació de CUDA. El conducte només s' executa a la CPU. La majoria dels models només necessiten 2- 8GB VRAM per a una inferència eficient.

Comunitat mantéda

Les comunitats de codi obert actives mantenen i milloren aquests models. Les cotribucions donen errors, millores i noves veus a GitHub.

Compressiu- lo bé

Tots els models permeten l'ús comercial sota les seves llicències. Construïu productes, venen serveis, i creen continguts comercials sense reials o honoraris d'ús.

El nostre catàleg de model font obert

Cada model, la seva llicència, i el que fa millor

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Millor per a: Apache 2. 0 millor model lliure de qualitat, 82M params, fàcil d'auto-ordinador

Intenta- ho Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Millor per a: Només CPU de MIT, perfecte per a dispositius de vora i auto-ordinadors incrustats

Intenta- ho Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Millor per a: arquitectura fundació de MIT usada per molts models membres del MIT

Intenta- ho VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Millor per a: Aplicació única de generació d'àudio del MIT, més enllà del TTS estàndard

Intenta- ho Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clon de veu

Millor per a: Apache 2. 0 qualitat màxima, s' ha estudiat àmpliament la implementació de referència

Intenta- ho Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clon de veu

Millor per a: Una clonació de veu de l'Ectx- source amb control d'estil granular

Intenta- ho OpenVoice

Com usar TTS de codi font obert

Useu el nostre API i executeu models vós mateixos

Exploreu models d' Open-Fonts

Navegueu pel nostre catàleg de models TTS de 20+ oberts. Cada pàgina de model mostra la llicència, arquitectura, capacitats i requisits d' auto- màquina.

Prova en el vostre navegador

Prova directament en TTS.ai sense instal· lar res. Els nostres servidors de la GPU es poden avaluar la qualitat abans de cometre auto- màquina.

L' autoHost o l' ús de la nostra API

El model clon reposit des de GitHub i s' executa localment, o utilitza la nostra API allotjada per a la producció. L' auto- màquina dóna tot el control; la nostra API proveeix infraestructures gestionades.

Construeix la vostra aplicació

Integrat TTS en el vostre producte usant models autohosteds o la nostra API REST. Tots els models són usables comercialment sense taxa de llicència o reials.

Comparació de la llicència

Tots els models de TTS.ai usen llicències comercials amb facilitat de codi obert

Model	Llicència	Attribució
Kokoro	Apache 2.0	Requerit
Piper	MIT	Opcional
VITS	MIT	Opcional
MeloTTS	MIT	Opcional
Chatterbox	MIT	Opcional
Tortoise TTS	Apache 2.0	Requerit
StyleTTS 2	MIT	Opcional
OpenVoice	MIT	Opcional
Sesame CSM	Apache 2.0	Requerit
Orpheus	Llama 3.2	"Built with Llama"

Proveu amb aquests models lliures

Self- Hosting contra l' API en contra de la màquina

Executeu models vosaltres mateixos o deixeu-nos gestionar la infraestructura

Host al vostre maquinari

Cada model de TTS.ai està disponible com a un projecte de codi obert a GitHub o Abraçador Face. Baixeu els pesos, instal· leu les dependències i executeu la inferència a les vostres estimada GPU. Teniu un control complet sobre la tardència, la privacitat i l' escalat.

La privacitat completa de les dades ascii mai deixa el vostre servidor
No hi ha costos per contrasenya després de l' arranjament inicial
A mida, bé, en les vostres pròpies dades
Requereix maquinari de la GPU (NVIDIA recomanat)
Gestioneu actualitzacions, escalat i dependències

Usa l' API TTS.ai Host

Obtenir accés instantani a tots els 20+ models a través d' una única API REST. Mantenim actualitzacions de la GPU, model, gestió de cues i escalat. Una clau API us dóna accés a cada model ntxal no cal gestionar desplegaments separats.

No cal maquinari de la GPU
Tots els 20+ models a través d' una API
Actualitzacions automàtiques del model i millores
99. 99. 99% d' hora amb infraestructura redundant
Paga només pel que utilitzeu

Usa l' API de la màquina

Inici ràpid: API o auto-Host

Usa la nostra API allotjada, o instal·lació de Kokoro localment en minuts

Opció 1: TTS.ai Strated API EtestCity name (optional, probably does not need a translation)

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opció 2: auto-Host amb pip Control complet

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Visualitza la documentació de l' API

Font obert, Pericable Afford

La nostra API allotjada fa accessible al TTS de codi obert sense gestionar les GPUs.

Free TierCity name (optional, probably does not need a translation)

50 crèdits en signar

4 models de codi obert lliures
No hi ha signes per a l' ús bàsic
Ús comercial permès

Iniciador

500 crèdits/ mesos

Tots els models de codi obert 20+
clonació de veu
Accés de l' API

Pro

$29

2000 crèdits/ mesos

Processament de la GPU de prioritat
Tots els models de gràcia
Implementació de l'Enterprise

Visualitza Pricing completa

Preguntes més freqüents

Preguntes comunes quant al text de codi font obert a la parla

Sí. Cada model sobre TTS.ai utilitza una llicència de codi obert permsive, o bé l' Apache o Apache 2. 0, especialment amb llicències restrictives (com el PCML de Coqui o no comercial CC-BY-NC). Podeu verificar cada llicència de model en el seu repositori GitHub.

Ambdues són llicències de codi obert que permeten l' ús comercial, la modificació i la redistribució. Apache 2. 0 afegeix subvencions explícites i requereix que els canvis si modifiqueu el codi. El MIT és més senzill amb menys requisits. Tots dos són amigables.

Sí. Cada model pot ser auto- màquina. Clon el repositori de model des de GitHub, instal· leu dependències, pess del model de descàrrega i executeu inferència. Us proporcionem documentació per a les necessitats d' auto- màquina de cada model, incloent- hi la GPU, la RAM i la versió Python.

Requeriments varien pel model. El conducte no necessita cap GPU (CPU). Kokoro i MelTTS necessiten 1- 2GB VRAM. La majoria de models estàndard necessiten 4GB VRAM. Tortose i Same CSM necessiten 8GB. Un RT NVIDIAX 3060 (12GB) pot executar models més còmodament.

Sí. Les llicències de codi obert permeten modificar- les incloent- hi les modificacions. Models com GPT- STITS i Bark proporcionen scripts de qualitat. Podeu entrenar models a les vostres pròpies dades de veu per crear veus personalitzades o millorar el rendiment de les llengües específiques.

Models de codi superior obert (Kkoro, StyleTTS 2, Chatterbox) que coincideixen ara amb serveis comercials o superen serveis comercials com Onze Labs i Google TTS en punts de referència de qualitat. L' avantatge principal dels serveis comercials està gestionat per infraestructures i suport, no qualitat d' àudio.

Ja les hem exclòs. XTTS/ XTTS- v2 (el CPML no comercials), F5- TTS (CC-BY-NC-NC_ US), i Higgs- v2 (Llicència de l' arc) s' han eliminat tots. Cada model de TTS.ai es verifica la seguretat comercial- use.

Sí. La majoria de models accepten contribucions a la comunitat mitjançant GitHub. Podeu enviar informes d' error, gravacions de veu per a nous idiomes, millores en el codi i documentació. Comproveu cada repositori del model per a les guies d' contribució i qüestions actives.

Carrega models a on- demand i baixa quan està inactiu per a compartir la memòria de la GPU. El nostre servidor de la GPU executa 20+ models en 4x Tesla P40 (96GB total VRAM) usant càrrega dinàmica. Per a la auto- màquina, un únic 24GB GPU pot servir 3 models conactualment.

Molts models proporcionen imatges oficials Dockers o fitxers Dockers. Per executar múltiples models, podeu construir una configuració a mida de Docker amb l' eina de contenidor NVIDIA d' accés a la GPU. La nostra arquitectura del servidor API pot servir com a implementació de referència.

La majoria de models requereixen Python 3. 10- 3. 12. Coqui TTS (VITS) específicament necessita el Python 3. 11. Us recomanem que el Python 3. 32 per a la majoria de models. Comproveu els requeriments de cada model. tx per a compatibilitat exacta de versions.

Les llicències del MIT i Apache 2. 0 permeten l' ús comercial explícitament. Podeu construir productes SaS, aplicacions mòbils, jocs i serveis usant aquests models sense drets de llicència, reials, o requisits d' atribució (tot i que s' apreciiment).

5.0/5 (1)

Prova d' obrir el TTS d' avui

20+ models de codi obert, tots els models de llicència comercial. Useu la nostra API o l' autohost- Bus, l' elecció és vostra.

Signa lliure Visualitza Pricing

Obre el text font als models de veu

Intenta-ho ara

Els teus amics!

Open TTS Benewits

Totes les llicències de l' Open-Font

MIT / Apache 2. 0

Auto- Hostible

Optimitzat de la GPU

Comunitat mantéda

Compressiu- lo bé

El nostre catàleg de model font obert

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Com usar TTS de codi font obert

Exploreu models d' Open-Fonts

Prova en el vostre navegador

L' autoHost o l' ús de la nostra API

Construeix la vostra aplicació

Comparació de la llicència

Self- Hosting contra l' API en contra de la màquina

Host al vostre maquinari

Usa l' API TTS.ai Host

Inici ràpid: API o auto-Host

Font obert, Pericable Afford

Free TierCity name (optional, probably does not need a translation)

Iniciador

Pro

Preguntes més freqüents

Are all TTS.ai models really open source?

Quina diferència hi ha entre el MIT i les llicències Apache 2.0?

Puc posar en marxa aquests models al meu propi servidor?

Quin model necessito d'auto-ordinador TTS?

Puc afinar models TTS de codi obert?

Com es comparen els models TTS de codi obert amb els serveis comercials?

Hi ha cap model amb llicències restrictives que hauria d'evitar?

Puc contribuir en aquests models de codi obert?

Com puc executar múltiples models en un servidor GPU?

Hi ha una imatge amarrada per auto-ordinadors?

Quina versió en Python necessito per a l'auto-ordinador?

Puc crear un producte comercial utilitzant aquests models?

Prova d' obrir el TTS d' avui