Obre el text font als models de veu

Cada model TTS de la nostra plataforma és una font oberta amb llicències comercials. MIT, Apache 2. 0 no propietari de blocar, sense restriccions d' ús, ni taxa de llicència sorpresa. Useu- les a través de la nostra API allotjada, o auto- màquina per a ells en la vostra pròpia infraestructura amb tot el control.

Obre l' origen Llicència MIT Apache 2. 0 Auto- Hostible GitHub

Intenta-ho ara

0/500
Lliure amb Kokoro, Koner, VITS, MeloTTS
Your generated audio will appear here
Generat
0:00 0:00
Descarrega
Com TTS.ai? Digue-li als teus amics!

Open TTS Benewits

Per què els models de codi obert importen els vostres projectes

Totes les llicències de l' Open-Font

Cada model de TTS.ai usa una llicència permissiva de codi obert. No hi ha caixes negres propietari, ni distribuïdores, ni taxa de llicència inesperada.

MIT / Apache 2. 0

Els models són amb llicència de l' MIT o Apache 2. 0, les llicències de codi obert més persistents. Useu comercialment, modifiqueu, redistribuir no restriccions.

Auto- Hostible

Descarrega qualsevol model i executa' l en el vostre propi maquinari. Control complet sobre les vostres dades, retardencs i infraestructures. No es requereix dependència de núvol.

Optimitzat de la GPU

Els models són optimitzats per a les GPUs NVIDIA amb implementació de CUDA. El conducte només s' executa a la CPU. La majoria dels models només necessiten 2- 8GB VRAM per a una inferència eficient.

Comunitat mantéda

Les comunitats de codi obert actives mantenen i milloren aquests models. Les cotribucions donen errors, millores i noves veus a GitHub.

Compressiu- lo bé

Tots els models permeten l'ús comercial sota les seves llicències. Construïu productes, venen serveis, i creen continguts comercials sense reials o honoraris d'ús.

El nostre catàleg de model font obert

Cada model, la seva llicència, i el que fa millor

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Millor per a: Apache 2. 0 millor model lliure de qualitat, 82M params, fàcil d'auto-ordinador

Intenta- ho Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Millor per a: Només CPU de MIT, perfecte per a dispositius de vora i auto-ordinadors incrustats

Intenta- ho Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Millor per a: arquitectura fundació de MIT usada per molts models membres del MIT

Intenta- ho VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Millor per a: Aplicació única de generació d'àudio del MIT, més enllà del TTS estàndard

Intenta- ho Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clon de veu

Millor per a: Apache 2. 0 qualitat màxima, s' ha estudiat àmpliament la implementació de referència

Intenta- ho Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clon de veu

Millor per a: Una clonació de veu de l'Ectx- source amb control d'estil granular

Intenta- ho OpenVoice

Com usar TTS de codi font obert

Useu el nostre API i executeu models vós mateixos

1

Exploreu models d' Open-Fonts

Navegueu pel nostre catàleg de models TTS de 20+ oberts. Cada pàgina de model mostra la llicència, arquitectura, capacitats i requisits d' auto- màquina.

2

Prova en el vostre navegador

Prova directament en TTS.ai sense instal· lar res. Els nostres servidors de la GPU es poden avaluar la qualitat abans de cometre auto- màquina.

3

L' autoHost o l' ús de la nostra API

El model clon reposit des de GitHub i s' executa localment, o utilitza la nostra API allotjada per a la producció. L' auto- màquina dóna tot el control; la nostra API proveeix infraestructures gestionades.

4

Construeix la vostra aplicació

Integrat TTS en el vostre producte usant models autohosteds o la nostra API REST. Tots els models són usables comercialment sense taxa de llicència o reials.

Comparació de la llicència

Tots els models de TTS.ai usen llicències comercials amb facilitat de codi obert

Model Llicència Ús comercial Modificació Auto- HostCity name (optional, probably does not need a translation) Attribució
Kokoro Apache 2.0 Requerit
Piper MIT Opcional
VITS MIT Opcional
MeloTTS MIT Opcional
Chatterbox MIT Opcional
Tortoise TTS Apache 2.0 Requerit
StyleTTS 2 MIT Opcional
OpenVoice MIT Opcional
Sesame CSM Apache 2.0 Requerit
Orpheus Llama 3.2 "Built with Llama"

Self- Hosting contra l' API en contra de la màquina

Executeu models vosaltres mateixos o deixeu-nos gestionar la infraestructura

Host al vostre maquinari

Cada model de TTS.ai està disponible com a un projecte de codi obert a GitHub o Abraçador Face. Baixeu els pesos, instal· leu les dependències i executeu la inferència a les vostres estimada GPU. Teniu un control complet sobre la tardència, la privacitat i l' escalat.

  • La privacitat completa de les dades ascii mai deixa el vostre servidor
  • No hi ha costos per contrasenya després de l' arranjament inicial
  • A mida, bé, en les vostres pròpies dades
  • Requereix maquinari de la GPU (NVIDIA recomanat)
  • Gestioneu actualitzacions, escalat i dependències

Usa l' API TTS.ai Host

Obtenir accés instantani a tots els 24+ models a través d' una única API REST. Mantenim actualitzacions de la GPU, model, gestió de cues i escalat. Una clau API us dona accés a tots els models no cal gestionar desplegaments separats.

  • No cal maquinari de la GPU
  • Tots els 24+ models a través d' una API
  • Actualitzacions automàtiques del model i millores
  • 99. 99. 99% d' hora amb infraestructura redundant
  • Paga només pel que utilitzeu

Inici ràpid: API o auto-Host

Usa la nostra API allotjada, o instal·lació de Kokoro localment en minuts

Opció 1: TTS.ai Strated API EtestCity name (optional, probably does not need a translation)
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opció 2: auto-Host amb pip Control complet
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Font obert, Pericable Afford

La nostra API allotjada fa accessible al TTS de codi obert sense gestionar les GPUs.

Free TierCity name (optional, probably does not need a translation)

$0

50 crèdits en signar

  • 4 models de codi obert lliures
  • No hi ha signes per a l' ús bàsic
  • Ús comercial permès

Iniciador

$9

500 crèdits/ mesos

  • Tots els models de codi obert de 24+
  • clonació de veu
  • Accés de l' API

Pro

$29

2000 crèdits/ mesos

  • Processament de la GPU de prioritat
  • Tots els models de gràcia
  • Implementació de l'Enterprise
Visualitza Pricing completa

Preguntes més freqüents

Preguntes comunes quant al text de codi font obert a la parla

Sí. Cada model sobre TTS.ai utilitza una llicència de codi obert permsive, o bé l' Apache o Apache 2. 0, especialment amb llicències restrictives (com el PCML de Coqui o no comercial CC-BY-NC). Podeu verificar cada llicència de model en el seu repositori GitHub.

Ambdues són llicències de codi obert que permeten l' ús comercial, la modificació i la redistribució. Apache 2. 0 afegeix subvencions explícites i requereix que els canvis si modifiqueu el codi. El MIT és més senzill amb menys requisits. Tots dos són amigables.

Sí. Cada model pot ser auto- màquina. Clon el repositori de model des de GitHub, instal· leu dependències, pess del model de descàrrega i executeu inferència. Us proporcionem documentació per a les necessitats d' auto- màquina de cada model, incloent- hi la GPU, la RAM i la versió Python.

Requeriments varien pel model. El conducte no necessita cap GPU (CPU). Kokoro i MelTTS necessiten 1- 2GB VRAM. La majoria de models estàndard necessiten 4GB VRAM. Tortose i Same CSM necessiten 8GB. Un RT NVIDIAX 3060 (12GB) pot executar models més còmodament.

Sí. Les llicències de codi obert permeten modificar- les incloent- hi les modificacions. Models com GPT- STITS i Bark proporcionen scripts de qualitat. Podeu entrenar models a les vostres pròpies dades de veu per crear veus personalitzades o millorar el rendiment de les llengües específiques.

Models de codi superior obert (Kkoro, StyleTTS 2, Chatterbox) que coincideixen ara amb serveis comercials o superen serveis comercials com Onze Labs i Google TTS en punts de referència de qualitat. L' avantatge principal dels serveis comercials està gestionat per infraestructures i suport, no qualitat d' àudio.

Ja les hem exclòs. XTTS/ XTTS- v2 (el CPML no comercials), F5- TTS (CC-BY-NC-NC_ US), i Higgs- v2 (Llicència de l' arc) s' han eliminat tots. Cada model de TTS.ai es verifica la seguretat comercial- use.

Sí. La majoria de models accepten contribucions a la comunitat mitjançant GitHub. Podeu enviar informes d' error, gravacions de veu per a nous idiomes, millores en el codi i documentació. Comproveu cada repositori del model per a les guies d' contribució i qüestions actives.

Carrega models a on- demand i baixa quan està inactiu per a compartir la memòria de la GPU. El nostre servidor de la GPU executa 20+ models en 4x Tesla P40 (96GB total VRAM) usant càrrega dinàmica. Per a la auto- màquina, un únic 24GB GPU pot servir 3 models conactualment.

Molts models proporcionen imatges oficials Dockers o fitxers Dockers. Per executar múltiples models, podeu construir una configuració a mida de Docker amb l' eina de contenidor NVIDIA d' accés a la GPU. La nostra arquitectura del servidor API pot servir com a implementació de referència.

La majoria de models requereixen Python 3. 10- 3. 12. Coqui TTS (VITS) específicament necessita el Python 3. 11. Us recomanem que el Python 3. 32 per a la majoria de models. Comproveu els requeriments de cada model. tx per a compatibilitat exacta de versions.

Les llicències del MIT i Apache 2. 0 permeten l' ús comercial explícitament. Podeu construir productes SaS, aplicacions mòbils, jocs i serveis usant aquests models sense drets de llicència, reials, o requisits d' atribució (tot i que s' apreciiment).
5.0/5 (1)

Prova d' obrir el TTS d' avui

Models de 24+ de codi obert, tots els anuncis de llicència. Useu la nostra API o l' autohost- Bus, l' elecció és vostra.