Obre el text font als models de veu

Cada model TTS de la nostra plataforma és una font oberta amb llicències comercials. MIT, Apache 2. 0 no propietari de blocar, sense restriccions d' ús, ni taxa de llicència sorpresa. Useu- les a través de la nostra API allotjada, o auto- màquina per a ells en la vostra pròpia infraestructura amb tot el control.

Obre l' origen Llicència MIT Apache 2. 0 Auto- Hostible GitHub

Intenta-ho ara

Lliure amb Kokoro, Koner, VITS, MeloTTS
Apareixerà aquí el vostre àudio generat
Generat
Descarrega
Els teus amics!

Open TTS Benewits

Per què els models de codi obert importen els vostres projectes

Totes les llicències de l' Open-Font

Cada model de TTS.ai usa una llicència permissiva de codi obert. No hi ha caixes negres propietari, ni distribuïdores, ni taxa de llicència inesperada.

MIT / Apache 2. 0

Els models són amb llicència de l' MIT o Apache 2. 0, les llicències de codi obert més persistents. Useu comercialment, modifiqueu, redistribuir no restriccions.

Auto- Hostible

Descarrega qualsevol model i executa' l en el vostre propi maquinari. Control complet sobre les vostres dades, retardencs i infraestructures. No es requereix dependència de núvol.

Optimitzat de la GPU

Els models són optimitzats per a les GPUs NVIDIA amb implementació de CUDA. El conducte només s' executa a la CPU. La majoria dels models només necessiten 2- 8GB VRAM per a una inferència eficient.

Comunitat mantéda

Les comunitats de codi obert actives mantenen i milloren aquests models. Les cotribucions donen errors, millores i noves veus a GitHub.

Compressiu- lo bé

Tots els models permeten l'ús comercial sota les seves llicències. Construïu productes, venen serveis, i creen continguts comercials sense reials o honoraris d'ús.

El nostre catàleg de model font obert

Cada model, la seva llicència, i el que fa millor

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Millor per a: Apache 2. 0 millor model lliure de qualitat, 82M params, fàcil d'auto-ordinador

Intenta- ho Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Millor per a: Només CPU de MIT, perfecte per a dispositius de vora i auto-ordinadors incrustats

Intenta- ho Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Millor per a: arquitectura fundació de MIT usada per molts models membres del MIT

Intenta- ho VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Millor per a: Aplicació única de generació d'àudio del MIT, més enllà del TTS estàndard

Intenta- ho Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clon de veu

Millor per a: Apache 2. 0 qualitat màxima, s' ha estudiat àmpliament la implementació de referència

Intenta- ho Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clon de veu

Millor per a: Una clonació de veu de l'Ectx- source amb control d'estil granular

Intenta- ho OpenVoice

Com usar TTS de codi font obert

Useu el nostre API i executeu models vós mateixos

1

Exploreu models d' Open-Fonts

Navegueu pel nostre catàleg de models TTS de 20+ oberts. Cada pàgina de model mostra la llicència, arquitectura, capacitats i requisits d' auto- màquina.

2

Prova en el vostre navegador

Prova directament en TTS.ai sense instal· lar res. Els nostres servidors de la GPU es poden avaluar la qualitat abans de cometre auto- màquina.

3

L' autoHost o l' ús de la nostra API

El model clon reposit des de GitHub i s' executa localment, o utilitza la nostra API allotjada per a la producció. L' auto- màquina dóna tot el control; la nostra API proveeix infraestructures gestionades.

4

Construeix la vostra aplicació

Integrat TTS en el vostre producte usant models autohosteds o la nostra API REST. Tots els models són usables comercialment sense taxa de llicència o reials.

Comparació de la llicència

Tots els models de TTS.ai usen llicències comercials amb facilitat de codi obert

Model Llicència Ús comercial Modificació Auto- HostCity name (optional, probably does not need a translation) Attribució
Kokoro Apache 2.0 Requerit
Piper MIT Opcional
VITS MIT Opcional
MeloTTS MIT Opcional
Chatterbox MIT Opcional
Tortoise TTS Apache 2.0 Requerit
StyleTTS 2 MIT Opcional
OpenVoice MIT Opcional
Sesame CSM Apache 2.0 Requerit
Orpheus Llama 3.2 "Built with Llama"

Self- Hosting contra l' API en contra de la màquina

Executeu models vosaltres mateixos o deixeu-nos gestionar la infraestructura

Host al vostre maquinari

Cada model de TTS.ai està disponible com a un projecte de codi obert a GitHub o Abraçador Face. Baixeu els pesos, instal· leu les dependències i executeu la inferència a les vostres estimada GPU. Teniu un control complet sobre la tardència, la privacitat i l' escalat.

  • La privacitat completa de les dades ascii mai deixa el vostre servidor
  • No hi ha costos per contrasenya després de l' arranjament inicial
  • A mida, bé, en les vostres pròpies dades
  • Requereix maquinari de la GPU (NVIDIA recomanat)
  • Gestioneu actualitzacions, escalat i dependències

Usa l' API TTS.ai Host

Obtenir accés instantani a tots els 20+ models a través d' una única API REST. Mantenim actualitzacions de la GPU, model, gestió de cues i escalat. Una clau API us dóna accés a cada model ntxal no cal gestionar desplegaments separats.

  • No cal maquinari de la GPU
  • Tots els 20+ models a través d' una API
  • Actualitzacions automàtiques del model i millores
  • 99. 99. 99% d' hora amb infraestructura redundant
  • Paga només pel que utilitzeu

Inici ràpid: API o auto-Host

Usa la nostra API allotjada, o instal·lació de Kokoro localment en minuts

Opció 1: TTS.ai Strated API EtestCity name (optional, probably does not need a translation)
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opció 2: auto-Host amb pip Control complet
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Font obert, Pericable Afford

La nostra API allotjada fa accessible al TTS de codi obert sense gestionar les GPUs.

Free TierCity name (optional, probably does not need a translation)

$0

50 crèdits en signar

  • 4 models de codi obert lliures
  • No hi ha signes per a l' ús bàsic
  • Ús comercial permès

Iniciador

$9

500 crèdits/ mesos

  • Tots els models de codi obert 20+
  • clonació de veu
  • Accés de l' API

Pro

$29

2000 crèdits/ mesos

  • Processament de la GPU de prioritat
  • Tots els models de gràcia
  • Implementació de l'Enterprise
Visualitza Pricing completa

Preguntes més freqüents

Preguntes comunes quant al text de codi font obert a la parla

Sí. Cada model sobre TTS.ai utilitza una llicència de codi obert permsive, o bé l' Apache o Apache 2. 0, especialment amb llicències restrictives (com el PCML de Coqui o no comercial CC-BY-NC). Podeu verificar cada llicència de model en el seu repositori GitHub.

Ambdues són llicències de codi obert que permeten l' ús comercial, la modificació i la redistribució. Apache 2. 0 afegeix subvencions explícites i requereix que els canvis si modifiqueu el codi. El MIT és més senzill amb menys requisits. Tots dos són amigables.

Sí. Cada model pot ser auto- màquina. Clon el repositori de model des de GitHub, instal· leu dependències, pess del model de descàrrega i executeu inferència. Us proporcionem documentació per a les necessitats d' auto- màquina de cada model, incloent- hi la GPU, la RAM i la versió Python.

Requeriments varien pel model. El conducte no necessita cap GPU (CPU). Kokoro i MelTTS necessiten 1- 2GB VRAM. La majoria de models estàndard necessiten 4GB VRAM. Tortose i Same CSM necessiten 8GB. Un RT NVIDIAX 3060 (12GB) pot executar models més còmodament.

Sí. Les llicències de codi obert permeten modificar- les incloent- hi les modificacions. Models com GPT- STITS i Bark proporcionen scripts de qualitat. Podeu entrenar models a les vostres pròpies dades de veu per crear veus personalitzades o millorar el rendiment de les llengües específiques.

Models de codi superior obert (Kkoro, StyleTTS 2, Chatterbox) que coincideixen ara amb serveis comercials o superen serveis comercials com Onze Labs i Google TTS en punts de referència de qualitat. L' avantatge principal dels serveis comercials està gestionat per infraestructures i suport, no qualitat d' àudio.

Ja les hem exclòs. XTTS/ XTTS- v2 (el CPML no comercials), F5- TTS (CC-BY-NC-NC_ US), i Higgs- v2 (Llicència de l' arc) s' han eliminat tots. Cada model de TTS.ai es verifica la seguretat comercial- use.

Sí. La majoria de models accepten contribucions a la comunitat mitjançant GitHub. Podeu enviar informes d' error, gravacions de veu per a nous idiomes, millores en el codi i documentació. Comproveu cada repositori del model per a les guies d' contribució i qüestions actives.

Carrega models a on- demand i baixa quan està inactiu per a compartir la memòria de la GPU. El nostre servidor de la GPU executa 20+ models en 4x Tesla P40 (96GB total VRAM) usant càrrega dinàmica. Per a la auto- màquina, un únic 24GB GPU pot servir 3 models conactualment.

Molts models proporcionen imatges oficials Dockers o fitxers Dockers. Per executar múltiples models, podeu construir una configuració a mida de Docker amb l' eina de contenidor NVIDIA d' accés a la GPU. La nostra arquitectura del servidor API pot servir com a implementació de referència.

La majoria de models requereixen Python 3. 10- 3. 12. Coqui TTS (VITS) específicament necessita el Python 3. 11. Us recomanem que el Python 3. 32 per a la majoria de models. Comproveu els requeriments de cada model. tx per a compatibilitat exacta de versions.

Les llicències del MIT i Apache 2. 0 permeten l' ús comercial explícitament. Podeu construir productes SaS, aplicacions mòbils, jocs i serveis usant aquests models sense drets de llicència, reials, o requisits d' atribució (tot i que s' apreciiment).
5.0/5 (1)

What could we improve? Your feedback helps us fix issues.

Prova d' obrir el TTS d' avui

20+ models de codi obert, tots els models de llicència comercial. Useu la nostra API o l' autohost- Bus, l' elecció és vostra.