Texto de código aberto para modelos de fala

Todos os modelos TTS na nossa plataforma são de código aberto com licenças comercialmente amigáveis. MIT, Apache 2.0 — sem bloqueio proprietário, sem restrições de uso, sem taxas de licença de surpresa. Use-os através da nossa API hospedada, ou use-os em sua própria infraestrutura com controle total.

Fonte Aberta Licença MIT Apache 2.0 Auto-Hostável GitHub

Experimente agora

Grátis com Kokoro, Piper, VITS, MeloTTS
Seu áudio gerado aparecerá aqui
Produzida
Baixar
Gosta do TTS.ai? Conte aos seus amigos!

Benefícios do TTS de código aberto

Por que os modelos de código aberto são importantes para seus projetos

Todas as Licenças de Código Aberto

Cada modelo do TTS.ai utiliza uma licença permissiva de código aberto. Sem caixas negras proprietárias, sem bloqueio de vendedor, sem taxas de licenciamento inesperadas.

MIT / Apache 2.0

Os modelos estão licenciados sob MIT ou Apache 2.0, as licenças de código aberto mais permissivas. Use comercialmente, modifique, redistribua — sem restrições.

Auto-Hostável

Baixe qualquer modelo e execute-o em seu próprio hardware. Controle completo sobre seus dados, latência e infraestrutura. Não é necessária dependência de nuvem.

GPU Optimizado

Os modelos são otimizados para GPUs NVIDIA com suporte CUDA. O Piper é executado apenas na CPU. A maioria dos modelos precisa de 2-8GB VRAM para uma inferência eficiente.

Manutenção da Comunidade

As comunidades ativas de código aberto mantenham e melhoram estes modelos. Contribuições bem-vindas — enviar erros, melhorias e novas vozes no GitHub.

Uso comercial OK

Todos os modelos permitem o uso comercial sob suas licenças. Construa produtos, vende serviços e crie conteúdo comercial sem royalties ou taxas de uso.

Nosso catálogo de modelos de código aberto

Cada modelo, sua licença, e o que faz melhor

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Melhor para: Apache 2.0 — melhor modelo livre de qualidade, 82M parâmetros, fácil de hospedar

Tentar Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Melhor para: MIT — apenas CPU, perfeito para dispositivos de borda e auto-hosting incorporado

Tentar Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Melhor para: MIT — arquitetura fundacional utilizada por muitos modelos a jusante

Tentar VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Melhor para: MIT — capacidades únicas de geração de áudio para além da norma TTS

Tentar Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clonagem de Voz

Melhor para: Apache 2.0 — qualidade máxima, implementação de referência amplamente estudada

Tentar Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clonagem de Voz

Melhor para: MIT — clonagem de voz de código aberto com controle de estilo granular

Tentar OpenVoice

Como usar o código aberto TTS

Use a nossa API hospedada ou execute modelos você mesmo

1

Explore modelos de código aberto

Examine nosso catálogo de modelos TTS de 20+ códigos abertos. Cada página de modelo mostra os requisitos de licença, arquitetura, capacidades e auto-hosting.

2

Tente em seu navegador

Teste qualquer modelo diretamente no TTS.ai sem instalar nada. Nossos servidores GPU manipulam o processamento para que você possa avaliar a qualidade antes de se comprometer a auto-hosting.

3

Self-Host ou use nossa API

Clone modelo repos do GitHub e execute localmente, ou use a nossa API hospedada para a produção. Self-hosting dá controle completo; nossa API fornece infraestrutura gerenciada.

4

Construa a sua aplicação

Integrar o TTS no seu produto usando modelos auto-hosted ou nossa API REST. Todos os modelos são comercialmente utilizáveis sem taxas de licenciamento ou royalties.

Comparação da Licença

Todos os modelos em TTS.ai usam licenças de código aberto comercialmente amigáveis

Modelo Licença Utilização comercial Alteração Auto-Host Atribuição
Kokoro Apache 2.0 Requerido
Piper MIT Facultativo
VITS MIT Facultativo
MeloTTS MIT Facultativo
Chatterbox MIT Facultativo
Tortoise TTS Apache 2.0 Requerido
StyleTTS 2 MIT Facultativo
OpenVoice MIT Facultativo
Sesame CSM Apache 2.0 Requerido
Orpheus Llama 3.2 "Built with Llama"

Auto-Hosting vs API hospedada

Execute modelos você mesmo ou deixe-nos lidar com a infraestrutura

Self-Host em seu hardware

Cada modelo do TTS.ai está disponível como um projeto de código aberto em GitHub ou Hugging Face. Baixe os pesos, instale as dependências e execute inferência em seus próprios GPUs. Você tem controle total sobre latência, privacidade e escala.

  • Privacidade completa dos dados — áudio nunca deixa o seu servidor
  • Sem custos por pedido após a configuração inicial
  • Ajuste personalizado em seus próprios dados
  • Requer hardware GPU (NVIDIA recomendada)
  • Você gerencia atualizações, escala e dependências

Use TTS.ai API hospedada

Obtenha acesso instantâneo a todos os modelos de 20+ através de uma única API REST. Lidamos com o fornecimento de GPU, atualizações de modelos, gerenciamento de filas e escala. Uma tecla API dá acesso a cada modelo — não é necessário gerenciar implementações separadas.

  • Não é necessário hardware GPU
  • Todos os 20+ modelos através de uma API
  • Atualizações e melhorias automáticas do modelo
  • 99,9% tempo útil com infra-estrutura redundante
  • Pague apenas pelo que você usa

Início rápido: API ou auto-Host

Use a nossa API hospedada, ou instale o Kokoro localmente em minutos

Opção 1: TTS.ai API hospedada O mais fácil
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opção 2: Auto-Host com pip Controlo completo
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Fonte aberta, Preços acessíveis

Nossa API hospedada torna o TTS de código aberto acessível sem gerenciar GPUs.

Free Tier

$0

15 créditos à inscrição

  • 4 modelos de código aberto livres
  • Sem inscrição para utilização básica
  • Utilização comercial permitida

Início

$9

500.000 caracteres/mês

  • Todos os 20+ modelos de código aberto
  • Clonagem de voz
  • Acesso à API

Pro

$29

2.000.000 de caracteres/mês

  • Processamento prioritário do GPU
  • Todos os modelos premium
  • Apoio às empresas
Ver Preços Completos

Perguntas Frequentes

Perguntas comuns sobre o texto de código aberto para a fala

Sim. Cada modelo do TTS.ai utiliza uma licença permissiva de código aberto — seja MIT ou Apache 2.0. Nós especificamente excluimos modelos com licenças restritivas (como o CPML da Coqui ou CC-BY-NC não comercial). Você pode verificar a licença de cada modelo no seu repositório GitHub.

Ambos são licenças permissivas de código aberto que permitem uso comercial, modificação e redistribuição. Apache 2.0 adiciona subsídios de patente explícitos e requer indicação de alterações se você modificar o código. MIT é mais simples com menos requisitos. Ambos são amigáveis ao negócio.

Sim. Cada modelo pode ser auto-hosted. Clone o repositório do modelo do GitHub, instale dependências, baixe pesos do modelo e execute inferência. Fornecemos documentação para os requisitos de auto-hosting de cada modelo, incluindo a versão GPU, RAM e Python.

Os requisitos variam por modelo. Piper não precisa de GPU (só CPU). Kokoro e MeloTTS precisam de 1-2GB VRAM. A maioria dos modelos padrão precisa de 4GB VRAM. Tortoise e Sesame CSM precisa de 8GB. Um NVIDIA RTX 3060 (12GB) pode executar a maioria de modelos confortavelmente.

Sim. As licenças de código aberto permitem modificação incluindo ajuste fino. Os modelos como GPT-SoVITS e Bark fornecem scripts de ajuste fino. Você pode treinar modelos em seus próprios dados de voz para criar vozes personalizadas ou melhorar o desempenho para idiomas específicos.

Top open-source modelos (Kokoro, StyleTTS 2, Chatterbox) agora combinam ou excedem serviços comerciais como ElevenLabs e Google TTS em benchmarks de qualidade. A principal vantagem dos serviços comerciais é gerenciada infraestrutura e suporte, não qualidade de áudio.

Já os excluímos. XTTS/XTTS-v2 (Coqui's CPML — não-comercial), F5-TTS (CC-BY-NC — não-comercial) e Higgs-v2 (Boson License — restritiva) foram todos removidos. Cada modelo em TTS.ai é verificado seguro de uso comercial.

Sim. A maioria dos modelos aceita contribuições comunitárias via GitHub. Você pode enviar relatórios de erros, gravações de voz para novos idiomas, melhorias de código e documentação. Verifique o repositório GitHub de cada modelo para as diretrizes de contribuição e questões ativas.

Carregar modelos na demanda e descarregar quando inactivo para compartilhar memória GPU. Nosso servidor GPU executa 20+ modelos em 4x Tesla P40 (96GB total VRAM) usando carregamento dinâmico. Para auto-hosting, um único GPU 24GB pode servir 3-5 modelos simultaneamente.

Muitos modelos fornecem imagens oficiais docker ou dockerfiles. Para executar múltiplos modelos, você pode construir uma configuração personalizada docker com NVIDIA Container Toolkit para acesso GPU. Nossa arquitetura do servidor API pode servir como uma implementação de referência.

A maioria dos modelos requer o Python 3.10-3.12. O Coqui TTS (VITS) precisa especificamente do Python 3.11. Recomendamos o Python 3.12 para a maioria dos modelos. Verifique os requisitos.txt de cada modelo para a compatibilidade exata com a versão.

Sim. As licenças MIT e Apache 2.0 permitem explicitamente uso comercial. Você pode construir produtos SaaS, aplicativos móveis, jogos e serviços usando estes modelos sem taxas de licenciamento, royalties ou requisitos de atribuição (apesar de ser apreciado a atribuição).
5.0/5 (1)

O que podemos melhorar? Seu feedback nos ajuda a resolver problemas.

Experimente o Open Source TTS Hoje

Mais de 20 modelos de código aberto, todos licenciados comercialmente. Use nossa API ou auto-host — a escolha é sua.