Texto de código aberto para modelos de fala
Todos os modelos TTS na nossa plataforma são de código aberto com licenças comercialmente amigáveis. MIT, Apache 2.0 — sem bloqueio proprietário, sem restrições de uso, sem taxas de licença de surpresa. Use-os através da nossa API hospedada, ou use-os em sua própria infraestrutura com controle total.
Experimente agora
Benefícios do TTS de código aberto
Por que os modelos de código aberto são importantes para seus projetos
Todas as Licenças de Código Aberto
Cada modelo do TTS.ai utiliza uma licença permissiva de código aberto. Sem caixas negras proprietárias, sem bloqueio de vendedor, sem taxas de licenciamento inesperadas.
MIT / Apache 2.0
Os modelos estão licenciados sob MIT ou Apache 2.0, as licenças de código aberto mais permissivas. Use comercialmente, modifique, redistribua — sem restrições.
Auto-Hostável
Baixe qualquer modelo e execute-o em seu próprio hardware. Controle completo sobre seus dados, latência e infraestrutura. Não é necessária dependência de nuvem.
GPU Optimizado
Os modelos são otimizados para GPUs NVIDIA com suporte CUDA. O Piper é executado apenas na CPU. A maioria dos modelos precisa de 2-8GB VRAM para uma inferência eficiente.
Manutenção da Comunidade
As comunidades ativas de código aberto mantenham e melhoram estes modelos. Contribuições bem-vindas — enviar erros, melhorias e novas vozes no GitHub.
Uso comercial OK
Todos os modelos permitem o uso comercial sob suas licenças. Construa produtos, vende serviços e crie conteúdo comercial sem royalties ou taxas de uso.
Nosso catálogo de modelos de código aberto
Cada modelo, sua licença, e o que faz melhor
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Melhor para: Apache 2.0 — melhor modelo livre de qualidade, 82M parâmetros, fácil de hospedar
Tentar Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Melhor para: MIT — apenas CPU, perfeito para dispositivos de borda e auto-hosting incorporado
Tentar Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Melhor para: MIT — arquitetura fundacional utilizada por muitos modelos a jusante
Tentar VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Melhor para: MIT — capacidades únicas de geração de áudio para além da norma TTS
Tentar Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Melhor para: Apache 2.0 — qualidade máxima, implementação de referência amplamente estudada
Tentar Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Melhor para: MIT — clonagem de voz de código aberto com controle de estilo granular
Tentar OpenVoiceComo usar o código aberto TTS
Use a nossa API hospedada ou execute modelos você mesmo
Explore modelos de código aberto
Examine nosso catálogo de modelos TTS de 20+ códigos abertos. Cada página de modelo mostra os requisitos de licença, arquitetura, capacidades e auto-hosting.
Tente em seu navegador
Teste qualquer modelo diretamente no TTS.ai sem instalar nada. Nossos servidores GPU manipulam o processamento para que você possa avaliar a qualidade antes de se comprometer a auto-hosting.
Self-Host ou use nossa API
Clone modelo repos do GitHub e execute localmente, ou use a nossa API hospedada para a produção. Self-hosting dá controle completo; nossa API fornece infraestrutura gerenciada.
Construa a sua aplicação
Integrar o TTS no seu produto usando modelos auto-hosted ou nossa API REST. Todos os modelos são comercialmente utilizáveis sem taxas de licenciamento ou royalties.
Comparação da Licença
Todos os modelos em TTS.ai usam licenças de código aberto comercialmente amigáveis
| Modelo | Licença | Utilização comercial | Alteração | Auto-Host | Atribuição |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Requerido | |||
| Piper | MIT | Facultativo | |||
| VITS | MIT | Facultativo | |||
| MeloTTS | MIT | Facultativo | |||
| Chatterbox | MIT | Facultativo | |||
| Tortoise TTS | Apache 2.0 | Requerido | |||
| StyleTTS 2 | MIT | Facultativo | |||
| OpenVoice | MIT | Facultativo | |||
| Sesame CSM | Apache 2.0 | Requerido | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Auto-Hosting vs API hospedada
Execute modelos você mesmo ou deixe-nos lidar com a infraestrutura
Self-Host em seu hardware
Cada modelo do TTS.ai está disponível como um projeto de código aberto em GitHub ou Hugging Face. Baixe os pesos, instale as dependências e execute inferência em seus próprios GPUs. Você tem controle total sobre latência, privacidade e escala.
- Privacidade completa dos dados — áudio nunca deixa o seu servidor
- Sem custos por pedido após a configuração inicial
- Ajuste personalizado em seus próprios dados
- Requer hardware GPU (NVIDIA recomendada)
- Você gerencia atualizações, escala e dependências
Use TTS.ai API hospedada
Obtenha acesso instantâneo a todos os modelos de 20+ através de uma única API REST. Lidamos com o fornecimento de GPU, atualizações de modelos, gerenciamento de filas e escala. Uma tecla API dá acesso a cada modelo — não é necessário gerenciar implementações separadas.
- Não é necessário hardware GPU
- Todos os 20+ modelos através de uma API
- Atualizações e melhorias automáticas do modelo
- 99,9% tempo útil com infra-estrutura redundante
- Pague apenas pelo que você usa
Início rápido: API ou auto-Host
Use a nossa API hospedada, ou instale o Kokoro localmente em minutos
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Fonte aberta, Preços acessíveis
Nossa API hospedada torna o TTS de código aberto acessível sem gerenciar GPUs.
Free Tier
$0
15 créditos à inscrição
- 4 modelos de código aberto livres
- Sem inscrição para utilização básica
- Utilização comercial permitida
Início
$9
500.000 caracteres/mês
- Todos os 20+ modelos de código aberto
- Clonagem de voz
- Acesso à API
Pro
$29
2.000.000 de caracteres/mês
- Processamento prioritário do GPU
- Todos os modelos premium
- Apoio às empresas
Perguntas Frequentes
Perguntas comuns sobre o texto de código aberto para a fala
O que podemos melhorar? Seu feedback nos ajuda a resolver problemas.
Experimente o Open Source TTS Hoje
Mais de 20 modelos de código aberto, todos licenciados comercialmente. Use nossa API ou auto-host — a escolha é sua.