Informar de Bug / Pedido de Feature

Texto de código aberto para modelos de fala

Todos os modelos TTS na nossa plataforma são de código aberto com licenças comercialmente amigáveis. MIT, Apache 2.0 — sem bloqueio proprietário, sem restrições de uso, sem taxas de licença de surpresa. Use-os através da nossa API hospedada, ou use-os em sua própria infraestrutura com controle total.

Fonte Aberta Licença MIT Apache 2.0 Auto-Hostável GitHub

Editor de TTS completo Docs da API

Experimente agora

0/500

Grátis com Kokoro, Piper, VITS, MeloTTS

Seu áudio gerado aparecerá aqui

Abrir o editor TTS completo

Benefícios do TTS de código aberto

Por que os modelos de código aberto são importantes para seus projetos

Todas as Licenças de Código Aberto

Cada modelo do TTS.ai utiliza uma licença permissiva de código aberto. Sem caixas negras proprietárias, sem bloqueio de vendedor, sem taxas de licenciamento inesperadas.

MIT / Apache 2.0

Os modelos estão licenciados sob MIT ou Apache 2.0, as licenças de código aberto mais permissivas. Use comercialmente, modifique, redistribua — sem restrições.

Auto-Hostável

Baixe qualquer modelo e execute-o em seu próprio hardware. Controle completo sobre seus dados, latência e infraestrutura. Não é necessária dependência de nuvem.

GPU Optimizado

Os modelos são otimizados para GPUs NVIDIA com suporte CUDA. O Piper é executado apenas na CPU. A maioria dos modelos precisa de 2-8GB VRAM para uma inferência eficiente.

Manutenção da Comunidade

As comunidades ativas de código aberto mantenham e melhoram estes modelos. Contribuições bem-vindas — enviar erros, melhorias e novas vozes no GitHub.

Uso comercial OK

Todos os modelos permitem o uso comercial sob suas licenças. Construa produtos, vende serviços e crie conteúdo comercial sem royalties ou taxas de uso.

Nosso catálogo de modelos de código aberto

Cada modelo, sua licença, e o que faz melhor

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Melhor para: Apache 2.0 — melhor modelo livre de qualidade, 82M parâmetros, fácil de hospedar

Tentar Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Melhor para: MIT — apenas CPU, perfeito para dispositivos de borda e auto-hosting incorporado

Tentar Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Melhor para: MIT — arquitetura fundacional utilizada por muitos modelos a jusante

Tentar VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Melhor para: MIT — capacidades únicas de geração de áudio para além da norma TTS

Tentar Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clonagem de Voz

Melhor para: Apache 2.0 — qualidade máxima, implementação de referência amplamente estudada

Tentar Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clonagem de Voz

Melhor para: MIT — clonagem de voz de código aberto com controle de estilo granular

Tentar OpenVoice

Como usar o código aberto TTS

Use a nossa API hospedada ou execute modelos você mesmo

Explore modelos de código aberto

Examine nosso catálogo de modelos TTS de 20+ códigos abertos. Cada página de modelo mostra os requisitos de licença, arquitetura, capacidades e auto-hosting.

Tente em seu navegador

Teste qualquer modelo diretamente no TTS.ai sem instalar nada. Nossos servidores GPU manipulam o processamento para que você possa avaliar a qualidade antes de se comprometer a auto-hosting.

Self-Host ou use nossa API

Clone modelo repos do GitHub e execute localmente, ou use a nossa API hospedada para a produção. Self-hosting dá controle completo; nossa API fornece infraestrutura gerenciada.

Construa a sua aplicação

Integrar o TTS no seu produto usando modelos auto-hosted ou nossa API REST. Todos os modelos são comercialmente utilizáveis sem taxas de licenciamento ou royalties.

Comparação da Licença

Todos os modelos em TTS.ai usam licenças de código aberto comercialmente amigáveis

Modelo	Licença	Atribuição
Kokoro	Apache 2.0	Requerido
Piper	MIT	Facultativo
VITS	MIT	Facultativo
MeloTTS	MIT	Facultativo
Chatterbox	MIT	Facultativo
Tortoise TTS	Apache 2.0	Requerido
StyleTTS 2	MIT	Facultativo
OpenVoice	MIT	Facultativo
Sesame CSM	Apache 2.0	Requerido
Orpheus	Llama 3.2	"Built with Llama"

Experimente estes modelos livres

Auto-Hosting vs API hospedada

Execute modelos você mesmo ou deixe-nos lidar com a infraestrutura

Self-Host em seu hardware

Cada modelo do TTS.ai está disponível como um projeto de código aberto em GitHub ou Hugging Face. Baixe os pesos, instale as dependências e execute inferência em seus próprios GPUs. Você tem controle total sobre latência, privacidade e escala.

Privacidade completa dos dados — áudio nunca deixa o seu servidor
Sem custos por pedido após a configuração inicial
Ajuste personalizado em seus próprios dados
Requer hardware GPU (NVIDIA recomendada)
Você gerencia atualizações, escala e dependências

Use TTS.ai API hospedada

Obtenha acesso instantâneo a todos os modelos de 20+ através de uma única API REST. Lidamos com o fornecimento de GPU, atualizações de modelos, gerenciamento de filas e escala. Uma tecla API dá acesso a cada modelo — não é necessário gerenciar implementações separadas.

Não é necessário hardware GPU
Todos os 20+ modelos através de uma API
Atualizações e melhorias automáticas do modelo
99,9% tempo útil com infra-estrutura redundante
Pague apenas pelo que você usa

Use API Hosted em vez disso

Início rápido: API ou auto-Host

Use a nossa API hospedada, ou instale o Kokoro localmente em minutos

Opção 1: TTS.ai API hospedada O mais fácil

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opção 2: Auto-Host com pip Controlo completo

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Ver a documentação da API

Fonte aberta, Preços acessíveis

Nossa API hospedada torna o TTS de código aberto acessível sem gerenciar GPUs.

Free Tier

15 créditos à inscrição

4 modelos de código aberto livres
Sem inscrição para utilização básica
Utilização comercial permitida

Início

500.000 caracteres/mês

Todos os 20+ modelos de código aberto
Clonagem de voz
Acesso à API

Pro

$29

2.000.000 de caracteres/mês

Processamento prioritário do GPU
Todos os modelos premium
Apoio às empresas

Ver Preços Completos

Perguntas Frequentes

Perguntas comuns sobre o texto de código aberto para a fala

Sim. Cada modelo do TTS.ai utiliza uma licença permissiva de código aberto — seja MIT ou Apache 2.0. Nós especificamente excluimos modelos com licenças restritivas (como o CPML da Coqui ou CC-BY-NC não comercial). Você pode verificar a licença de cada modelo no seu repositório GitHub.

Ambos são licenças permissivas de código aberto que permitem uso comercial, modificação e redistribuição. Apache 2.0 adiciona subsídios de patente explícitos e requer indicação de alterações se você modificar o código. MIT é mais simples com menos requisitos. Ambos são amigáveis ao negócio.

Sim. Cada modelo pode ser auto-hosted. Clone o repositório do modelo do GitHub, instale dependências, baixe pesos do modelo e execute inferência. Fornecemos documentação para os requisitos de auto-hosting de cada modelo, incluindo a versão GPU, RAM e Python.

Os requisitos variam por modelo. Piper não precisa de GPU (só CPU). Kokoro e MeloTTS precisam de 1-2GB VRAM. A maioria dos modelos padrão precisa de 4GB VRAM. Tortoise e Sesame CSM precisa de 8GB. Um NVIDIA RTX 3060 (12GB) pode executar a maioria de modelos confortavelmente.

Sim. As licenças de código aberto permitem modificação incluindo ajuste fino. Os modelos como GPT-SoVITS e Bark fornecem scripts de ajuste fino. Você pode treinar modelos em seus próprios dados de voz para criar vozes personalizadas ou melhorar o desempenho para idiomas específicos.

Top open-source modelos (Kokoro, StyleTTS 2, Chatterbox) agora combinam ou excedem serviços comerciais como ElevenLabs e Google TTS em benchmarks de qualidade. A principal vantagem dos serviços comerciais é gerenciada infraestrutura e suporte, não qualidade de áudio.

Já os excluímos. XTTS/XTTS-v2 (Coqui's CPML — não-comercial), F5-TTS (CC-BY-NC — não-comercial) e Higgs-v2 (Boson License — restritiva) foram todos removidos. Cada modelo em TTS.ai é verificado seguro de uso comercial.

Sim. A maioria dos modelos aceita contribuições comunitárias via GitHub. Você pode enviar relatórios de erros, gravações de voz para novos idiomas, melhorias de código e documentação. Verifique o repositório GitHub de cada modelo para as diretrizes de contribuição e questões ativas.

Carregar modelos na demanda e descarregar quando inactivo para compartilhar memória GPU. Nosso servidor GPU executa 20+ modelos em 4x Tesla P40 (96GB total VRAM) usando carregamento dinâmico. Para auto-hosting, um único GPU 24GB pode servir 3-5 modelos simultaneamente.

Muitos modelos fornecem imagens oficiais docker ou dockerfiles. Para executar múltiplos modelos, você pode construir uma configuração personalizada docker com NVIDIA Container Toolkit para acesso GPU. Nossa arquitetura do servidor API pode servir como uma implementação de referência.

A maioria dos modelos requer o Python 3.10-3.12. O Coqui TTS (VITS) precisa especificamente do Python 3.11. Recomendamos o Python 3.12 para a maioria dos modelos. Verifique os requisitos.txt de cada modelo para a compatibilidade exata com a versão.

Sim. As licenças MIT e Apache 2.0 permitem explicitamente uso comercial. Você pode construir produtos SaaS, aplicativos móveis, jogos e serviços usando estes modelos sem taxas de licenciamento, royalties ou requisitos de atribuição (apesar de ser apreciado a atribuição).

5.0/5 (1)

Experimente o Open Source TTS Hoje

Mais de 20 modelos de código aberto, todos licenciados comercialmente. Use nossa API ou auto-host — a escolha é sua.

Inscreva-se gratuitamente Ver Preços

Texto de código aberto para modelos de fala

Experimente agora

Gosta do TTS.ai? Conte aos seus amigos!

Benefícios do TTS de código aberto

Todas as Licenças de Código Aberto

MIT / Apache 2.0

Auto-Hostável

GPU Optimizado

Manutenção da Comunidade

Uso comercial OK

Nosso catálogo de modelos de código aberto

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Como usar o código aberto TTS

Explore modelos de código aberto

Tente em seu navegador

Self-Host ou use nossa API

Construa a sua aplicação

Comparação da Licença

Auto-Hosting vs API hospedada

Self-Host em seu hardware

Use TTS.ai API hospedada

Início rápido: API ou auto-Host

Fonte aberta, Preços acessíveis

Free Tier

Início

Pro

Perguntas Frequentes

Todos os TTS.ai modelos são realmente open source?

Qual é a diferença entre licenças MIT e Apache 2.0?

Posso auto-hostear estes modelos no meu próprio servidor?

Qual GPU preciso de modelos de TTS auto-host?

Posso afinar os modelos de TTS de código aberto?

Como se comparam os modelos de código aberto TTS com os serviços comerciais?

Existem modelos com licenças restritivas que devia evitar?

Posso contribuir para estes modelos de código aberto?

Como posso executar múltiplos modelos em um servidor GPU?

Há uma imagem Docker para o auto-hosting?

Que versão Python preciso para o auto-hosting?

Posso construir um produto comercial usando estes modelos?

Experimente o Open Source TTS Hoje