Sobre

A plataforma AI de voz mais abrangente de código aberto. 20+ modelos, 100+ vozes, tudo em um só lugar.

Criado por

TTS.ai foi criado por John Nader (nadermx), um desenvolvedor independente construindo ferramentas de AI open-source. TTS.ai faz parte de uma missão para tornar a melhor tecnologia de voz de AI acessível a todos — sem bloqueio de vendedor, sem coleta de dados, apenas tecnologia de voz poderosa a preços justos.

Nossa Missão

TTS.ai foi construído sobre uma simples crença: a melhor tecnologia de voz da IA deve ser acessível a todos. Enquanto os serviços proprietários cobram preços premium para texto de base para voz, a comunidade de código aberto criou modelos que correspondem ou excedem a qualidade comercial.

Conjuntamos os melhores modelos de IA de voz aberta em uma única plataforma fácil de usar. Sem bloqueio de vendedor. Sem recolha de dados. Apenas tecnologia de voz poderosa a preços justos.

O que oferecemos

Texto ao Discurso

Mais de 20 modelos, incluindo Kokoro, Chatterbox, Bark e muito mais. Da síntese rápida leve à saída de qualidade de estúdio.

Discurso ao texto

Alimentado por Whisper, Fast-Whisper e SenseVoice. Transcriba áudio em mais de 100 idiomas com selos de tempo e detecção de alto-falantes.

Clonagem de Voz

Clone qualquer voz de uma amostra de 5 segundos. Chatterbox, GPT-SoVITS, CosyVoice 2, e muito mais. Crie vozes personalizadas para seus projetos.

Processamento de Áudio

Melhore áudio, remover vozes, ramos divididos, remover eco/reverb, detectar chave/PMB e converter formatos. Tudo alimentado por IA.

Chat de Voz

Conversas de voz em tempo real com IA. Escolha seu modelo e voz para uma experiência de chat interativa.

API do desenvolvedor

API REST compatível com o OpenAI. Python SDK, exemplos de código e documentação abrangente. Construa recursos de voz em seus aplicativos.

Primeiro código aberto

Cada modelo em TTS.ai é de código aberto, licenciado sob MIT ou Apache 2.0. Acreditamos na transparência e na inovação baseada na comunidade.

Nós fazemos

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
E mais...

Todos os pesos do modelo são baixados de seus repositórios oficiais. Não adicionamos modificações proprietárias.

Infraestrutura

TTS.ai é executado em servidores GPU dedicados com NVIDIA Tesla P40 GPUs (total VRAM 96GB). Nossa infraestrutura é projetada para baixa latência e alto débito:

  • Clusters GPU dedicados para inferência - sem recursos compartilhados
  • Alocação dinâmica da GPU com base nos requisitos do modelo VRAM
  • Sistema prioritário de 5-colas para um débito óptimo
  • Modelos pré-cargados em VRAM para inferência instantânea
  • Entrega de áudio apoiado com CDN para downloads rápidos

Privacidade e Segurança

  • Sem formação de dados: Nunca usamos seu áudio ou texto para treinar modelos
  • Deseleção automática: O áudio gerado é automaticamente apagado após 24 horas
  • Cifragem: Todos os dados são encriptados em trânsito (TLS 1.2+) e em repouso
  • Sem rastreamento: Nós fazemos
  • Conformidade com o RGPD: Solicite seus dados ou exclusão a qualquer momento

Sobre TTS.ai FAQ

TTS.ai foi criado por John Nader (nadermx), um desenvolvedor independente apaixonado por tornar a tecnologia de voz da IA acessível a todos. Nós curamos e servimos os melhores modelos de código aberto da comunidade em vez de treinar os proprietários.

Nossa infraestrutura funciona em servidores dedicados com NVIDIA Tesla P40 GPUs fornecendo 96GB de VRAM. Os servidores de interface web e de inferência GPU são hospedados em centros de dados seguros com conectividade de baixa latência.

Nós minimizamos o armazenamento de dados. Inputs de texto são processados em tempo real e não armazenados permanentemente. Todos os arquivos de áudio carregados e gerados são automaticamente excluídos dentro de 24 horas. Nós nunca usamos seus dados para treinar modelos de IA.

TTS.ai serve uma comunidade crescente de desenvolvedores, criadores de conteúdos e empresas em todo o mundo. Nossa plataforma manuseia milhares de pedidos de geração de voz diariamente em modelos de 20+ IA.

Nós nos esforçamos por alta disponibilidade com nossa infraestrutura GPU dedicada e sistema prioritário de 5 filas. Embora não oferecemos um SLA formal para usuários de nível livre, planos pagos beneficiam de processamento prioritário e maior confiabilidade.

Sim. Cada modelo em TTS.ai é de código aberto, licenciado sob MIT ou Apache 2.0. Apoiamos ativamente a comunidade de voz de código aberto IA e contribuimos com otimizações e integrações de volta ao ecossistema.

Nosso roadmap inclui adicionar novos modelos de última geração como eles são lançados, ampliar o suporte linguístico, melhorar as capacidades de chat de voz em tempo real e construir mais ferramentas de processamento de áudio. Integramos continuamente os mais recentes avanços da IA de código aberto.

TTS.ai é construído e mantido por um desenvolvedor solo, por isso não há posições abertas. No entanto, as contribuições de código aberto são sempre bem-vindas — chegar através da página de contato ou GitHub.

Sim, recebemos parcerias com desenvolvedores, empresas e organizações que procuram integrar a IA de voz em seus produtos. Contacte-nos para discutir a integração da API, preços de volume ou implantação de modelos personalizados.

Realizamos revisões regulares de segurança de nossa infraestrutura. Todos os dados são criptografados em trânsito com TLS 1,2+, senhas são hashed com algoritmos padrão da indústria e as chaves API usam hashing de uma direção. O acesso ao servidor é restrito ao pessoal autorizado através de chaves SSH.

A TTS.ai é compatível com o GDPR e segue os princípios de minimização dos dados. Não armazenamos dados de áudio pessoais além de 24 horas, não usamos dados do cliente para treinamento, e fornecemos acesso completo aos dados, correção e direitos de exclusão a pedido.

Nós monitoramos continuamente a paisagem de voz de código aberto IA e adicionamos novos modelos à medida que eles se tornam disponíveis e provam sua qualidade. As principais atualizações de modelo geralmente acontecem mensalmente, com otimizações menores implantadas em uma base contínua.

Perguntas? Retroacção?

Contacte-nos Docs da API