IA livre Texto ao Discurso

22+ modelos de código aberto, 100+ vozes, 32+ Línguas. Não é necessária conta.

0/500 caracteres Grátis
Não há cartão de crédito 50 créditos gratuitos 32+ Línguas Utilização comercial OK
0:00 / 0:00
Baixe áudio A ligação expira em 24h
Como o TTS.ai? Diz aos teus amigos!

Tudo o que você precisa para a IA de voz

26 ferramentas alimentadas por 24+ modelos de IA de código aberto

22+ modelos de voz da IA

A coleção mais abrangente de modelos TTS de código aberto em uma plataforma

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Melhor para: High-quality TTS with minimal latency, streaming applications

Tente Gratuito

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Melhor para: Quick previews, accessibility, and embedded applications

Tente Gratuito

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Melhor para: General-purpose text-to-speech with natural prosody

Tente Gratuito

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Melhor para: Aplicações de produção que precisam de TTS rápido e multilingue

Tente Gratuito

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Desenvolvedor: Suno · Licença: MIT

Experimenta-o.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Desenvolvedor: Suno · Licença: MIT

Experimenta-o.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Desenvolvedor: Alibaba (Tongyi Lab) · Licença: Apache 2.0

Experimenta-o.

Dia TTSDia TTS Standard

Modelo de geração de diálogo multi-falantes que cria conversas naturais entre alto-falantes.

Desenvolvedor: Nari Labs · Licença: Apache 2.0

Experimenta-o.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Desenvolvedor: Hugging Face · Licença: Apache 2.0

Experimenta-o.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Desenvolvedor: Index Team · Licença: Apache 2.0

Experimenta-o.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Desenvolvedor: SparkAudio · Licença: Apache 2.0

Experimenta-o.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Desenvolvedor: RVC-Boss · Licença: MIT

Experimenta-o.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Desenvolvedor: Canopy Labs · Licença: Llama 3.2 Community

Experimenta-o.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Desenvolvedor: Alibaba (Qwen) · Licença: Apache 2.0

Experimenta-o.

ChatterboxChatterbox Premium

Clonagem de voz de última geração com controle emotivo da IA Resemble.

Qualidade:

Experimenta-o.

Tortoise TTSTortoise TTS Premium

Texto para voz multi-voz focado na qualidade com arquitetura autorregressiva.

Qualidade:

Experimenta-o.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Qualidade:

Experimenta-o.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Qualidade:

Experimenta-o.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Línguas: en, zh, ja, ko, fr, de, it, es

Clonar a Voz

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Línguas: en, zh

Clonar a Voz

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Línguas: en, zh

Clonar a Voz

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Línguas: en, zh, ja, ko

Clonar a Voz

ChatterboxChatterbox

Clonagem de voz de última geração com controle emotivo da IA Resemble.

Línguas: en

Clonar a Voz

Tortoise TTSTortoise TTS

Texto para voz multi-voz focado na qualidade com arquitetura autorregressiva.

Línguas: en

Clonar a Voz

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Línguas: en, zh, ja, ko, fr, de, es, it

Clonar a Voz

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Línguas: en, zh, ja, ko, de, fr, ru, pt, es, it

Clonar a Voz

Desenvolvedor-Primeira API

API REST compatível com o OpenAI. Um endpoint, 22+ modelos. Suporte de transmissão para aplicações em tempo real.

  • Formato compatível com OpenAI
  • Streaming TTS para aplicativos em tempo real
  • Processamento por lotes para grandes empregos
  • Notificações de Webhook
Ver Docs da API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Preços simples, transparentes

Comece livre. Escala à medida que você cresce.

Grátis

$0

50 créditos

  • Kokoro, Piper, VITS, MeloTTS
  • Limite de 500 caracteres
  • 3 gen/hora (sem conta)
Inscreva-se gratuitamente

Início

$9/mo

500 créditos/mês

  • Todos os modelos mais de 22
  • Limite de 5.000 caracteres
  • Clonagem de Voz
Comece
Mais Popular

Pro

$29/mo

2 000 créditos/mês

  • Tudo no Starter
  • Acesso à API
  • Tratamento prioritário
Obtenha Pro

Empresa

$99/mo

10 000 créditos/mês

  • Tudo em Pro
  • API Bulk
  • Fila de prioridade
Vendas de contato

View all plans including credit packs →

Perguntas Frequentes

TTS.ai é a plataforma de voz mais abrangente da IA, oferecendo 22+ modelos de texto a voz, clonagem de voz, voz a texto e ferramentas de áudio. Todos os modelos são de código aberto, sem bloqueio de vendedor.

Sim! TTS.ai oferece modelos de texto para voz grátis com Kokoro, Piper, VITS e MeloTTS. Sem necessidade de conta. Inscreva-se para obter 50 créditos gratuitos e acessar todos os modelos.

Para a velocidade, use Kokoro ou Piper. Para a qualidade, tente CosyVoice 2 ou StyleTTS 2. Para a clonagem de voz, use Chatterbox ou GPT-SoVITS. Para a janela, use Dia TTS. Tente vários modelos no mesmo texto para comparar.

Sim. API REST compatível com o OpenAI para TTS, STT, clonagem de voz e ferramentas de áudio. Disponível em Pro ($29/mo) e Enterprise ($99/mo) planos. Ver documentação em tts.ai/api/.

A qualidade da voz varia segundo o modelo. Modelos premium como CosyVoice 2, StyleTTS 2, e Chatterbox produzem fala de qualidade próxima humana com intonação natural e emoção. Os modelos gratuitos como Kokoro oferecem excelente qualidade para a maioria dos casos de uso.

TTS.ai suporta 30 mais idiomas em sua biblioteca modelo. Inglês tem o suporte mais amplo do modelo, mas modelos como CosyVoice 2 cobre chinês, japonês e coreano; GPT-SoVITS manuseia chinês, japonês, coreano e inglês; e MeloTTS suporta inglês, espanhol, francês, chinês, japonês e coreano.

Sim. Todos os processamentos acontecem em nossos servidores GPU dedicados. Não armazenamos sua entrada de texto ou áudio gerado após a entrega. As amostras de voz enviadas para clonagem são usadas apenas para a sessão atual e não são mantidas. Nunca compartilhamos seus dados com terceiros ou usá-los para treinar modelos.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai gera áudio em formato WAV por padrão para a máxima qualidade. Você pode converter para MP3, FLAC, OGG ou M4A usando a nossa ferramenta Free Audio Converter. A API suporta especificar o seu formato de saída preferido diretamente no pedido.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Os modelos gratuitos (Kokoro, Piper, VITS, MeloTTS) não exigem nenhuma conta e custam zero créditos. Os modelos padrão (2 créditos/1K caracteres) incluem Bark, CosyVoice 2, F5-TTS e Dia. Os modelos premium (4 créditos/1K caracteres) incluem OpenVoice, Chatterbox, StyleTTS 2, e Tortoise. Os modelos pagos geralmente oferecem maior qualidade, mais vozes e recursos adicionais como clonagem de voz.

Sim. A API suporta o processamento por lotes para converter grandes volumes de texto em voz. Enviar vários pedidos e recuperar resultados de forma sincrona usando o trabalho UUIDs. Planos de empresas ($99/mo) incluem acesso prioritário à fila para processamento por lotes mais rápido. Ideal para produção de audiobook, conteúdo de curso e projetos de vozover em larga escala.
5.0/5 (1)

Comece a usar a voz da IA hoje

Junte-se a criadores, desenvolvedores e empresas usando o TTS.ai