IA gratuita Testo al discorso

22+ modelli open-source, 100+ voci, 32+ lingue. Nessun account richiesto.

0/500 caratteri Libero
Nessuna carta di credito 50 crediti gratuiti 32+ lingue Uso commerciale OK
0:00 / 0:00
Scarica audio Link scade in 24 ore
Come TTS.ai? Dillo ai tuoi amici!

22+ Modelli di voce AI

La collezione più completa di modelli TTS open-source in un'unica piattaforma

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Meglio per: High-quality TTS with minimal latency, streaming applications

Prova gratis

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Meglio per: Quick previews, accessibility, and embedded applications

Prova gratis

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Meglio per: General-purpose text-to-speech with natural prosody

Prova gratis

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Meglio per: Applicazioni di produzione che necessitano di TTS veloce e multilingue

Prova gratis

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Sviluppatore: Suno · Licenza: MIT

Provaci.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Sviluppatore: Suno · Licenza: MIT

Provaci.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Sviluppatore: Alibaba (Tongyi Lab) · Licenza: Apache 2.0

Provaci.

Dia TTSDia TTS Standard

Modello di generazione di finestre di dialogo multialtoparlanti che crea conversazioni naturali tra altoparlanti.

Sviluppatore: Nari Labs · Licenza: Apache 2.0

Provaci.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Sviluppatore: Hugging Face · Licenza: Apache 2.0

Provaci.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Sviluppatore: Index Team · Licenza: Apache 2.0

Provaci.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Sviluppatore: SparkAudio · Licenza: Apache 2.0

Provaci.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Sviluppatore: RVC-Boss · Licenza: MIT

Provaci.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Sviluppatore: Canopy Labs · Licenza: Llama 3.2 Community

Provaci.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Sviluppatore: Alibaba (Qwen) · Licenza: Apache 2.0

Provaci.

ChatterboxChatterbox Premium

Clonazione vocale all'avanguardia con controllo delle emozioni da parte di Resemble AI.

Qualità:

Provaci.

Tortoise TTSTortoise TTS Premium

Text-to-speech multivoce focalizzato sulla qualità con architettura autoregressiva.

Qualità:

Provaci.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Qualità:

Provaci.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Qualità:

Provaci.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Lingue: en, zh, ja, ko, fr, de, it, es

Voce clona

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Lingue: en, zh

Voce clona

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Lingue: en, zh

Voce clona

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Lingue: en, zh, ja, ko

Voce clona

ChatterboxChatterbox

Clonazione vocale all'avanguardia con controllo delle emozioni da parte di Resemble AI.

Lingue: en

Voce clona

Tortoise TTSTortoise TTS

Text-to-speech multivoce focalizzato sulla qualità con architettura autoregressiva.

Lingue: en

Voce clona

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Lingue: en, zh, ja, ko, fr, de, es, it

Voce clona

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Lingue: en, zh, ja, ko, de, fr, ru, pt, es, it

Voce clona

Sviluppatore-Prima API

API OpenAI-compatibile REST. Un endpoint, 22+ modelli. Supporto di streaming per applicazioni in tempo reale.

  • Formato compatibile con OpenAI
  • Streaming TTS per applicazioni in tempo reale
  • Elaborazione di lotti per lavori di grandi dimensioni
  • Notificazioni Webhook
Visualizza documenti API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Prezzi semplici e trasparenti

Inizia libero. Scala come si cresce.

Libero

$0

50 crediti

  • Kokoro, Piper, VITS, MeloTTS
  • Limite di 500 caratteri
  • 3 gen/ora (nessun conto)
Iscriviti gratis

Avviatore

$9/mo

500 crediti/mese

  • Tutti i modelli 22+
  • Limite di 5.000 caratteri
  • Clonazione vocale
Inizia
Più popolare

Pro

$29/mo

2.000 crediti/mese

  • Tutto in Starter
  • Accesso API
  • Trattamento prioritario
Get Pro

Impresa

$99/mo

10.000 crediti/mese

  • Tutto in Pro
  • API di massa
  • Coda prioritaria
Contatta le vendite

View all plans including credit packs →

Domande frequenti

TTS.ai è la piattaforma vocale AI più completa, che offre oltre 22 modelli da testo a parola, clonatura vocale, speech-to-text e strumenti audio. Tutti i modelli sono open source senza lock-in fornitore.

Sì! TTS.ai offre gratuitamente testo a parola con Kokoro, Piper, VITS e modelli MeloTTS. Nessun account richiesto. Iscriviti per ottenere 50 crediti gratuiti e accedere a tutti i modelli. I piani a pagamento iniziano a $9/mese.

Per la velocità, utilizzare Kokoro o Piper. Per la qualità, provare CosyVoice 2 o StyleTTS 2. Per la clonazione vocale, utilizzare Chatterbox o GPT-SoVITS. Per la finestra di dialogo, utilizzare Dia TTS. Provare più modelli sullo stesso testo per confrontare.

Sì. API OpenAI-compatibile REST per TTS, STT, cloning vocale, e strumenti audio. Disponibile su piani Pro ($29/mo) e Enterprise ($99/mo). Visualizza la documentazione su tts.ai/api/.

La qualità della voce varia a seconda del modello. Modelli premium come CosyVoice 2, StyleTTS 2, e Chatterbox producono discorsi di qualità quasi umana con intonazione naturale ed emozione. Modelli gratuiti come Kokoro offrono qualità eccellente per la maggior parte dei casi di utilizzo.

TTS.ai supporta 30+ lingue in tutta la sua libreria modello. Inglese ha il più ampio supporto modello, ma modelli come CosyVoice 2 copertura cinese, giapponese e coreano; GPT-SoVITS gestisce cinese, giapponese, coreano e inglese; e MeloTTS supporta inglese, spagnolo, francese, cinese, giapponese e coreano.

Sì. Tutte le elaborazioni avvengono sui nostri server GPU dedicati. Non memorizziamo il tuo input di testo o l'audio generato dopo la consegna. I campioni vocali caricati per la clonazione vengono utilizzati solo per la sessione corrente e non vengono mantenuti. Non condividiamo mai i tuoi dati con terze parti o li usiamo per addestrare i modelli.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai genera audio in formato WAV per impostazione predefinita per la massima qualità. È possibile convertire in MP3, FLAC, OGG o M4A utilizzando il nostro strumento gratuito Audio Converter. L'API supporta specificare il formato di output preferito direttamente nella richiesta.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Modelli gratuiti (Kokoro, Piper, VITS, MeloTTS) non richiedono alcun account e costo zero crediti. Modelli standard (2 crediti 1K caratteri) includono Bark, CosyVoice 2, F5-TTS, e Dia. Modelli premium (4 crediti 1K caratteri) includono OpenVoice, Chatterbox, StyleTTS 2, e Tortoise. Modelli a pagamento in genere offrono una qualità superiore, più voci, e funzionalità aggiuntive come la clonazione vocale.

Sì. L'API supporta l'elaborazione in batch per convertire grandi volumi di testo in discorso. Inviare più richieste e recuperare i risultati in modo asincrono utilizzando job UUID. I piani aziendali ($99/mo) includono l'accesso prioritario alla coda per l'elaborazione in batch più veloce. Ideale per la produzione di audiolibro, contenuti del corso e grandi progetti di voiceover su larga scala.
5.0/5 (1)

Inizia ad usare AI Voice oggi

Unisciti a creatori, sviluppatori e aziende che utilizzano TTS.ai