IA gratuita Testo al discorso
22+ modelli open-source, 100+ voci, 32+ lingue. Nessun account richiesto.
Tutto ciò di cui hai bisogno per la voce AI
26 utensili alimentati da 24+ modelli AI open-source
22+ Modelli di voce AI
La collezione più completa di modelli TTS open-source in un'unica piattaforma
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Meglio per: High-quality TTS with minimal latency, streaming applications
Prova gratis
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Meglio per: Quick previews, accessibility, and embedded applications
Prova gratis
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Meglio per: General-purpose text-to-speech with natural prosody
Prova gratis
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Meglio per: Applicazioni di produzione che necessitano di TTS veloce e multilingue
Prova gratis
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Sviluppatore: Suno · Licenza: MIT
Provaci.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Sviluppatore: Suno · Licenza: MIT
Provaci.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Sviluppatore: Alibaba (Tongyi Lab) · Licenza: Apache 2.0
Provaci.
Dia TTS Standard
Modello di generazione di finestre di dialogo multialtoparlanti che crea conversazioni naturali tra altoparlanti.
Sviluppatore: Nari Labs · Licenza: Apache 2.0
Provaci.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Sviluppatore: Hugging Face · Licenza: Apache 2.0
Provaci.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Sviluppatore: Index Team · Licenza: Apache 2.0
Provaci.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Sviluppatore: SparkAudio · Licenza: Apache 2.0
Provaci.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Sviluppatore: RVC-Boss · Licenza: MIT
Provaci.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Sviluppatore: Canopy Labs · Licenza: Llama 3.2 Community
Provaci.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Sviluppatore: Alibaba (Qwen) · Licenza: Apache 2.0
Provaci.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Lingue: en, zh, ja, ko, fr, de, it, es
Voce clona
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Lingue: en, zh
Voce clona
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Lingue: en, zh
Voce clona
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Lingue: en, zh, ja, ko
Voce clona
Chatterbox
Clonazione vocale all'avanguardia con controllo delle emozioni da parte di Resemble AI.
Lingue: en
Voce clona
Tortoise TTS
Text-to-speech multivoce focalizzato sulla qualità con architettura autoregressiva.
Lingue: en
Voce clona
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Lingue: en, zh, ja, ko, fr, de, es, it
Voce clona
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Lingue: en, zh, ja, ko, de, fr, ru, pt, es, it
Voce clonaSviluppatore-Prima API
API OpenAI-compatibile REST. Un endpoint, 22+ modelli. Supporto di streaming per applicazioni in tempo reale.
- Formato compatibile con OpenAI
- Streaming TTS per applicazioni in tempo reale
- Elaborazione di lotti per lavori di grandi dimensioni
- Notificazioni Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Prezzi semplici e trasparenti
Inizia libero. Scala come si cresce.
Libero
50 crediti
- Kokoro, Piper, VITS, MeloTTS
- Limite di 500 caratteri
- 3 gen/ora (nessun conto)
Avviatore
500 crediti/mese
- Tutti i modelli 22+
- Limite di 5.000 caratteri
- Clonazione vocale
Pro
2.000 crediti/mese
- Tutto in Starter
- Accesso API
- Trattamento prioritario
Domande frequenti
Inizia ad usare AI Voice oggi
Unisciti a creatori, sviluppatori e aziende che utilizzano TTS.ai