AI liberă Text la discurs

22+ de modele de sursă deschisă, 100+ de voci, 32+ limbi. Nu este necesar cont.

0/500 caractere Gratuit
Nici o carte de credit 50 de credite gratuite 32+ limbi Utilizare comercială OK
0:00 / 0:00
Descarcă audio Legătura expiră în 24 ore
Spune-i prietenilor tăi!

Tot ce ai nevoie pentru voce AI

26 de instrumente powered by 24+ open-source models AI

22+ modele vocale ale AI

Colecția cea mai cuprinzătoare a modelelor TTS de sursă deschisă într-o platformă

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Cel mai bun pentru: High-quality TTS with minimal latency, streaming applications

Încearcă liber

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Cel mai bun pentru: Quick previews, accessibility, and embedded applications

Încearcă liber

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Cel mai bun pentru: General-purpose text-to-speech with natural prosody

Încearcă liber

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Cel mai bun pentru: Aplicații de producție care au nevoie de TTS rapid și multilingv

Încearcă liber

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Dezvoltator: Suno · Licență: MIT

Încearcă.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Dezvoltator: Suno · Licență: MIT

Încearcă.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Dezvoltator: Alibaba (Tongyi Lab) · Licență: Apache 2.0

Încearcă.

Dia TTSDia TTS Standard

Model de generare de dialog multi-speaker care creează conversații naturale între vorbitori.

Dezvoltator: Nari Labs · Licență: Apache 2.0

Încearcă.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Dezvoltator: Hugging Face · Licență: Apache 2.0

Încearcă.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Dezvoltator: Index Team · Licență: Apache 2.0

Încearcă.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Dezvoltator: SparkAudio · Licență: Apache 2.0

Încearcă.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Dezvoltator: RVC-Boss · Licență: MIT

Încearcă.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Dezvoltator: Canopy Labs · Licență: Llama 3.2 Community

Încearcă.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Dezvoltator: Alibaba (Qwen) · Licență: Apache 2.0

Încearcă.

ChatterboxChatterbox Premium

Vocea de ultimă generaţie, cu un control de emoţie de la Resemble AI.

Calitate:

Încearcă.

Tortoise TTSTortoise TTS Premium

Multi-voce text-to-speech se concentrează pe calitate cu arhitectura autorregressivă.

Calitate:

Încearcă.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Calitate:

Încearcă.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Calitate:

Încearcă.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Limbi: en, zh, ja, ko, fr, de, it, es

Clonează vocea

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Limbi: en, zh

Clonează vocea

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Limbi: en, zh

Clonează vocea

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Limbi: en, zh, ja, ko

Clonează vocea

ChatterboxChatterbox

Vocea de ultimă generaţie, cu un control de emoţie de la Resemble AI.

Limbi: en

Clonează vocea

Tortoise TTSTortoise TTS

Multi-voce text-to-speech se concentrează pe calitate cu arhitectura autorregressivă.

Limbi: en

Clonează vocea

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Limbi: en, zh, ja, ko, fr, de, es, it

Clonează vocea

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Limbi: en, zh, ja, ko, de, fr, ru, pt, es, it

Clonează vocea

Dezvoltator-Primă API

API REST compatibilă cu OpenAI. O endpoint, 22+ modele. Suport de transparență pentru aplicații în timp real.

  • Format compatibil cu OpenAI
  • Streaming TTS pentru aplicații în timp real
  • Prelucrarea lotului pentru locuri de muncă mari
  • Notificații webhook
Afișează docurile API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Preţuri simple, transparente

Începe gratis. Scalează-te pe măsură ce creşti.

Gratuit

$0

50 de credite

  • Kokoro, Piper, VITS, MeloTTS
  • Limite de 500 de caractere
  • 3 gen/oră (fără cont)
Inscrie-te gratis

Pornitor

$9/mo

500 de credite/luna

  • Toate cele 22+ modele
  • limită de 5.000 de caractere
  • Clonarea vocală
Începe
Cel mai popular

Pro

$29/mo

2 000 de credite/luna

  • Totul în Starter
  • Acces API
  • Prelucrarea prioritară
Obține Pro

Întreprindere

$99/mo

10 000 de credite/luna

  • Totul în Pro
  • API Bulk
  • Coada prioritară
Vânzări de contact

View all plans including credit packs →

Întrebări frecvente

TTS.ai este cea mai cuprinzătoare platformă vocală AI, oferind 22+ de modele text-to-speech, clonare vocală, unelte vocale-to-text și audio. Toate modelele sunt surse deschise fără blocare furnizor.

Da! TTS.ai oferă modele gratuite text-to-speech cu Kokoro, Piper, VITS, și MeloTTS. Nu este necesar cont. Înregistrează-te pentru a obține 50 de credite gratuite și accesa toate modelele. Planurile plătite încep la 9$/luna.

Pentru viteză, utilizați Kokoro sau Piper. Pentru calitate, încercați CosyVoice 2 sau StyleTTS 2. Pentru clonarea vocală, utilizați Chatterbox sau GPT-SoVITS. Pentru dialog, utilizați Dia TTS. Încercați mai multe modele pe același text pentru a compara.

Da. API REST compatible cu OpenAI pentru TTS, STT, clonare vocală și instrumente audio. Disponibil pe Pro (29/mo) și Enterprise planuri (99/mo). Vizualizați documentația la tts.ai/api/.

Calitatea vocală variază după model. Modelele premium cum ar fi CosyVoice 2, StyleTTS 2, și Chatterbox produc discurs de calitate aproape umană cu intonare naturală și emoție. Modelele gratuite cum ar fi Kokoro oferă o calitate excelentă pentru cele mai multe cazuri de utilizare.

TTS.ai suportă 30 de limbi în bibliotecă de model. Engleza are cel mai larg suport model, dar modele precum CosyVoice 2 acoperire chineză, japoneză și coreeană; GPT-SoVITS manieră chineză, japoneză, coreeană și engleză; și MeloTTS sprijină engleza, spaniolă, franceză, chineză, japoneză și coreeană.

Da. Toate prelucrarea se întâmplă pe serverele noastre GPU dedicate. Noi nu stochăm inputul text sau audio generat după livrarea. Exemplare de voce încărcate pentru clonarea sunt folosite doar pentru sesiunea curentă și nu sunt păstrate. Nu împărtășim niciodată datele cu terțe părți sau îl folosim pentru a antrena modele.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai generează audio în format WAV prin predefinire pentru calitatea maximă. Puteți converti în MP3, FLAC, OGG sau M4A folosind instrumentul nostru gratuit Audio Converter. API suportă specificarea formatului de ieșire preferat direct în cerere.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Modelele gratuite (Kokoro, Piper, VITS, MeloTTS) nu necesită cont și costuri zero credite. Modelele standard (2 credite/1K caractere) includ Bark, CosyVoice 2, F5-TTS, și Dia. Modelele premium (4 credite/1K caractere) includ OpenVoice, Chatterbox, StyleTTS 2, și Tortoise. Modelele plătite oferă în general mai multă calitate, mai multe voci și caracteristici suplimentare cum clonarea vocală.

Da. API suportă prelucrarea lotului pentru transformarea volumelor mari de text în vorbire. Trimite mai multe cereri și recuperează rezultate o sincronică folosind job UUIDs. Planurile de întreprinderi (99/mo) includ acces prioritar la coada pentru procesarea lotului mai rapid. Ideal pentru producția audiobook, conținut de curs, și proiecte vocale over la scară largă.
5.0/5 (1)

Începeți să utilizați vocea AI astăzi

Alăturați-vă creatorilor, dezvoltatorilor și întreprinderilor folosind TTS.ai