Gratis AI Teks ke Pidato

22+ model open-source, 100+ voices, 32+ Tak ada rekening yang diperlukan.

0/500 karakter Bebas
Tidak ada kartu kredit 50 kredit gratis 32+ bahasa Penggunaan komersial OK
0:00 / 0:00
Unduh Audio Sambungan berakhir dalam 24 jam
Seperti TTS.ai?

22+ AI Voice Models

Koleksi paling komprehensif model TTS open-source dalam satu platform

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Terbaik untuk: High-quality TTS with minimal latency, streaming applications

Coba Bebas

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Terbaik untuk: Quick previews, accessibility, and embedded applications

Coba Bebas

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Terbaik untuk: General-purpose text-to-speech with natural prosody

Coba Bebas

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Terbaik untuk: Production applications needing fast, multilingual TTS

Coba Bebas

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Pengembang: Suno · Lisensi: MIT

Cobalah

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Pengembang: Suno · Lisensi: MIT

Cobalah

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Pengembang: Alibaba (Tongyi Lab) · Lisensi: Apache 2.0

Cobalah

Dia TTSDia TTS Standard

Model dialog multi pembicara yang menciptakan percakapan alami antara pembicara.

Pengembang: Nari Labs · Lisensi: Apache 2.0

Cobalah

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Pengembang: Hugging Face · Lisensi: Apache 2.0

Cobalah

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Pengembang: Index Team · Lisensi: Apache 2.0

Cobalah

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Pengembang: SparkAudio · Lisensi: Apache 2.0

Cobalah

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Pengembang: RVC-Boss · Lisensi: MIT

Cobalah

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Pengembang: Canopy Labs · Lisensi: Llama 3.2 Community

Cobalah

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Pengembang: Alibaba (Qwen) · Lisensi: Apache 2.0

Cobalah

ChatterboxChatterbox Premium

State-of-the-art zero-shot voice kloning dengan kontrol emosi dari Resemble AI.

Kualitas:

Cobalah

Tortoise TTSTortoise TTS Premium

Speech teks multi-voice difokuskan pada kualitas dengan arsitektur autoregresif.

Kualitas:

Cobalah

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kualitas:

Cobalah

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kualitas:

Cobalah

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Bahasa: en, zh, ja, ko, fr, de, it, es

Suara Kloning

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Bahasa: en, zh

Suara Kloning

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Bahasa: en, zh

Suara Kloning

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Bahasa: en, zh, ja, ko

Suara Kloning

ChatterboxChatterbox

State-of-the-art zero-shot voice kloning dengan kontrol emosi dari Resemble AI.

Bahasa: en

Suara Kloning

Tortoise TTSTortoise TTS

Speech teks multi-voice difokuskan pada kualitas dengan arsitektur autoregresif.

Bahasa: en

Suara Kloning

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Bahasa: en, zh, ja, ko, fr, de, es, it

Suara Kloning

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Bahasa: en, zh, ja, ko, de, fr, ru, pt, es, it

Suara Kloning

API Pengembang-Pertama

API REST OpenAI yang kompatibel. Satu titik akhir, 22+ model. Streaming dukungan untuk aplikasi real-time.

  • Format kompatibel OpenAI
  • Streaming TTS untuk aplikasi real-time
  • Pemrosesan Batch untuk pekerjaan besar
  • Pemberitahuan Webhook
Tilik Dokumen API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Sederhana, Harga Transparan

Mulai bebas, skala saat Anda tumbuh.

Bebas

$0

50 kredit

  • Kokoro, Piper, VITS, MeloTTS
  • Batas karakter 500
  • 3 gen/jam (tidak ada akun)
Daftar Bebas

Pemulai

$9/mo

500 kredit/bulan

  • Semua 22+ model
  • Batas karakter 5.000
  • Kloning Suara
Mulai
Paling Populer

Pro

$29/mo

2.000 kredit/bulan

  • Segala sesuatu di Starter
  • Akses API
  • Pemrosesan prioritas
Dapatkan Pro

Enterprise

$99/mo

10.000 kredit/bulan

  • Semuanya dalam Pro
  • API Bulk
  • Antrian prioritas
Penjualan Kontak

View all plans including credit packs →

Pertanyaan yang Sering Diajukan

TTS.ai adalah platform suara AI yang paling komprehensif, menawarkan 22+ model teks-to-peech, kloning suara, berbicara-ke-teks, dan alat audio. Semua model open source tanpa vendor lock-in.

TTS.ai menawarkan gratis teks-to-peech dengan Kokoro, Piper, VITS, dan MelottS model.

Untuk kecepatan, gunakan Kokoro atau Piper. Untuk kualitas, coba CosyVoice 2 atau StyTTS 2. Untuk mengkloning suara, gunakan Chatterbox atau GPT-SoVIT. Untuk dialog, gunakan Dia TTS. Coba beberapa model pada teks yang sama untuk dibandingkan.

API TTS, STT, kloning suara, dan alat audio. Tersedia pada Pro ($29/mo) dan Enterprise ($99/mo). Lihat dokumentasi di tts.ai/api/.

Kualitas suara berbeda dengan model. model Premium seperti CosyVoice 2, Stylist 2, dan Chatterbox menghasilkan pidato berkualitas dekat dengan intonasi alami dan emosi model bebas seperti kokoro menawarkan kualitas yang sangat baik untuk kebanyakan kasus.

TTS.ai mendukung 30+ bahasa di seluruh perpustakaan modelnya. Bahasa Inggris memiliki dukungan model terluas, tapi model seperti CosyVoice 2 mencakup Cina, Jepang, dan Korea; GPT-SoVIT menangani bahasa Cina, Jepang, Korea, dan Inggris; dan MellottS mendukung bahasa Inggris, Spanyol, Prancis, Cina, Jepang, dan Korea.

Semua pemrosesan terjadi pada server GPU kami yang berdedikasi. Kami tidak menyimpan masukan teks Anda atau audio yang dihasilkan setelah pengiriman. Menunggah sampel suara untuk kloning hanya digunakan untuk sesi saat ini dan tidak dipertahankan. Kami tidak pernah berbagi data Anda dengan pihak ketiga atau menggunakannya untuk melatih model.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.Ai menghasilkan audio dalam format WAV secara baku untuk kualitas maksimum. Anda dapat mengubah ke MP3, FLAC, OGG, atau M4A menggunakan perangkat bebas Audio Conversier. API menspesifikasikan format keluaran yang disukai secara langsung dalam permintaan.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Model gratis (Kokoro, Piper, VITS, Melotts) tidak memerlukan akun dan biaya nol kredit. model standar (2 kredit/1K) termasuk Bark, CosyVoice 2, F5-TTS, dan Dia. Model Premium (4 karakter kredit/1K) termasuk OpenVoice, Chatterbox, Stylist 2, dan Tortoise.

Ya. API mendukung pemrosesan batch untuk mengubah volume besar teks ke pidato. Kirim beberapa permintaan dan ambil hasil secara bersamaan menggunakan UUIDs kerja. Rencana Enterprise ($99/mo) termasuk akses antrian prioritas untuk pemrosesan batch yang lebih cepat. Ideal untuk produksi audiobook, tentu saja konten, dan proyek-proyek voiceover skala besar.
5.0/5 (1)

Mulai Menggunakan Suara AI Dewasa Ini

Gabungkan pembuat, pengembang, dan bisnis menggunakan TTS.ai