Free AI Teks ke Tutur

22+ model sumber terbuka, 100+ suara, 32+ Bahasa. Tiada akaun diperlukan.

0/500 Aksara Bebas
Tiada kad kredit 50 kredit percuma 32+ bahasa Penggunaan komersial OK
0:00 / 0:00
Muat turun Audio Pautan luput dalam 24 jam
Seperti TTS.ai? Beritahu kawan-kawan anda!

22+ Model Suara AI

Koleksi paling komprehensif model TTS sumber terbuka dalam satu platform

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Terbaik untuk: High-quality TTS with minimal latency, streaming applications

Cuba percuma

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Terbaik untuk: Quick previews, accessibility, and embedded applications

Cuba percuma

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Terbaik untuk: General-purpose text-to-speech with natural prosody

Cuba percuma

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Terbaik untuk: Production applications needing fast, multilingual TTS

Cuba percuma

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Pemaju: Suno · Lesen: MIT

Cubalah.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Pemaju: Suno · Lesen: MIT

Cubalah.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Pemaju: Alibaba (Tongyi Lab) · Lesen: Apache 2.0

Cubalah.

Dia TTSDia TTS Standard

Model penjanaan dialog pembicara-berbilang yang mencipta perbualan semulajadi antara pembicara.

Pemaju: Nari Labs · Lesen: Apache 2.0

Cubalah.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Pemaju: Hugging Face · Lesen: Apache 2.0

Cubalah.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Pemaju: Index Team · Lesen: Apache 2.0

Cubalah.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Pemaju: SparkAudio · Lesen: Apache 2.0

Cubalah.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Pemaju: RVC-Boss · Lesen: MIT

Cubalah.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Pemaju: Canopy Labs · Lesen: Llama 3.2 Community

Cubalah.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Pemaju: Alibaba (Qwen) · Lesen: Apache 2.0

Cubalah.

ChatterboxChatterbox Premium

Kloning suara terkini dengan kawalan emosi dari Resemble AI.

Kualiti:

Cubalah.

Tortoise TTSTortoise TTS Premium

Teks-ke-tutur berbilang suara berfokus pada kualiti dengan arsitektur autoregressif.

Kualiti:

Cubalah.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kualiti:

Cubalah.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kualiti:

Cubalah.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Bahasa: en, zh, ja, ko, fr, de, it, es

Klon Suara

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Bahasa: en, zh

Klon Suara

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Bahasa: en, zh

Klon Suara

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Bahasa: en, zh, ja, ko

Klon Suara

ChatterboxChatterbox

Kloning suara terkini dengan kawalan emosi dari Resemble AI.

Bahasa: en

Klon Suara

Tortoise TTSTortoise TTS

Teks-ke-tutur berbilang suara berfokus pada kualiti dengan arsitektur autoregressif.

Bahasa: en

Klon Suara

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Bahasa: en, zh, ja, ko, fr, de, es, it

Klon Suara

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Bahasa: en, zh, ja, ko, de, fr, ru, pt, es, it

Klon Suara

API Pemaju-Pertama

API REST serasi OpenAI. Satu titik akhir, 22+ model. Sokongan strim untuk aplikasi masa nyata.

  • Format serasi OpenAI
  • Strim TTS untuk aplikasi masa nyata
  • Pemprosesan serbuan untuk kerja besar
  • Pemberitahuan Webhook
Lihat Dokumen API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Simple, Transparent Pricing

Mulakan secara percuma.

Bebas

$0

50 kredit

  • Kokoro, Piper, VITS, MeloTTS
  • Had 500 aksara
  • 3 gen/jam (tiada akaun)
Daftar Masuk

Pelancar

$9/ms

500 kredit/bulan

  • Semua 22+ model
  • Had 5,000 aksara
  • Klon Suara
Mulakan
Paling Popular

Pro

$29/ms

2,000 kredit/bulan

  • Semua dalam Pelancar
  • Capaian API
  • Pemprosesan keutamaan
Dapatkan Pro

Enterprise

$99/ms

10,000 kredit/bulan

  • Semuanya dalam Pro
  • API Bulk
  • Baris gilir keutamaan
Hubungi Pemasaran

View all plans including credit packs →

Soalan Lazim

TTS.ai adalah platform suara AI yang paling komprehensif, menawarkan 22+ model teks-ke-tutur, klon suara, tutur-ke-teks, dan alat audio. Semua model adalah sumber terbuka tanpa penjual kunci-dalam.

Ya! TTS.ai menawarkan teks-ke-tutur percuma dengan model Kokoro, Piper, VITS, dan MeloTTS. Tiada akaun diperlukan. Daftar untuk mendapatkan 50 kredit percuma dan akses semua model. Rancangan berbayar bermula pada $9/bulan.

Untuk kelajuan, gunakan Kokoro atau Piper. Untuk kualiti, cuba CosyVoice 2 atau StyleTTS 2. Untuk klon suara, gunakan Chatterbox atau GPT-SoVITS. Untuk dialog, gunakan Dia TTS. Cuba beberapa model pada teks yang sama untuk dibandingkan.

Ya. API REST serasi OpenAI untuk TTS, STT, klon suara, dan alat audio. Tersedia pada rancangan Pro ($29/mo) dan Enterprise ($99/mo). Lihat dokumentasi di tts.ai/api/.

Kualiti suara bervariasi mengikut model. Model premium seperti CosyVoice 2, StyleTTS 2, dan Chatterbox menghasilkan ucapan kualiti hampir manusia dengan intonasi dan emosi semulajadi. Model percuma seperti Kokoro menawarkan kualiti yang baik untuk kebanyakan kes penggunaan.

TTS.ai menyokong 30+ bahasa di seluruh pustaka modelnya. Bahasa Inggeris mempunyai sokongan model terluas, tetapi model seperti CosyVoice 2 merangkumi Cina, Jepun, dan Korea; GPT-SoVITS mengendalikan Cina, Jepun, Korea, dan Inggeris; dan MeloTTS menyokong Bahasa Inggeris, Sepanyol, Perancis, Cina, Jepun, dan Korea.

Ya. Semua pemprosesan berlaku pada pelayan GPU khusus kami. Kami tidak menyimpan input teks anda atau audio yang dijana selepas penghantaran. Sampel suara yang dimuat naik untuk klon hanya digunakan untuk sesi semasa dan tidak disimpan. Kami tidak pernah berkongsi data anda dengan pihak ketiga atau menggunakannya untuk melatih model.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai menghasilkan audio dalam format WAV secara lalai untuk kualiti maksimum. Anda boleh menukar ke MP3, FLAC, OGG, atau M4A menggunakan alat Penukar Audio percuma kami. API menyokong menetapkan format output anda secara langsung dalam permintaan.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Model percuma (Kokoro, Piper, VITS, MeloTTS) tidak memerlukan akaun dan kos sifar kredit. Model piawai (2 kredit/1K aksara) termasuk Bark, CosyVoice 2, F5-TTS, dan Dia. Model premium (4 kredit/1K aksara) termasuk OpenVoice, Chatterbox, StyleTTS 2, dan Tortoise. Model berbayar biasanya menawarkan kualiti yang lebih tinggi, lebih banyak suara, dan ciri tambahan seperti klon suara.

Ya. API menyokong pemprosesan batch untuk menukarkan jumlah besar teks ke ucapan. Hantarkan permintaan berbilang dan dapatkan hasil secara asynchronous menggunakan UUID kerja. Pelan Enterprise ($99/mo) termasuk akses baris gilir keutamaan untuk pemprosesan batch yang lebih pantas. Ideal untuk produksi buku audio, kandungan kursus, dan projek suara skala besar.
5.0/5 (1)

Mula Guna Suara AI Hari Ini

Sertai pencipta, pembangun, dan perniagaan menggunakan TTS.ai