Model Teks ke Tutur Sumber Terbuka
Setiap model TTS pada platform kami adalah sumber terbuka dengan lesen yang mesra komersial. MIT, Apache 2.0 — tiada kuncian hak milik, tiada sekatan penggunaan, tiada bayaran lesen kejutan. Gunakan mereka melalui API kami yang dihost, atau self-host mereka pada infrastruktur anda sendiri dengan kawalan penuh.
Cuba Sekarang
Faedah TTS sumber terbuka
Mengapa model sumber terbuka penting untuk projek anda
Semua sumber terbuka dilesenkan
Setiap model di TTS.ai menggunakan lesen sumber terbuka yang membenarkan. Tiada kotak hitam yang dimiliki, tiada vendor yang terkunci, tiada bayaran lesen yang tidak dijangka.
MIT / Apache 2. 0
Model dilesenkan di bawah MIT atau Apache 2.0, lesen sumber terbuka yang paling membenarkan. Guna secara komersial, ubahsuai, tabur semula — tiada sekatan.
Boleh Dihost
Muat turun mana-mana model dan jalankan pada perkakasan anda sendiri. Kawalan penuh ke atas data anda, latensi, dan infrastruktur. Tiada bergantung awan diperlukan.
Dioptimasikan GPU
Model dioptimasikan untuk GPU NVIDIA dengan sokongan CUDA. Piper hanya berjalan pada CPU. Kebanyakan model memerlukan 2-8GB VRAM untuk inferensi yang berkesan.
Komuniti Dijaga
Komuniti sumber terbuka aktif menjaga dan memperbaiki model-model ini. Kontribusi dialu-alukan — hantar pepijat, penambahbaikan, dan suara-suara baru di GitHub.
Penggunaan Komersial OK
Semua model membenarkan penggunaan komersial di bawah lesen mereka. Bina produk, jual perkhidmatan, dan cipta kandungan komersial tanpa royalti atau bayaran penggunaan.
Katalog Model Sumber Terbuka Kami
Setiap model, lesennya, dan apa yang dia lakukan dengan baik.
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Terbaik untuk: Apache 2. 0 — model percuma kualiti terbaik, 82M params, mudah untuk self-host
Cuba Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Terbaik untuk: MIT — CPU sahaja, sempurna untuk peranti tepi dan pengosongan diri terbenam
Cuba Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Terbaik untuk: MIT — arsitektur asas yang digunakan oleh banyak model bawah aliran
Cuba VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Terbaik untuk: MIT — keupayaan penjanaan audio unik melebihi TTS piawai
Cuba Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Terbaik untuk: Apache 2. 0 — kualiti maksimum, pelaksanaan rujukan yang dikaji secara meluas
Cuba Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Terbaik untuk: MIT — klon suara sumber terbuka dengan kawalan gaya granular
Cuba OpenVoiceBagaimana Menggunakan TTS Sumber Terbuka
Gunakan API kami atau jalankan model sendiri
Jelajahi Model Sumber Terbuka
Layari katalog kami 20+ model TTS sumber terbuka. Setiap halaman model menunjukkan lesen, arsitektur, keupayaan, dan keperluan self-hosting.
Cuba dalam Pelayar Anda
Uji mana-mana model secara langsung pada TTS.ai tanpa memasang apa-apa. Pelayan GPU kami mengendalikan pemprosesan supaya anda boleh menilai kualiti sebelum berkomitmen untuk self-hosting.
Hos Sendiri atau Guna API Kami
Klon repositori model dari GitHub dan jalankan secara setempat, atau gunakan API kami yang dihost untuk pengeluaran. Self-hosting memberikan kawalan penuh; API kami menyediakan infrastruktur yang dikendalikan.
Bina Aplikasi Anda
Integrikan TTS ke dalam produk anda menggunakan model sendiri-dihost atau API REST kami. Semua model boleh digunakan secara komersial tanpa bayaran lesen atau royalti.
Perbandingan Lesen
Semua model pada TTS.ai menggunakan lesen sumber terbuka yang mesra komersial
| Model | Lesen | Penggunaan Komersial | Pengubahsuaian | Hos-Sendiri | Atribut |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Diperlukan | |||
| Piper | MIT | Opsyenal | |||
| VITS | MIT | Opsyenal | |||
| MeloTTS | MIT | Opsyenal | |||
| Chatterbox | MIT | Opsyenal | |||
| Tortoise TTS | Apache 2.0 | Diperlukan | |||
| StyleTTS 2 | MIT | Opsyenal | |||
| OpenVoice | MIT | Opsyenal | |||
| Sesame CSM | Apache 2.0 | Diperlukan | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Self-Hosting vs Hosted API
Jalankan model sendiri atau biarkan kami uruskan infrastruktur
Hos-Sendiri pada Perkakasan Anda
Setiap model pada TTS.ai tersedia sebagai projek sumber terbuka pada GitHub atau Hugging Face. Muat turun berat, pasang dependensi, dan jalankan inferensi pada GPU anda sendiri. Anda mempunyai kawalan penuh ke atas latensi, privasi, dan skala.
- Privasi data penuh — audio tidak pernah meninggalkan pelayan anda
- Tiada kos per-permintaan selepas pemasangan awal
- Penyuntingan halus tersendiri pada data anda sendiri
- Memerlukan perkakasan GPU (NVIDIA disyorkan)
- Anda mengurus kemaskini, penskalaan, dan dependensi
Guna API Dihost TTS.ai
Dapatkan akses segera ke semua 20+ model melalui satu API REST. Kami mengendalikan pemberian GPU, kemaskini model, pengurusan baris gilir, dan penskalaan. Satu kekunci API memberikan anda akses ke setiap model — tidak perlu mengurus pelaksanaan terpisah.
- Tiada perkakasan GPU diperlukan
- Semua 20+ model melalui satu API
- Kemas kini dan penambahbaikan model automatik
- Masa operasi 99.9% dengan infrastruktur redundan
- Hanya bayar untuk apa yang anda gunakan
Mula Cepat: API atau Host-Sendiri
Guna API kami yang dihost, atau pasang Kokoro secara setempat dalam beberapa minit
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Sumber Terbuka, Harga Murah
API kami menjadikan TTS sumber terbuka boleh diakses tanpa mengurus GPU.
Lapisan Bebas
$0
15 kredit pada pendaftaran
- 4 model sumber terbuka percuma
- Tiada pendaftaran untuk penggunaan asas
- Penggunaan komersial dibenarkan
Pelancar
$9
500,000 aksara/bulan
- Semua 20+ model sumber terbuka
- Klon suara
- Akses API
Pro
$29
2,000,000 aksara/bulan
- Pemprosesan GPU keutamaan
- Semua model premium
- Sokongan Enterprise
Soalan Lazim
Soalan biasa mengenai teks-ke-tuturan sumber terbuka
Apa yang boleh kami perbaiki?
Cuba TTS sumber terbuka hari ini
20+ model sumber terbuka, semua berlesen komersial. Guna API kami atau self-host — pilihan adalah milik anda.