Laporkan Permintaan Kutu / Fitur

Teks Sumber Terbuka kepada Model Pidato

Semua model TTS pada platform kami adalah open source dengan lisensi yang ramah komersial, MIT, Apache 2.0, tidak ada kunci-in proprietary, tidak ada pembatasan penggunaan, tidak ada biaya lisensi mengejutkan. Gunakan mereka melalui API tuan rumah kami, atau foto diri mereka pada infrastruktur Anda sendiri dengan kontrol penuh.

Sumber Terbuka Lisensi MIT Apache 2.0 Dapat-Ditempatkan-sendiri GitHub

Penyunting TTS Penuh Dokumen API

Cobalah Sekarang

Teks
Berkas

0/500

Free with Kokoro, Piper, VITS, Melotts

Audio yang dihasilkan Anda akan muncul di sini

Buka penyunting TTS penuh

Manfaat TTS Sumber Terbuka

Mengapa masalah model open-source untuk proyek Anda

Semua Lisensi Open-Source

Setiap model di TTS.ai menggunakan lisensi open-source. tidak ada kotak hitam proprietary, tidak ada kunci-in vendor, tidak ada lisensi yang tak terduga.

MIT / Apache 2.0

Model dilisensikan di bawah MIT atau Apache 2.0, lisensi open-source paling serbaboleh. Gunakan secara komersial, modifikasi, redistribusi ulang tanpa pembatasan.

Dapat-Ditempatkan-sendiri

Mengunduh model apapun dan menjalankannya dengan perangkat keras Anda sendiri. Kendali penuh atas data, latensi, dan infrastruktur Anda. Tidak ada ketergantungan awan yang diperlukan.

GPU Teroptimasi

Model dioptimalkan untuk GPU NVIDIA dengan dukungan CUDA. Piper hanya berjalan pada CPU. Kebanyakan model membutuhkan VRAM 2-8GB untuk inferensi efisien.

Komunitas Dipertahankan

Komunitas open-source aktif memelihara dan meningkatkan model-model ini.

Penggunaan Komersial OK

Semua model memungkinkan penggunaan komersial di bawah lisensi mereka. membangun produk, menjual jasa, dan menciptakan konten komersial tanpa royalti atau biaya penggunaan.

Katalog Model Sumber Terbuka Kita

Setiap model, lisensi, dan apa yang dilakukannya terbaik

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Terbaik untuk: Model bebas kualitas terbaik, params 82M, mudah untuk diri sendiri.

Cobalah Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Terbaik untuk: MIT hanya CPU, sempurna untuk perangkat tepi dan tertanam self-hosting

Cobalah Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Terbaik untuk: MIT ° arsitektur dasar yang digunakan oleh banyak model hilir

Cobalah VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Terbaik untuk: MIT memiliki kemampuan unik pembuatan audio melebihi TTS standar

Cobalah Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Kloning Suara

Terbaik untuk: Apache 2.0 kualitas maksimum, banyak mempelajari implementasi referensi

Cobalah Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Kloning Suara

Terbaik untuk: MIT kloning suara open-source dengan pengendali gaya granular

Cobalah OpenVoice

Cara Menggunakan TTS Sumber Terbuka

Gunakan API host kami atau jalankan model sendiri

Jelajahi Model Open-Source

Ramban katalog kami dari 20+ model TTS open-source. Setiap halaman model menunjukkan lisensi, arsitektur, kemampuan, dan persyaratan untuk menentukan diri sendiri.

Coba di Peramban Anda

Uji model apapun langsung pada TTS.ai tanpa memasang apa-apa. Server GPU kami menangani pemrosesan sehingga Anda dapat mengevaluasi kualitas sebelum melakukan kebiasaan pribadi.

Diri Sendiri-Host atau Gunakan API Kami

Model clone repos dari GitHub dan dijalankan secara lokal, atau menggunakan API kami sebagai hosted production. Self-hosting memberikan kontrol penuh; API kami menyediakan infrastruktur yang dikelola.

Bangun Aplikasi Anda

Integrate TTS ke dalam produk Anda menggunakan model berhosted sendiri atau API REST kami. Semua model yang komersial dapat digunakan tanpa lisensi biaya atau royalti.

Perbandingan Lisensi

Semua model di TTS.ai menggunakan lisensi open-source yang ramah secara komersial

Model	Lisensi	Attribution
Kokoro	Apache 2.0	Diperlukan
Piper	MIT	Opsional
VITS	MIT	Opsional
MeloTTS	MIT	Opsional
Chatterbox	MIT	Opsional
Tortoise TTS	Apache 2.0	Diperlukan
StyleTTS 2	MIT	Opsional
OpenVoice	MIT	Opsional
Sesame CSM	Apache 2.0	Diperlukan
Orpheus	Llama 3.2	"Built with Llama"

Coba Model Ini Bebas

Self-Hosing vs Hosted API

Jalankan model sendiri atau biarkan kami menangani infrastruktur

Diri Sendiri Di Perangkat Keras Anda

Setiap model di TTS.ai tersedia sebagai proyek open-source di GitHub atau Hugging Face. Unduh berat, pasang ketergantungan, dan jalankan inference pada GPU Anda sendiri. Anda memiliki kendali penuh atas latensi, privasi, dan skala.

Privasi data penuh audio tidak pernah meninggalkan server Anda
Tidak ada biaya per-request setelah setup awal
Kustom baik-tuning pada data Anda sendiri
Diperlukan perangkat keras GPU (NVIDIA direkomendasikan)
Anda mengelola pemutakhiran, penskalaan, dan ketergantungan

Gunakan API TTS.ai Hosted

Dapatkan akses instan ke semua model 20+ melalui API STEST tunggal. Kami menangani penyediaan GPU, pemutakhiran model, pengelolaan antrian, dan penskalaan. Satu kunci API memberi Anda akses ke setiap model ▪ Tidak perlu mengatur penyebaran terpisah.

Perangkat keras GPU tidak dibutuhkan
Semua model 20+ melalui satu API
Pemutakhiran model otomatis dan perbaikan
99,9% uptime dengan infrastruktur berlebihan
Bayar saja untuk apa yang Anda gunakan

Gunakan API Yang Disukai

Quick Start: API atau Self-Host

Gunakan API yang diberi host, atau pasang Kokoro secara lokal dalam menit

Opsi 1: TTS.ai Hosted API Paling mudah

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opsi 2: Self-Host with pip Kendali Penuh

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Tilik Dokumentasi API

Open Source, Affordable Pricing

API kami yang diberi host membuat TTS open-source diakses tanpa mengelola GPUs.

Tier Bebas

15.000 karakter pada signup

4 model open-source bebas
Tidak ada pendaftaran untuk penggunaan dasar
Penggunaan komersial diperbolehkan

Pemulai

500.000 karakter/bulan

Semua 20+ model open-source
Penklonan Suara
Akses API

Pro

$29

2.000.000 karakter/bulan

Pemrosesan GPU prioritas
Semua model premium
Dukungan Enterprise

Lihat Perataan Penuh

Pertanyaan yang Sering Diajukan

Pertanyaan umum tentang teks sumber terbuka ke pidato

Ya, setiap model di TTS.ai menggunakan lisensi open-source yang serbaboleh baik MIT atau Apache 2.0. kita secara khusus mengecualikan model dengan lisensi terbatas (seperti CPML Coqui atau bukan-kommercial CC-BY-NC). Anda dapat memverifikasi lisensi setiap model pada repositori GitHub.

Keduanya adalah lisensi open-source yang mengijinkan penggunaan komersial, modifikasi, dan redistribusi. Apache 2.0 menambahkan hint paten eksplisit dan menyatakan perubahan jika Anda memodifikasi kode. MIT lebih sederhana dengan persyaratan yang lebih sedikit. Keduanya adalah perusahaan-ramah.

Ya. setiap model dapat diklonkan sendiri. clone model repositori dari GitHub, install ketergantungan, unduh berat model, dan jalankan inferensi. kami menyediakan dokumentasi untuk setiap model persyaratan pemhosing termasuk GPU, RAM, dan versi Python.

Permintaan berbeda dengan model. Piper tidak membutuhkan GPU (hanya CPU). Kokoro dan Melottis membutuhkan 1-2GB VRAM kebanyakan model standar membutuhkan 4GB VRAM. Tortoise dan Sesame CSM membutuhkan 8GB. Sebuah NVIDIA RTX 3060 (12GB) dapat menjalankan kebanyakan model dengan nyaman.

Ya. lisensi open-source memungkinkan modifikasi termasuk kualitas-baik. model seperti GPT-SoVIT dan Bark menyediakan skrip yang bagus. anda dapat melatih model-model pada data suara anda sendiri untuk membuat suara-suara atau meningkatkan kinerja untuk bahasa-bahasa tertentu.

Top open-source model (Kokoro, StyleTTS 2, Chatterbox) sekarang cocok atau melebihi layanan komersial seperti ElevenLabs dan Google TTS dalam benchmarks kualitas. Keuntungan utama layanan komersial dikelola infrastruktur dan dukungan, bukan kualitas audio.

XTTS/XTTS-v2 (CPML CPML Coqui), F5-TTS (CC-BY-NC-NC non-komersial), dan Higgs-v2 (Bison License terbatas) semuanya dihapus. Setiap model di TTS.ai diverifikasikan menggunakan aman komersial.

Kebanyakan model menerima kontribusi komunitas melalui GitHub. Anda dapat mengirimkan laporan bug, rekaman suara untuk bahasa baru, peningkatan kode, dan dokumentasi. Periksa repositori GitHub setiap model untuk panduan kontribusi dan isu aktif.

Muat model on-demand dan unload ketika menganggur untuk berbagi memori GPU. Server GPU kami menjalankan 20+ model pada 4x Tesla P40 (96GB total VRAM) menggunakan loading dinamis. Untuk kepemilikan diri sendiri, 24GB GPU dapat melayani 3-5 model secara bersamaan.

Banyak model menyediakan gambar resmi Docker atau Dockerfiles. Untuk menjalankan beberapa model, Anda dapat membangun pengaturan kustom Docker dengan NVIDIA Container Toolkit untuk akses GPU. Arsitektur server API kami dapat berfungsi sebagai implementasi referensi.

Kebanyakan model memerlukan Python 3.10-3.12. Coqui TTS (VITS) secara khusus membutuhkan Python 3.11. Kami merekomendasikan Python 3.12 untuk kebanyakan model. Periksa persyaratan setiap model.txt untuk kompatibilitas versi yang tepat.

MIT dan Apache 2.0 lisensi secara eksplisit memungkinkan penggunaan komersial. Anda dapat membangun produk SaaS, aplikasi seluler, permainan, dan layanan menggunakan model ini tanpa biaya lisensi, royalti, atau persyaratan atribution (meskipun atribution dihargai).

5.0/5 (1)

Coba TTS Sumber Terbuka Dewasa Ini

20+ open-source models, all commercially-licenced. Gunakan API kami atau self-host.

Daftar Bebas Tilik Pricing

Teks Sumber Terbuka kepada Model Pidato

Cobalah Sekarang

Beritahu teman-temanmu!

Manfaat TTS Sumber Terbuka

Semua Lisensi Open-Source

MIT / Apache 2.0

Dapat-Ditempatkan-sendiri

GPU Teroptimasi

Komunitas Dipertahankan

Penggunaan Komersial OK

Katalog Model Sumber Terbuka Kita

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Cara Menggunakan TTS Sumber Terbuka

Jelajahi Model Open-Source

Coba di Peramban Anda

Diri Sendiri-Host atau Gunakan API Kami

Bangun Aplikasi Anda

Perbandingan Lisensi

Self-Hosing vs Hosted API

Diri Sendiri Di Perangkat Keras Anda

Gunakan API TTS.ai Hosted

Quick Start: API atau Self-Host

Open Source, Affordable Pricing

Tier Bebas

Pemulai

Pro

Pertanyaan yang Sering Diajukan

Apakah semua model TTS.ai benar-benar open source?

Apa perbedaan antara lisensi MIT dan Apache 2.0?

Bisakah aku mengurus model ini sendiri di serverku sendiri?

Apa GPU yang saya butuhkan untuk model TTS diri sendiri?

Dapatkah saya fine-tune model TTS open-source?

Bagaimana model TTS open-source dibandingkan dengan layanan komersial?

Apakah ada model dengan lisensi ketat yang harus aku hindari?

Dapatkah saya berkontribusi pada model open-source ini?

Bagaimana cara menjalankan beberapa model pada satu server GPU?

Apakah ada gambar Docker untuk diri-hosting?

Apa versi Python yang saya butuhkan untuk diri-hosting?

Dapatkah saya membangun produk komersial menggunakan model ini?

Coba TTS Sumber Terbuka Dewasa Ini