Teks Sumber Terbuka kepada Model Pidato

Semua model TTS pada platform kami adalah open source dengan lisensi yang ramah komersial, MIT, Apache 2.0, tidak ada kunci-in proprietary, tidak ada pembatasan penggunaan, tidak ada biaya lisensi mengejutkan. Gunakan mereka melalui API tuan rumah kami, atau foto diri mereka pada infrastruktur Anda sendiri dengan kontrol penuh.

Sumber Terbuka Lisensi MIT Apache 2.0 Dapat-Ditempatkan-sendiri GitHub

Cobalah Sekarang

Free with Kokoro, Piper, VITS, Melotts
Audio yang dihasilkan Anda akan muncul di sini
Hasilkan
Unduh
Beritahu teman-temanmu!

Manfaat TTS Sumber Terbuka

Mengapa masalah model open-source untuk proyek Anda

Semua Lisensi Open-Source

Setiap model di TTS.ai menggunakan lisensi open-source. tidak ada kotak hitam proprietary, tidak ada kunci-in vendor, tidak ada lisensi yang tak terduga.

MIT / Apache 2.0

Model dilisensikan di bawah MIT atau Apache 2.0, lisensi open-source paling serbaboleh. Gunakan secara komersial, modifikasi, redistribusi ulang tanpa pembatasan.

Dapat-Ditempatkan-sendiri

Mengunduh model apapun dan menjalankannya dengan perangkat keras Anda sendiri. Kendali penuh atas data, latensi, dan infrastruktur Anda. Tidak ada ketergantungan awan yang diperlukan.

GPU Teroptimasi

Model dioptimalkan untuk GPU NVIDIA dengan dukungan CUDA. Piper hanya berjalan pada CPU. Kebanyakan model membutuhkan VRAM 2-8GB untuk inferensi efisien.

Komunitas Dipertahankan

Komunitas open-source aktif memelihara dan meningkatkan model-model ini.

Penggunaan Komersial OK

Semua model memungkinkan penggunaan komersial di bawah lisensi mereka. membangun produk, menjual jasa, dan menciptakan konten komersial tanpa royalti atau biaya penggunaan.

Katalog Model Sumber Terbuka Kita

Setiap model, lisensi, dan apa yang dilakukannya terbaik

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Terbaik untuk: Model bebas kualitas terbaik, params 82M, mudah untuk diri sendiri.

Cobalah Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Terbaik untuk: MIT hanya CPU, sempurna untuk perangkat tepi dan tertanam self-hosting

Cobalah Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Terbaik untuk: MIT ° arsitektur dasar yang digunakan oleh banyak model hilir

Cobalah VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Terbaik untuk: MIT memiliki kemampuan unik pembuatan audio melebihi TTS standar

Cobalah Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Kloning Suara

Terbaik untuk: Apache 2.0 kualitas maksimum, banyak mempelajari implementasi referensi

Cobalah Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Kloning Suara

Terbaik untuk: MIT kloning suara open-source dengan pengendali gaya granular

Cobalah OpenVoice

Cara Menggunakan TTS Sumber Terbuka

Gunakan API host kami atau jalankan model sendiri

1

Jelajahi Model Open-Source

Ramban katalog kami dari 20+ model TTS open-source. Setiap halaman model menunjukkan lisensi, arsitektur, kemampuan, dan persyaratan untuk menentukan diri sendiri.

2

Coba di Peramban Anda

Uji model apapun langsung pada TTS.ai tanpa memasang apa-apa. Server GPU kami menangani pemrosesan sehingga Anda dapat mengevaluasi kualitas sebelum melakukan kebiasaan pribadi.

3

Diri Sendiri-Host atau Gunakan API Kami

Model clone repos dari GitHub dan dijalankan secara lokal, atau menggunakan API kami sebagai hosted production. Self-hosting memberikan kontrol penuh; API kami menyediakan infrastruktur yang dikelola.

4

Bangun Aplikasi Anda

Integrate TTS ke dalam produk Anda menggunakan model berhosted sendiri atau API REST kami. Semua model yang komersial dapat digunakan tanpa lisensi biaya atau royalti.

Perbandingan Lisensi

Semua model di TTS.ai menggunakan lisensi open-source yang ramah secara komersial

Model Lisensi Penggunaan Komersial Modifikasi Diri-Host Attribution
Kokoro Apache 2.0 Diperlukan
Piper MIT Opsional
VITS MIT Opsional
MeloTTS MIT Opsional
Chatterbox MIT Opsional
Tortoise TTS Apache 2.0 Diperlukan
StyleTTS 2 MIT Opsional
OpenVoice MIT Opsional
Sesame CSM Apache 2.0 Diperlukan
Orpheus Llama 3.2 "Built with Llama"

Self-Hosing vs Hosted API

Jalankan model sendiri atau biarkan kami menangani infrastruktur

Diri Sendiri Di Perangkat Keras Anda

Setiap model di TTS.ai tersedia sebagai proyek open-source di GitHub atau Hugging Face. Unduh berat, pasang ketergantungan, dan jalankan inference pada GPU Anda sendiri. Anda memiliki kendali penuh atas latensi, privasi, dan skala.

  • Privasi data penuh audio tidak pernah meninggalkan server Anda
  • Tidak ada biaya per-request setelah setup awal
  • Kustom baik-tuning pada data Anda sendiri
  • Diperlukan perangkat keras GPU (NVIDIA direkomendasikan)
  • Anda mengelola pemutakhiran, penskalaan, dan ketergantungan

Gunakan API TTS.ai Hosted

Dapatkan akses instan ke semua model 20+ melalui API STEST tunggal. Kami menangani penyediaan GPU, pemutakhiran model, pengelolaan antrian, dan penskalaan. Satu kunci API memberi Anda akses ke setiap model ▪ Tidak perlu mengatur penyebaran terpisah.

  • Perangkat keras GPU tidak dibutuhkan
  • Semua model 20+ melalui satu API
  • Pemutakhiran model otomatis dan perbaikan
  • 99,9% uptime dengan infrastruktur berlebihan
  • Bayar saja untuk apa yang Anda gunakan

Quick Start: API atau Self-Host

Gunakan API yang diberi host, atau pasang Kokoro secara lokal dalam menit

Opsi 1: TTS.ai Hosted API Paling mudah
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opsi 2: Self-Host with pip Kendali Penuh
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Open Source, Affordable Pricing

API kami yang diberi host membuat TTS open-source diakses tanpa mengelola GPUs.

Tier Bebas

$0

15.000 karakter pada signup

  • 4 model open-source bebas
  • Tidak ada pendaftaran untuk penggunaan dasar
  • Penggunaan komersial diperbolehkan

Pemulai

$9

500.000 karakter/bulan

  • Semua 20+ model open-source
  • Penklonan Suara
  • Akses API

Pro

$29

2.000.000 karakter/bulan

  • Pemrosesan GPU prioritas
  • Semua model premium
  • Dukungan Enterprise
Lihat Perataan Penuh

Pertanyaan yang Sering Diajukan

Pertanyaan umum tentang teks sumber terbuka ke pidato

Ya, setiap model di TTS.ai menggunakan lisensi open-source yang serbaboleh baik MIT atau Apache 2.0. kita secara khusus mengecualikan model dengan lisensi terbatas (seperti CPML Coqui atau bukan-kommercial CC-BY-NC). Anda dapat memverifikasi lisensi setiap model pada repositori GitHub.

Keduanya adalah lisensi open-source yang mengijinkan penggunaan komersial, modifikasi, dan redistribusi. Apache 2.0 menambahkan hint paten eksplisit dan menyatakan perubahan jika Anda memodifikasi kode. MIT lebih sederhana dengan persyaratan yang lebih sedikit. Keduanya adalah perusahaan-ramah.

Ya. setiap model dapat diklonkan sendiri. clone model repositori dari GitHub, install ketergantungan, unduh berat model, dan jalankan inferensi. kami menyediakan dokumentasi untuk setiap model persyaratan pemhosing termasuk GPU, RAM, dan versi Python.

Permintaan berbeda dengan model. Piper tidak membutuhkan GPU (hanya CPU). Kokoro dan Melottis membutuhkan 1-2GB VRAM kebanyakan model standar membutuhkan 4GB VRAM. Tortoise dan Sesame CSM membutuhkan 8GB. Sebuah NVIDIA RTX 3060 (12GB) dapat menjalankan kebanyakan model dengan nyaman.

Ya. lisensi open-source memungkinkan modifikasi termasuk kualitas-baik. model seperti GPT-SoVIT dan Bark menyediakan skrip yang bagus. anda dapat melatih model-model pada data suara anda sendiri untuk membuat suara-suara atau meningkatkan kinerja untuk bahasa-bahasa tertentu.

Top open-source model (Kokoro, StyleTTS 2, Chatterbox) sekarang cocok atau melebihi layanan komersial seperti ElevenLabs dan Google TTS dalam benchmarks kualitas. Keuntungan utama layanan komersial dikelola infrastruktur dan dukungan, bukan kualitas audio.

XTTS/XTTS-v2 (CPML CPML Coqui), F5-TTS (CC-BY-NC-NC non-komersial), dan Higgs-v2 (Bison License terbatas) semuanya dihapus. Setiap model di TTS.ai diverifikasikan menggunakan aman komersial.

Kebanyakan model menerima kontribusi komunitas melalui GitHub. Anda dapat mengirimkan laporan bug, rekaman suara untuk bahasa baru, peningkatan kode, dan dokumentasi. Periksa repositori GitHub setiap model untuk panduan kontribusi dan isu aktif.

Muat model on-demand dan unload ketika menganggur untuk berbagi memori GPU. Server GPU kami menjalankan 20+ model pada 4x Tesla P40 (96GB total VRAM) menggunakan loading dinamis. Untuk kepemilikan diri sendiri, 24GB GPU dapat melayani 3-5 model secara bersamaan.

Banyak model menyediakan gambar resmi Docker atau Dockerfiles. Untuk menjalankan beberapa model, Anda dapat membangun pengaturan kustom Docker dengan NVIDIA Container Toolkit untuk akses GPU. Arsitektur server API kami dapat berfungsi sebagai implementasi referensi.

Kebanyakan model memerlukan Python 3.10-3.12. Coqui TTS (VITS) secara khusus membutuhkan Python 3.11. Kami merekomendasikan Python 3.12 untuk kebanyakan model. Periksa persyaratan setiap model.txt untuk kompatibilitas versi yang tepat.

MIT dan Apache 2.0 lisensi secara eksplisit memungkinkan penggunaan komersial. Anda dapat membangun produk SaaS, aplikasi seluler, permainan, dan layanan menggunakan model ini tanpa biaya lisensi, royalti, atau persyaratan atribution (meskipun atribution dihargai).
5.0/5 (1)

Umpan balikmu membantu kita memperbaiki masalah.

Coba TTS Sumber Terbuka Dewasa Ini

20+ open-source models, all commercially-licenced. Gunakan API kami atau self-host.