Model Teks ke Tutur Sumber Terbuka

Setiap model TTS pada platform kami adalah sumber terbuka dengan lesen yang mesra komersial. MIT, Apache 2.0 — tiada kuncian hak milik, tiada sekatan penggunaan, tiada bayaran lesen kejutan. Gunakan mereka melalui API kami yang dihost, atau self-host mereka pada infrastruktur anda sendiri dengan kawalan penuh.

Sumber terbuka Lesen MIT Apache Boleh Dihost GitHub

Cuba Sekarang

Bebas dengan Kokoro, Piper, VITS, MeloTTS
Audio yang dijana akan muncul di sini
Dijana
Muat turun
Cinta TTS.ai? Beritahu kawan-kawan anda!

Faedah TTS sumber terbuka

Mengapa model sumber terbuka penting untuk projek anda

Semua sumber terbuka dilesenkan

Setiap model di TTS.ai menggunakan lesen sumber terbuka yang membenarkan. Tiada kotak hitam yang dimiliki, tiada vendor yang terkunci, tiada bayaran lesen yang tidak dijangka.

MIT / Apache 2. 0

Model dilesenkan di bawah MIT atau Apache 2.0, lesen sumber terbuka yang paling membenarkan. Guna secara komersial, ubahsuai, tabur semula — tiada sekatan.

Boleh Dihost

Muat turun mana-mana model dan jalankan pada perkakasan anda sendiri. Kawalan penuh ke atas data anda, latensi, dan infrastruktur. Tiada bergantung awan diperlukan.

Dioptimasikan GPU

Model dioptimasikan untuk GPU NVIDIA dengan sokongan CUDA. Piper hanya berjalan pada CPU. Kebanyakan model memerlukan 2-8GB VRAM untuk inferensi yang berkesan.

Komuniti Dijaga

Komuniti sumber terbuka aktif menjaga dan memperbaiki model-model ini. Kontribusi dialu-alukan — hantar pepijat, penambahbaikan, dan suara-suara baru di GitHub.

Penggunaan Komersial OK

Semua model membenarkan penggunaan komersial di bawah lesen mereka. Bina produk, jual perkhidmatan, dan cipta kandungan komersial tanpa royalti atau bayaran penggunaan.

Katalog Model Sumber Terbuka Kami

Setiap model, lesennya, dan apa yang dia lakukan dengan baik.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Terbaik untuk: Apache 2. 0 — model percuma kualiti terbaik, 82M params, mudah untuk self-host

Cuba Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Terbaik untuk: MIT — CPU sahaja, sempurna untuk peranti tepi dan pengosongan diri terbenam

Cuba Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Terbaik untuk: MIT — arsitektur asas yang digunakan oleh banyak model bawah aliran

Cuba VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Terbaik untuk: MIT — keupayaan penjanaan audio unik melebihi TTS piawai

Cuba Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klon Suara

Terbaik untuk: Apache 2. 0 — kualiti maksimum, pelaksanaan rujukan yang dikaji secara meluas

Cuba Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klon Suara

Terbaik untuk: MIT — klon suara sumber terbuka dengan kawalan gaya granular

Cuba OpenVoice

Bagaimana Menggunakan TTS Sumber Terbuka

Gunakan API kami atau jalankan model sendiri

1

Jelajahi Model Sumber Terbuka

Layari katalog kami 20+ model TTS sumber terbuka. Setiap halaman model menunjukkan lesen, arsitektur, keupayaan, dan keperluan self-hosting.

2

Cuba dalam Pelayar Anda

Uji mana-mana model secara langsung pada TTS.ai tanpa memasang apa-apa. Pelayan GPU kami mengendalikan pemprosesan supaya anda boleh menilai kualiti sebelum berkomitmen untuk self-hosting.

3

Hos Sendiri atau Guna API Kami

Klon repositori model dari GitHub dan jalankan secara setempat, atau gunakan API kami yang dihost untuk pengeluaran. Self-hosting memberikan kawalan penuh; API kami menyediakan infrastruktur yang dikendalikan.

4

Bina Aplikasi Anda

Integrikan TTS ke dalam produk anda menggunakan model sendiri-dihost atau API REST kami. Semua model boleh digunakan secara komersial tanpa bayaran lesen atau royalti.

Perbandingan Lesen

Semua model pada TTS.ai menggunakan lesen sumber terbuka yang mesra komersial

Model Lesen Penggunaan Komersial Pengubahsuaian Hos-Sendiri Atribut
Kokoro Apache 2.0 Diperlukan
Piper MIT Opsyenal
VITS MIT Opsyenal
MeloTTS MIT Opsyenal
Chatterbox MIT Opsyenal
Tortoise TTS Apache 2.0 Diperlukan
StyleTTS 2 MIT Opsyenal
OpenVoice MIT Opsyenal
Sesame CSM Apache 2.0 Diperlukan
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs Hosted API

Jalankan model sendiri atau biarkan kami uruskan infrastruktur

Hos-Sendiri pada Perkakasan Anda

Setiap model pada TTS.ai tersedia sebagai projek sumber terbuka pada GitHub atau Hugging Face. Muat turun berat, pasang dependensi, dan jalankan inferensi pada GPU anda sendiri. Anda mempunyai kawalan penuh ke atas latensi, privasi, dan skala.

  • Privasi data penuh — audio tidak pernah meninggalkan pelayan anda
  • Tiada kos per-permintaan selepas pemasangan awal
  • Penyuntingan halus tersendiri pada data anda sendiri
  • Memerlukan perkakasan GPU (NVIDIA disyorkan)
  • Anda mengurus kemaskini, penskalaan, dan dependensi

Guna API Dihost TTS.ai

Dapatkan akses segera ke semua 20+ model melalui satu API REST. Kami mengendalikan pemberian GPU, kemaskini model, pengurusan baris gilir, dan penskalaan. Satu kekunci API memberikan anda akses ke setiap model — tidak perlu mengurus pelaksanaan terpisah.

  • Tiada perkakasan GPU diperlukan
  • Semua 20+ model melalui satu API
  • Kemas kini dan penambahbaikan model automatik
  • Masa operasi 99.9% dengan infrastruktur redundan
  • Hanya bayar untuk apa yang anda gunakan

Mula Cepat: API atau Host-Sendiri

Guna API kami yang dihost, atau pasang Kokoro secara setempat dalam beberapa minit

Opsyen 1: TTS.ai Hosted API Mudah
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opsyen 2: Hos-Sendiri dengan pip Kawalan Penuh
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Sumber Terbuka, Harga Murah

API kami menjadikan TTS sumber terbuka boleh diakses tanpa mengurus GPU.

Lapisan Bebas

$0

15 kredit pada pendaftaran

  • 4 model sumber terbuka percuma
  • Tiada pendaftaran untuk penggunaan asas
  • Penggunaan komersial dibenarkan

Pelancar

$9

500,000 aksara/bulan

  • Semua 20+ model sumber terbuka
  • Klon suara
  • Akses API

Pro

$29

2,000,000 aksara/bulan

  • Pemprosesan GPU keutamaan
  • Semua model premium
  • Sokongan Enterprise
Lihat Harga Penuh

Soalan Lazim

Soalan biasa mengenai teks-ke-tuturan sumber terbuka

Ya. Setiap model pada TTS.ai menggunakan lesen sumber terbuka yang membenarkan — sama ada MIT atau Apache 2.0. Kami mengecualikan secara khusus model dengan lesen yang membatasi (seperti CPML Coqui atau CC-BY-NC bukan komersial). Anda boleh semak lesen setiap model pada repositori GitHubnya.

Kedua-duanya adalah lesen sumber terbuka yang membenarkan penggunaan komersial, modifikasi, dan penyaluran semula. Apache 2.0 menambahkan pemberian paten yang jelas dan memerlukan menyatakan perubahan jika anda modifikasi kod. MIT lebih mudah dengan kurang keperluan. Kedua-duanya mesra perniagaan.

Ya. Setiap model boleh dihost sendiri. Klon repositori model dari GitHub, pasang dependensi, muat turun berat model, dan jalankan inferensi. Kami menyediakan dokumentasi untuk keperluan self-hosting setiap model termasuk GPU, RAM, dan versi Python.

Keperluan berlainan mengikut model. Piper tidak memerlukan GPU (hanya CPU). Kokoro dan MeloTTS memerlukan 1-2GB VRAM. Kebanyakan model piawai memerlukan 4GB VRAM. Tortoise dan Sesame CSM memerlukan 8GB. NVIDIA RTX 3060 (12GB) boleh menjalankan kebanyakan model dengan selesa.

Ya. Lesen sumber terbuka membenarkan modifikasi termasuk penyelarasan halus. Model seperti GPT-SoVITS dan Bark menyediakan skrip penyelarasan halus. Anda boleh melatih model pada data suara anda sendiri untuk mencipta suara tersendiri atau meningkatkan prestasi untuk bahasa tertentu.

Model sumber terbuka teratas (Kokoro, StyleTTS 2, Chatterbox) kini sepadan atau melebihi perkhidmatan komersial seperti ElevenLabs dan Google TTS dalam penanda aras kualiti. Keuntungan utama perkhidmatan komersial adalah infrastruktur dan sokongan yang dikendalikan, bukan kualiti audio.

Kami telah mengecualikan mereka. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), dan Higgs-v2 (Boson License — restrictive) telah semua dibuang. Setiap model pada TTS.ai telah disahkan selamat untuk digunakan secara komersial.

Ya. Kebanyakan model menerima sumbangan komuniti melalui GitHub. Anda boleh menghantar laporan pepijat, rakaman suara untuk bahasa baru, penambahbaikan kod, dan dokumentasi. Semak repositori GitHub setiap model untuk panduan sumbangan dan isu aktif.

Muatkan model bila-bila masa dan lepaskan apabila kosong untuk berkongsi memori GPU. Pelayan GPU kami menjalankan 20+ model pada 4x Tesla P40 (96GB total VRAM) menggunakan muatan dinamik. Untuk pengosongan-sendiri, satu GPU 24GB boleh melayani 3-5 model secara serentak.

Banyak model menyediakan imej rasmi Docker atau fail Dockerfile. Untuk menjalankan beberapa model, anda boleh bina setup Docker tersendiri dengan NVIDIA Container Toolkit untuk akses GPU. Arsitektur pelayan API kami boleh berfungsi sebagai implementasi rujukan.

Kebanyakan model memerlukan Python 3.10-3.12. Coqui TTS (VITS) secara khusus memerlukan Python 3.11. Kami mengesyorkan Python 3.12 untuk kebanyakan model. Semak requirements.txt setiap model untuk keserasian versi tepat.

Ya. Lesen MIT dan Apache 2.0 secara eksplisit membenarkan penggunaan komersial. Anda boleh bina produk SaaS, aplikasi mudah alih, permainan, dan perkhidmatan menggunakan model ini tanpa bayaran lesen, royalti, atau keperluan atribusi (walaupun atribusi dihargai).
5.0/5 (1)

Apa yang boleh kami perbaiki?

Cuba TTS sumber terbuka hari ini

20+ model sumber terbuka, semua berlesen komersial. Guna API kami atau self-host — pilihan adalah milik anda.