Lapor Pepijat / Permintaan Ciri

Model Teks ke Tutur Sumber Terbuka

Setiap model TTS pada platform kami adalah sumber terbuka dengan lesen yang mesra komersial. MIT, Apache 2.0 — tiada kuncian hak milik, tiada sekatan penggunaan, tiada bayaran lesen kejutan. Gunakan mereka melalui API kami yang dihost, atau self-host mereka pada infrastruktur anda sendiri dengan kawalan penuh.

Sumber terbuka Lesen MIT Apache Boleh Dihost GitHub

Penyunting TTS Penuh Dokumen API

Cuba Sekarang

Teks
Fail

0/500

Bebas dengan Kokoro, Piper, VITS, MeloTTS

Audio yang dijana akan muncul di sini

Buka editor TTS penuh

Faedah TTS sumber terbuka

Mengapa model sumber terbuka penting untuk projek anda

Semua sumber terbuka dilesenkan

Setiap model di TTS.ai menggunakan lesen sumber terbuka yang membenarkan. Tiada kotak hitam yang dimiliki, tiada vendor yang terkunci, tiada bayaran lesen yang tidak dijangka.

MIT / Apache 2. 0

Model dilesenkan di bawah MIT atau Apache 2.0, lesen sumber terbuka yang paling membenarkan. Guna secara komersial, ubahsuai, tabur semula — tiada sekatan.

Boleh Dihost

Muat turun mana-mana model dan jalankan pada perkakasan anda sendiri. Kawalan penuh ke atas data anda, latensi, dan infrastruktur. Tiada bergantung awan diperlukan.

Dioptimasikan GPU

Model dioptimasikan untuk GPU NVIDIA dengan sokongan CUDA. Piper hanya berjalan pada CPU. Kebanyakan model memerlukan 2-8GB VRAM untuk inferensi yang berkesan.

Komuniti Dijaga

Komuniti sumber terbuka aktif menjaga dan memperbaiki model-model ini. Kontribusi dialu-alukan — hantar pepijat, penambahbaikan, dan suara-suara baru di GitHub.

Penggunaan Komersial OK

Semua model membenarkan penggunaan komersial di bawah lesen mereka. Bina produk, jual perkhidmatan, dan cipta kandungan komersial tanpa royalti atau bayaran penggunaan.

Katalog Model Sumber Terbuka Kami

Setiap model, lesennya, dan apa yang dia lakukan dengan baik.

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Terbaik untuk: Apache 2. 0 — model percuma kualiti terbaik, 82M params, mudah untuk self-host

Cuba Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Terbaik untuk: MIT — CPU sahaja, sempurna untuk peranti tepi dan pengosongan diri terbenam

Cuba Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Terbaik untuk: MIT — arsitektur asas yang digunakan oleh banyak model bawah aliran

Cuba VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Terbaik untuk: MIT — keupayaan penjanaan audio unik melebihi TTS piawai

Cuba Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klon Suara

Terbaik untuk: Apache 2. 0 — kualiti maksimum, pelaksanaan rujukan yang dikaji secara meluas

Cuba Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klon Suara

Terbaik untuk: MIT — klon suara sumber terbuka dengan kawalan gaya granular

Cuba OpenVoice

Bagaimana Menggunakan TTS Sumber Terbuka

Gunakan API kami atau jalankan model sendiri

Jelajahi Model Sumber Terbuka

Layari katalog kami 20+ model TTS sumber terbuka. Setiap halaman model menunjukkan lesen, arsitektur, keupayaan, dan keperluan self-hosting.

Cuba dalam Pelayar Anda

Uji mana-mana model secara langsung pada TTS.ai tanpa memasang apa-apa. Pelayan GPU kami mengendalikan pemprosesan supaya anda boleh menilai kualiti sebelum berkomitmen untuk self-hosting.

Hos Sendiri atau Guna API Kami

Klon repositori model dari GitHub dan jalankan secara setempat, atau gunakan API kami yang dihost untuk pengeluaran. Self-hosting memberikan kawalan penuh; API kami menyediakan infrastruktur yang dikendalikan.

Bina Aplikasi Anda

Integrikan TTS ke dalam produk anda menggunakan model sendiri-dihost atau API REST kami. Semua model boleh digunakan secara komersial tanpa bayaran lesen atau royalti.

Perbandingan Lesen

Semua model pada TTS.ai menggunakan lesen sumber terbuka yang mesra komersial

Model	Lesen	Atribut
Kokoro	Apache 2.0	Diperlukan
Piper	MIT	Opsyenal
VITS	MIT	Opsyenal
MeloTTS	MIT	Opsyenal
Chatterbox	MIT	Opsyenal
Tortoise TTS	Apache 2.0	Diperlukan
StyleTTS 2	MIT	Opsyenal
OpenVoice	MIT	Opsyenal
Sesame CSM	Apache 2.0	Diperlukan
Orpheus	Llama 3.2	"Built with Llama"

Cuba Model-model Ini Secara Percuma

Self-Hosting vs Hosted API

Jalankan model sendiri atau biarkan kami uruskan infrastruktur

Hos-Sendiri pada Perkakasan Anda

Setiap model pada TTS.ai tersedia sebagai projek sumber terbuka pada GitHub atau Hugging Face. Muat turun berat, pasang dependensi, dan jalankan inferensi pada GPU anda sendiri. Anda mempunyai kawalan penuh ke atas latensi, privasi, dan skala.

Privasi data penuh — audio tidak pernah meninggalkan pelayan anda
Tiada kos per-permintaan selepas pemasangan awal
Penyuntingan halus tersendiri pada data anda sendiri
Memerlukan perkakasan GPU (NVIDIA disyorkan)
Anda mengurus kemaskini, penskalaan, dan dependensi

Guna API Dihost TTS.ai

Dapatkan akses segera ke semua 20+ model melalui satu API REST. Kami mengendalikan pemberian GPU, kemaskini model, pengurusan baris gilir, dan penskalaan. Satu kekunci API memberikan anda akses ke setiap model — tidak perlu mengurus pelaksanaan terpisah.

Tiada perkakasan GPU diperlukan
Semua 20+ model melalui satu API
Kemas kini dan penambahbaikan model automatik
Masa operasi 99.9% dengan infrastruktur redundan
Hanya bayar untuk apa yang anda gunakan

Guna API Dihost

Mula Cepat: API atau Host-Sendiri

Guna API kami yang dihost, atau pasang Kokoro secara setempat dalam beberapa minit

Opsyen 1: TTS.ai Hosted API Mudah

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opsyen 2: Hos-Sendiri dengan pip Kawalan Penuh

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Lihat Dokumentasi API

Sumber Terbuka, Harga Murah

API kami menjadikan TTS sumber terbuka boleh diakses tanpa mengurus GPU.

Lapisan Bebas

15 kredit pada pendaftaran

4 model sumber terbuka percuma
Tiada pendaftaran untuk penggunaan asas
Penggunaan komersial dibenarkan

Pelancar

500,000 aksara/bulan

Semua 20+ model sumber terbuka
Klon suara
Akses API

Pro

$29

2,000,000 aksara/bulan

Pemprosesan GPU keutamaan
Semua model premium
Sokongan Enterprise

Lihat Harga Penuh

Soalan Lazim

Soalan biasa mengenai teks-ke-tuturan sumber terbuka

Ya. Setiap model pada TTS.ai menggunakan lesen sumber terbuka yang membenarkan — sama ada MIT atau Apache 2.0. Kami mengecualikan secara khusus model dengan lesen yang membatasi (seperti CPML Coqui atau CC-BY-NC bukan komersial). Anda boleh semak lesen setiap model pada repositori GitHubnya.

Kedua-duanya adalah lesen sumber terbuka yang membenarkan penggunaan komersial, modifikasi, dan penyaluran semula. Apache 2.0 menambahkan pemberian paten yang jelas dan memerlukan menyatakan perubahan jika anda modifikasi kod. MIT lebih mudah dengan kurang keperluan. Kedua-duanya mesra perniagaan.

Ya. Setiap model boleh dihost sendiri. Klon repositori model dari GitHub, pasang dependensi, muat turun berat model, dan jalankan inferensi. Kami menyediakan dokumentasi untuk keperluan self-hosting setiap model termasuk GPU, RAM, dan versi Python.

Keperluan berlainan mengikut model. Piper tidak memerlukan GPU (hanya CPU). Kokoro dan MeloTTS memerlukan 1-2GB VRAM. Kebanyakan model piawai memerlukan 4GB VRAM. Tortoise dan Sesame CSM memerlukan 8GB. NVIDIA RTX 3060 (12GB) boleh menjalankan kebanyakan model dengan selesa.

Ya. Lesen sumber terbuka membenarkan modifikasi termasuk penyelarasan halus. Model seperti GPT-SoVITS dan Bark menyediakan skrip penyelarasan halus. Anda boleh melatih model pada data suara anda sendiri untuk mencipta suara tersendiri atau meningkatkan prestasi untuk bahasa tertentu.

Model sumber terbuka teratas (Kokoro, StyleTTS 2, Chatterbox) kini sepadan atau melebihi perkhidmatan komersial seperti ElevenLabs dan Google TTS dalam penanda aras kualiti. Keuntungan utama perkhidmatan komersial adalah infrastruktur dan sokongan yang dikendalikan, bukan kualiti audio.

Kami telah mengecualikan mereka. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), dan Higgs-v2 (Boson License — restrictive) telah semua dibuang. Setiap model pada TTS.ai telah disahkan selamat untuk digunakan secara komersial.

Ya. Kebanyakan model menerima sumbangan komuniti melalui GitHub. Anda boleh menghantar laporan pepijat, rakaman suara untuk bahasa baru, penambahbaikan kod, dan dokumentasi. Semak repositori GitHub setiap model untuk panduan sumbangan dan isu aktif.

Muatkan model bila-bila masa dan lepaskan apabila kosong untuk berkongsi memori GPU. Pelayan GPU kami menjalankan 20+ model pada 4x Tesla P40 (96GB total VRAM) menggunakan muatan dinamik. Untuk pengosongan-sendiri, satu GPU 24GB boleh melayani 3-5 model secara serentak.

Banyak model menyediakan imej rasmi Docker atau fail Dockerfile. Untuk menjalankan beberapa model, anda boleh bina setup Docker tersendiri dengan NVIDIA Container Toolkit untuk akses GPU. Arsitektur pelayan API kami boleh berfungsi sebagai implementasi rujukan.

Kebanyakan model memerlukan Python 3.10-3.12. Coqui TTS (VITS) secara khusus memerlukan Python 3.11. Kami mengesyorkan Python 3.12 untuk kebanyakan model. Semak requirements.txt setiap model untuk keserasian versi tepat.

Ya. Lesen MIT dan Apache 2.0 secara eksplisit membenarkan penggunaan komersial. Anda boleh bina produk SaaS, aplikasi mudah alih, permainan, dan perkhidmatan menggunakan model ini tanpa bayaran lesen, royalti, atau keperluan atribusi (walaupun atribusi dihargai).

5.0/5 (1)

Cuba TTS sumber terbuka hari ini

20+ model sumber terbuka, semua berlesen komersial. Guna API kami atau self-host — pilihan adalah milik anda.

Daftar Masuk Lihat Harga

Model Teks ke Tutur Sumber Terbuka

Cuba Sekarang

Cinta TTS.ai? Beritahu kawan-kawan anda!

Faedah TTS sumber terbuka

Semua sumber terbuka dilesenkan

MIT / Apache 2. 0

Boleh Dihost

Dioptimasikan GPU

Komuniti Dijaga

Penggunaan Komersial OK

Katalog Model Sumber Terbuka Kami

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Bagaimana Menggunakan TTS Sumber Terbuka

Jelajahi Model Sumber Terbuka

Cuba dalam Pelayar Anda

Hos Sendiri atau Guna API Kami

Bina Aplikasi Anda

Perbandingan Lesen

Self-Hosting vs Hosted API

Hos-Sendiri pada Perkakasan Anda

Guna API Dihost TTS.ai

Mula Cepat: API atau Host-Sendiri

Sumber Terbuka, Harga Murah

Lapisan Bebas

Pelancar

Pro

Soalan Lazim

Adakah semua model TTS.ai benar-benar sumber terbuka?

Apakah perbezaan antara lesen MIT dan Apache 2.0?

Bolehkah saya self-host model ini pada pelayan saya sendiri?

GPU apa yang saya perlukan untuk self-host model TTS?

Bolehkah saya menyesuaikan model TTS sumber terbuka?

Bagaimana model TTS sumber terbuka dibandingkan dengan perkhidmatan komersial?

Adakah terdapat mana-mana model dengan lesen yang terhad yang harus saya elakkan?

Bolehkah saya menyumbang kepada model sumber terbuka ini?

Bagaimana saya jalankan beberapa model pada satu pelayan GPU?

Adakah terdapat imej Docker untuk pengosongan sendiri?

Versi Python mana yang saya perlukan untuk pengosongan diri?

Bolehkah saya bina produk komersial menggunakan model ini?

Cuba TTS sumber terbuka hari ini