Perihal
Platform suara AI sumber terbuka yang paling komprehensif. 20+ model, 100+ suara, semuanya di satu tempat.
Dicipta Oleh
TTS.ai telah dicipta oleh John Nader (nadermx), seorang pemaju bebas yang membina alat AI sumber terbuka. TTS.ai adalah sebahagian daripada misi untuk menjadikan teknologi suara AI terbaik boleh diakses oleh semua orang — tiada penjual terkunci, tiada penanaman data, hanya teknologi suara yang kuat pada harga yang adil.
Misi kami
TTS.ai dibina atas kepercayaan yang mudah: teknologi suara AI yang terbaik sepatutnya boleh diakses oleh semua orang. Semasa perkhidmatan yang dimiliki dikenakan harga premium untuk teks-ke-percakapan asas, komuniti sumber terbuka telah mencipta model yang sepadan atau melebihi kualiti komersial.
Kami menggabungkan model suara AI sumber terbuka terbaik ke dalam satu platform mudah digunakan. Tiada pengecualian vendor. Tiada penanaman data. Hanya teknologi suara yang kuat pada harga yang adil.
Apa yang kami tawarkan
Teks ke Tutur
20+ model termasuk Kokoro, Chatterbox, Bark, dan lebih. Dari sintesis ringan pantas ke output kualiti studio.
Tutur ke Teks
Dikuasakan oleh Whisper, Faster-Whisper, dan SenseVoice. Transkrip audio dalam 100+ bahasa dengan setem masa dan pengesanan pembicara.
Klon Suara
Klon sebarang suara dari sampel 5 saat. Chatterbox, GPT-SoVITS, CosyVoice 2, dan lain-lain. Cipta suara langganan untuk projek anda.
Pemprosesan Audio
Meningkatkan audio, buang vokal, pisahkan batang, buang gema/gemuruh, periksa kekunci/BPM, dan tukar format. Semua dikuasakan oleh AI.
Sembang Suara
Perbualan suara masa nyata dengan AI. Pilih model dan suara anda untuk pengalaman sembang interaktif.
Pembangun
API REST serasi OpenAI. Python SDK, contoh kod, dan dokumentasi komprehensif. Bina ciri suara ke dalam aplikasi anda.
Sumber Terbuka Pertama
Setiap model di TTS.ai adalah sumber terbuka, dilesenkan di bawah MIT atau Apache 2.0.
Kami lakukan.
Semua berat model dimuat turun dari repositori rasmi mereka. Kami tidak menambah sebarang modifikasi hakmilik.
Infrastruktur
TTS.ai berjalan pada pelayan GPU khusus dengan GPU NVIDIA Tesla P40 (jumlah VRAM 96GB). Infrastruktur kami direka untuk latensi rendah dan kelajuan tinggi:
- Kluster GPU khusus untuk inferensi - tiada sumber berkongsi
- Pelantikan GPU dinamik berdasarkan keperluan VRAM model
- Sistem keutamaan baris gilir 5 untuk kelajuan laluan optimum
- Model dipra-muatkan dalam VRAM untuk kesimpulan segera
- Penghantaran audio disokong CDN untuk muat turun pantas
Keselamatan & Privasi
- Tiada latihan data: Kami tidak pernah menggunakan audio atau teks anda untuk melatih model
- Penghapusan automatik: Audio yang dijana dipadam secara automatik selepas 24 jam
- Penyulitan: Semua data disulitkan semasa laluan (TLS 1.2+) dan semasa rehat
- Tiada pengesanan: Kami lakukan.
- Sesuai GDPR: Minta data anda atau padam bila-bila masa