Kami menyokong fail EPUB, PDF, DOCX, dan TXT. EPUB berfungsi dengan baik kerana ia melestarikan struktur bab. PDF diekstrak menggunakan penghuraian teks (PDF diimbas tanpa teks terbenam tidak disokong). Saiz fail maksimum ialah 50MB.
Bagi fail EPUB, bab dikesan secara automatik dari struktur ebook (tiap fail HTML dalam EPUB menjadi bab). Bagi fail PDF dan TXT, kami mengesan bab dengan mencari corak biasa seperti "Bab 1", "BAB 1", atau pengepala bernombor. Anda juga boleh pisahkan teks secara manual dalam pralihat.
Kos adalah berdasarkan bilangan aksara dan model TTS yang anda pilih. Model percuma (Kokoro, Piper, MeloTTS, dan lain-lain) tidak kos apa-apa. Model piawai kos 2 aksara per aksara input, dan model premium kos 4 aksara per aksara. Novel 80,000 perkataan biasa adalah kira-kira 400,000 aksara — iaitu 400K aksara pada model percuma atau 800K pada piawai.
Masa pemprosesan bergantung pada panjang buku dan model. Model percuma seperti Kokoro adalah paling pantas — bab novel biasa mengambil masa 30-60 saat. Model premium mungkin mengambil masa 2-5 minit setiap bab. Seluruh buku diproses bab demi bab secara serentak.
Setiap bab dijana sebagai fail MP3 terpisah. Anda boleh muat turun bab individu atau semua bab sebagai fail ZIP. Ini menjadikannya mudah untuk dimuatkan ke pemain buku audio, telefon, atau pustaka media.
Versi semasa menggunakan satu suara untuk keseluruhan buku. Untuk produksi berbilang suara dengan watak yang berbeza, gunakan alat Audio Studio kami yang menyokong tugasan suara per-seksyen.
Pengguna peringkat percuma boleh menukar sehingga 5,000 aksara pada satu masa. Pengguna yang log masuk dengan aksara boleh menukar buku sehingga 500,000 aksara (kira-kira novel penuh). Untuk kerja yang lebih panjang, pisahkan buku menjadi bahagian.
Kokoro (percuma) menawarkan keseimbangan terbaik kualiti dan kelajuan untuk kandungan bentuk panjang. Untuk naratif yang lebih ekspresif, cuba CosyVoice 2 atau Chatterbox. Tortoise menghasilkan ucapan yang paling berbunyi semulajadi tetapi lebih perlahan.
Ya. Muat naik klip audio rujukan pada halaman klon suara untuk mencipta suara tersendiri, kemudian pilihnya di sini. Model klon seperti CosyVoice 2, Chatterbox, dan OpenVoice menyokong aliran kerja ini.
Ya. Semua audio yang dihasilkan pada TTS.ai adalah milik anda untuk digunakan secara komersial, termasuk untuk pemisahan buku audio pada platform seperti Audible, Google Play Books, dan Apple Books. Model kami menggunakan lesen sumber terbuka yang membenarkan (MIT, Apache 2.0).
Kami mengekstrak dan memaparkan tajuk buku dan nama bab dari metadata ebook. Fail audio yang dimuat turun dinamakan mengikut bab untuk pengorganisasian mudah.
Tiada had bagi bilangan buku. Satu-satunya had adalah aksara yang ada. Tahap percuma mendapat 5,000 aksara sehari. Rancangan berbayar berkisar dari 200,000 (Lite, $5/mo) hingga 10,000,000 (Business, $99/mo) aksara per bulan.
5.0/5 (1)
Apa yang boleh kami perbaiki?
Sedia untuk mula?
Daftar percuma dan dapatkan 15,000 aksara. Tiada kad kredit diperlukan.