Aħna nappoġġjaw fajls EPUB, PDF, DOCX, u TXT. EPUB jaħdem l-aħjar għax jippreserva l-istruttura tal-kapitolu. Il-PDFs huma estratti bl-użu tal-parsing tat-test (PDFs skenjati mingħajr test inkorporat mhumiex appoġġjati).
Għal fajls EPUB, il-kapitoli jinstabu awtomatikament mill-istruttura tal-ktieb elettroniku (kull fajl HTML fl-EPUB isir kapitolu). Għal fajls PDF u TXT, insibu l-kapitoli billi nfittxu mudelli komuni bħal "Kapitolu 1", "KAPITOLU ONE", jew intestaturi nnumerati.
L-ispiża hija bbażata fuq l-għadd tal-karattri u l-mudell TTS li tagħżel. Mudelli ħielsa (Kokoro, Piper, MeloTTS, u oħrajn) ma jiswew xejn. Mudelli standard jiswew 2 karattri għal kull karattru input, u mudelli premium jiswew 4 għal kull karattru.
Il-ħin tal-ipproċessar jiddependi fuq it-tul tal-ktieb u l-mudell. Mudelli b'xejn bħal Kokoro huma l-aktar mgħaġġla — kapitolu tipiku tar-rumanz jieħu 30-60 sekonda. Mudelli premium jistgħu jieħdu 2-5 minuti għal kull kapitolu. Il-ktieb kollu jiġi pproċessat kapitolu b'kapitolu b'mod parallel.
Kull kapitolu jiġi ġġenerat bħala fajl MP3 separat. Tista’ tniżżel kapitoli individwali jew il-kapitoli kollha bħala fajl ZIP. Dan jagħmilha faċli biex titniżżel fuq plejers tal-awdjoktieb, mowbajls, jew libreriji tal-midja.
Il-verżjoni kurrenti tuża vuċi waħda għall-ktieb kollu, iżda jekk trid tagħmel produzzjonijiet b’ħafna vuċijiet u b’karattri differenti, uża l-għodda Audio Studio tagħna li tappoġġja l-assenjazzjoni tal-vuċijiet għal kull taqsima.
L-utenti b'xejn jistgħu jikkonvertu sa 5,000 karattru f'daqqa. L-utenti li jkunu ffirmaw u jkollhom karattri jistgħu jikkonvertu kotba sa 500,000 karattru (bejn wieħed u ieħor rumanz sħiħ).
Kokoro (b'xejn) joffri l-aħjar bilanċ bejn il-kwalità u l-veloċità għal kontenut twil.Għal narrattiva aktar espressiva, ipprova CosyVoice 2 jew Chatterbox. Tortoise jipproduċi l-aktar diskors naturali iżda huwa aktar bil-mod.
Iva. Upload referenza awdjo clip fuq il-paġna klonazzjoni vuċi biex toħloq vuċi tad-dwana, imbagħad agħżel dan hawn. klonazzjoni mudelli bħal CosyVoice 2, Chatterbox, u OpenVoice jappoġġjaw dan il-fluss tax-xogħol.
Iva. L-awdjo kollu ġġenerat fuq TTS.ai huwa tiegħek biex tużah kummerċjalment, inkluż għad-distribuzzjoni tal-awdjoktieb fuq pjattaformi bħal Audible, Google Play Books, u Apple Books. Il-mudelli tagħna jużaw liċenzji permissivi open-source (MIT, Apache 2.0).
Aħna estratt u juru l-titolu tal-ktieb u l-ismijiet kapitolu mill-metadata ebook.The fajls awdjo mniżżla huma msemmija mill-kapitolu għall-organizzazzjoni faċli.
L-ebda limitu fuq in-numru ta' kotba. L-unika restrizzjoni hija l-karattri disponibbli tiegħek. Livell Ħieles ikollu 5,000 karattru kuljum. Pjanijiet imħallsa jvarjaw minn 200,000 (Lite, $ 5/mo) sa 10,000,000 (Negozju, $ 99/mo) karattri fix-xahar.