Podpiramo EPUB, PDF, DOCX in TXT datoteke. EPUB najbolje deluje, ker ohranja strukturo poglavij. PDF-ji so izvlečeni z razčlenjevanjem besedila (scaned PDFs without intemated texts is not supported). Največja velikost datoteke je 50MB.
Za datoteke EPUB se poglavja odkrijejo samodejno iz strukture e-knjig (vsaka HTML datoteka v EPUB postane poglavje). Za datoteke PDF in TXT zaznavamo poglavja tako, da iščemo skupne vzorce, kot so » Poglavje 1«, »POGLAVJE ONE« ali številke. V ogledu lahko tudi ročno razdelite besedilo.
Stroški temeljijo na številu znakov in modelu TTS, ki ga izberete. Brezplačni modeli (Kokoro, Piper, MeloTTS, in drugi) ne stanejo ničesar. Standardni modeli stanejo 2 znaka na vhodni znak, in premium modeli stane 4 na znak. Tipičen 80.000 besed roman je približno 400 000 znakov – to je 400K znakov na prostem modelu ali 800K na standardu.
Čas obdelave je odvisen od dolžine knjige in modela. Brezplačni modeli, kot so Kokoro so najhitrejši – tipično novo poglavje traja 30-60 sekund. Premium modeli lahko trajajo 2-5 minut na poglavje. Cela knjiga je obdelana po poglavju vzporedno.
Vsako poglavje je ustvarjeno kot ločena MP3 datoteka. Lahko prenesete posamezna poglavja ali vsa poglavja kot ZIP datoteka. To omogoča enostavno nalaganje na predvajalnike zvočnih knjig, telefone ali medijske knjižnice.
Trenutna različica uporablja en glas za celotno knjigo. Za večglasne produkcije z različnimi znaki, uporabite naše Audio Studio orodje, ki podpira glasovno dodelitev po preseku.
Brezplačni uporabniki lahko pretvorijo do 5000 znakov naenkrat. Podpisani uporabniki z znaki lahko pretvorijo knjige do 500.000 znakov (skoraj poln roman). Za daljše delo, razdelite knjigo na dele.
Kokoro (brezplačen) ponuja najboljšo ravnotežje kakovosti in hitrosti za dolgoformne vsebine. Za bolj ekspresivno pripovedovanje, poskusite CosyVoice 2 ali Chatterbox. Tortoise proizvaja najnaravnejši govor, vendar je počasnejši.
Da. Napišite referenčni zvočni posnetek na strani kloniranja glasu, da ustvarite po meri glas, nato ga izberite tukaj. Kloniranje modelov, kot je CosyVoice 2, Chatterbox, in OpenVoice podpira ta delovni tok.
Da. Vsi zvočniki, ki so ustvarjeni na TTS.ai je vaš, da uporabljate komercialno, tudi za distribucijo audioknjig na platformah, kot so zvočni, Google Play Books in Apple Books. Naši modeli uporabljajo permisivne licence odprtega vira (MIT, Apače 2.0).
Izvleči in prikazati naslov knjige in poglavja imena iz e-knjige metapodatke. Prenesene zvočne datoteke so imenovane po poglavju za enostavno organizacijo.
Brez omejitev števila knjig. Edina omejitev je vaše razpoložljive znake. Brezplačen nivo dobi 5000 dnevnih znakov. Plačani načrti se gibljejo od 200.000 (Lite, $5/mo) do 10 000 000 (Poslovno, 99/mo) znakov na mesec.
5.0/5 (1)
Kaj bi lahko izboljšali? Vaša povratna informacija nam pomaga rešiti vprašanja.