Podporujeme EPUB, PDF, DOCX a TXT soubory. EPUB funguje nejlépe proto, že zachovává strukturu kapitol. PDF jsou extrahovány pomocí textového parsingu (skenované PDF bez vloženého textu nejsou podporovány). Maximální velikost souboru je 50MB.
U souborů EPUB jsou kapitoly automaticky detekovány ze struktury ebooku (každý HTML soubor v EPUB se stane kapitolou). Pro soubory PDF a TXT detekujeme kapitoly hledáním běžných vzorů, jako je "Kapitola 1," "Kategorie ONE," nebo číslovaných čísel. V náhledu můžete také ručně rozdělit text.
Cena je založena na počtu znaků a model TTS si vyberete. Volné modely (Kokoro, Piper, Melotts, a další) nic nestojí. Standardní modely stojí 2 znaky na vstupní znak, a prémiové modely stojí 4 na znak. Typický 80.000-slovo román je zhruba 400.000 znaků, což je 400K chars na bezplatném modelu nebo 800K na standardní úrovni.
Doba zpracování závisí na délce knihy a modelu. Volné modely, jako je Kokoro, jsou nejrychlejší a typická nová kapitola trvá 30-60 sekund. Premium modely mohou trvat 2-5 minut za kapitolu. Celá kniha je zpracována kapitola po kapitole paralelně.
Každá kapitola je generována jako samostatný MP3 soubor. Můžete si stáhnout jednotlivé kapitoly nebo všechny kapitoly jako soubor ZIP. Díky tomu je snadné načíst do audioknih přehrávačů, telefonů nebo mediálních knihoven.
Současná verze používá jeden hlas pro celou knihu. Pro multi-hlasové produkce s různými znaky, použijte náš Audio Studio nástroj, který podporuje per-sekce hlasové přiřazení.
Uživatelé volné úrovně mohou převést až 5,000 znaků najednou. Uživatelé s znaky mohou převést knihy až 500,000 znaků (zhruba plný román). Pro delší práce, rozdělit knihu na části.
Kokoro (zdarma) nabízí nejlepší rovnováhu kvality a rychlosti pro obsah dlouhé formy. Pro více expresivní vyprávění, zkuste CosyVoice 2 nebo Chatterbox. Tortoise produkuje nejpřirozenější zvuk řeči, ale je pomalejší.
Ano. Nahrajte referenční audio klip na stránce klonování hlasu vytvořit vlastní hlas, pak jej vyberte zde. Klonování modely, jako CosyVoice 2, Chatterbox, a OpenVoice podporují tento workflow.
Ano. Všechny audio generované na TTS.ai je vaše používat komerčně, včetně pro distribuci audioknih na platformách, jako jsou Audible, Google Play Books, a Apple Books. Naše modely používají povolné open-source licence (MIT, Apache 2.0).
Získáváme a zobrazujeme název knihy a názvy kapitol z ebook metadat. Stažené zvukové soubory jsou pojmenovány podle kapitoly pro snadnou organizaci.
Bez omezení na počet knih. Jediným omezením je vaše volné znaky. Free tier dostane 5,000 denních znaků. Placené plány se pohybují od 200,000 (Lite, $5/mo) do 10,000,000 (Business, $ 99/mo) znaků za měsíc.
5.0/5 (1)
Co bychom mohli zlepšit? Vaše zpětná vazba nám pomáhá řešit problémy.
Připraveni začít?
Zaregistrujte se zdarma a získejte 15,000 znaků. Není vyžadována kreditní karta.