Konwertuj dowolny plik EPUB, PDF lub plik tekstowy do pełnej książki audio z głosami AI. Automatyczne wykrywanie rozdziału, 100+ głosów, bezpłatnie do użycia.
Wspomagamy pliki EPUB, PDF, DOCX i TXT. EPUB działa najlepiej, ponieważ zachowuje strukturę rozdziałów. PDF są wydobywane za pomocą analizy tekstu (skanowane PDF bez tekstu wbudowanego nie są obsługiwane). Maksymalny rozmiar pliku to 50MB.
W przypadku plików EPUB rozdziały są wykryte automatycznie z struktury e-booków (każdy plik HTML w EPUB staje się rozdziałem). Dla plików PDF i TXT wykrywamy rozdziały wyszukiwając wspólne wzory takie jak "rozdział 1", "rozdział ONE" lub numerowane nagłówki. Możesz również ręcznie podzielić tekst w podglądie.
Koszt jest oparta na liczbie znaków i modelu TTS, który wybierasz. Darmowe modele (Kokoro, Piper, Melotts i inne) nic nie kosztują. Modele standardowe kosztują 2 znaki na znak wejściowy, a modele premium kosztują 4 na znak. Typowa powieść o 80 000 słów to około 400 000 znaków - to 400K znaków na bezpłatnym modelu lub 800K na standardzie.
Czas przetwarzania zależy od długości i modelu książki. Darmowe modele takie jak Kokoro są najszybsze – typowy rozdział powieści zajmuje 30-60 sekund. Modele premium mogą trwać 2-5 minut w każdym rozdziale. Cała książka jest przetwarzana po rozdziale równolegle.
Każdy rozdział jest generowany jako oddzielny plik MP3. Możesz pobrać poszczególne rozdziały lub wszystkie rozdziały jako plik ZIP. Ułatwia to załadowanie do odtwarzaczy audiobooków, telefonów lub bibliotek mediów.
Obecna wersja używa pojedynczego głosu dla całej książki. Dla produkcji wielogłosowych z różnymi znakami, użyj naszego Audio Studio narzędzia, które wspiera przydzielanie głosu na sekcję.
Darmowi użytkownicy poziomu mogą konwertować do 5000 znaków naraz. Podpisane użytkowniki z znakami mogą konwertować książki do 500 000 znaków (dokładnie pełna powieść). Dla dłuższych prac, podzielić książkę na części.
Kokoro (bezpłatny) oferuje najlepszą równowagę jakości i prędkości dla zawartości długoformowej. Dla bardziej ekspresyjnej narracji, spróbuj CosyVoice 2 lub Chatterbox. Tortoise produkuje najbardziej naturalnie brzmiące mowy, ale jest wolniej.
Tak. Wyślij klip audio referencyjny na stronie klonowania głosu, aby utworzyć własny głos, a następnie wybierz go tutaj. Klonowanie modeli jak CosyVoice 2, Chatterbox i OpenVoice obsługują ten przepływ roboczy.
Tak. Wszystkie dźwięki wygenerowane na TTS.ai jest Twoje do użytku komercyjnego, w tym do dystrybucji audiobooków na platformach takich jak Ascured, Google Play Books i Apple Books. Nasze modele korzystają z licencji otwartego źródła (MIT, Apache 2.0).
Wydobywamy i wyświetlamy tytuł książki i nazwy rozdziałów z ebook metadanych. Pobierane pliki audio są wymieniane w rozdziale dla łatwej organizacji.
Nie ma ograniczeń w liczbie książek. Jedynym ograniczeniem jest Twoja dostępność znaków. Darmowy poziom otrzymuje 5000 znaków dziennych. Płacone plany wahają się od 200 000 (Lite, $5/mo) do 10 000 000 (Business, 99/mo) znaków miesięcznie.
5.0/5 (1)
Co moglibyśmy ulepszyć? Twoje zwroty zwrotne pomagają nam rozwiązać problemy.