Zgłosić błąd / żądanie funkcji

Przetwarzanie serii TTS

Konwertuj setki tekstów do mowy naraz. Wprowadź wiersze ręcznie lub wyślij arkusz CSV/XLSX, aby wygenerować dźwięk dla każdego wiersza.

Zarejestruj się za darmo

#	Tekst	Głos	Nazwa pliku
1
2
3

Przeciągnij i upuść plik CSV tutaj, lub przeglądaj

CSV z kolumnami: text, voice (opcjonalnie), filename (opcjonalnie)

file.csv

#	Tekst	Głos	Nazwa pliku

Przykład formatu CSV:

text	voice	filename
Witamy w naszej służbie	af_heart	welcome
Twoje zamówienie jest wysłane.		order_shipped
Dziękuję, że zadzwoniłeś.	bf_emma	thanks

Przeciągnij i upuść tutaj plik Excel, lub przeglądaj

XLSX z kolumnami: text, voice (opcjonalnie), filename (opcjonalnie)

file.xlsx

#	Tekst	Głos	Nazwa pliku

Przykład formatu XLSX:

text	voice	filename
Witamy w naszej służbie	af_heart	welcome
Twoje zamówienie jest wysłane.		order_shipped
Dziękuję, że zadzwoniłeś.	bf_emma	thanks

0 elementy gotowe do generowania 0 znaki ogółem

Bezpłatny model Kokoro

Przetwarzanie może zająć kilka minut w przypadku dużych partii

Jak działa

Dodaj teksty

Konfiguracja ustawień

Generuj & pobieranie ZIP

Wyniki serii

#	Nazwa pliku	Status	Działania

Ustawienia serii

Domyślny model

Domyślny głos Używane, gdy wiersz nie wskazuje głosu

Format wyjściowy

Wzór nazwy

Zasługi

Szacunkowy całkowity koszt	0 znaki
Saldo bieżące	Niezalogowany

Potrzebujesz więcej postaci?

Wskazówki do przetwarzania serii

Użyj CSV dla pozycji 100+ dla najszybszego przepływu pracy
Każdy wiersz generuje jeden plik audio
Maksymalnie 500 pojemników na serię
Czas przetwarzania zależy od całkowitej długości tekstu
Pozostaw kolumnę głosową pustą, aby użyć domyślnego głosu
Pobrany ZIP zachowuje wzór nazwy

Jak działa

Generowanie audio dla setek tekstów w trzech prostych krokach. Nie jest wymagane znajomość skryptów ani API.

Krok 1

Dodaj teksty

Wprowadź teksty ręcznie jeden wiersz na raz, lub wysyłaj arkusz CSV lub XLSX. Każdy wiersz staje się jednym plikiem audio. Opcjonalnie określ nazwę głosu i nazwę pliku w rzędzie dla pełnej kontroli nad każdym wyjściem.

Krok 2

Konfiguracja ustawień

Wybierz domyślny model i głos AI, który ma zastosowanie do wszystkich wiersz bez określonego głosu. Wybierz swój format wyjściowy (MP3 lub WAV) i ustaw wzór nazwy: użyj kolumny nazwy pliku, numerów sekwencyjnych lub własnych prefiksów.

Krok 3

Generuj & pobieranie ZIP

Kliknij Generuj wszystkie i obserwuj postęp w czasie rzeczywistym, gdy każdy wiersz jest przetwarzany. Odtwarzaj lub pobieraj indywidualne wyniki lub pobieraj wszystko na raz jako jeden ZIP archiwum. Niepowodzenie elementów może być ponownie próbowane indywidualnie.

Przypadki użytkowania serii TTS

Przetwarzanie partii oszczędza godziny powtarzającej się pracy w całej edukacji, telefonii, handlu elektronicznego i lokalizacji treści.

Moduły e-uczenia

Generuj narrację dla wszystkich kursów naraz. Wyślij arkusz skryptów lekcji i wyprodukuj spójne, profesjonalne audio we wszystkich modułach bez nagrywania jednego słowa ręcznie.

Zapytania IVR

Tworzysz wszystkie swoje systemy telefoniczne w jednej partii. Opcje menu, przetrzymywanie wiadomości, po godzinach powitania i transfery departamentów -- generuj setki pytań z konsekwentnym głosem i tonem.

Opis produktu

Włącz katalog produktu do opisów audio dla dostępności, inteligentnych głośników lub kiosków in-store. Eksportuj swój produkt CSV i wygeneruj jeden plik audio na jeden element z odpowiednimi nazwami plików.

Lokalizacja

Przetłumacz swoje UI struny lub zawartość na wiele języków, następnie serial-generate audio dla każdej lokalizacji. Idealne dla aplikacji, gier i stron internetowych, które potrzebują lokalizowanych pytań głosowych lub narracji.

Katalogi audio

Budowa wyszukiwanych bibliotek audio z ustrukturyzowanych danych. Muzea, biblioteki i archiwa mogą konwertować metadane, opisy lub transkrypty na przewodniki audio z przetwarzaniem partii.

Dźwięki powiadomień

Generuj pełny zbiór powiadomień, alarmu i potwierdzenia głosu dla aplikacji lub urządzenia. Wyślij listę krótkich wiadomości i pobierz ZIP plików audio gotowych do integracji.

Funkcje przetwarzania serii

Wszystko, czego potrzebujesz, aby przetwarzać duże ilości tekst-to-speech efektywnie i niezawodnie.

Import CSV & XLSX

Wysyłanie arkuszu do Twojego tekstu i system przeanalizuje go automatycznie. Pierwszą kolumną jest tekst do konwersji, a opcjonalne kolumny pozwalają określić głos i nazwę pliku w wierszu. Podtrzymuje standardowe CSV z przecinkami przecinkami lub średnikiem, jak również pliki Excel XLSX. Zagłówki są automatycznie wykrywane, tak że kolejność kolumn nie ma znaczenia.

Kontrola głosu na prawo

Przypisz inny głos do każdego wiersza, aby uzyskać maksymalną elastyczność. Użyj kolumny głosowej w arkuszu lub spadku w trybie ręcznym. Wiersze bez określonego głosu automatycznie używają domyślnego głosu z ustawień partii. Mieszają i pasują do głosów w jednej partii, aby utworzyć zróżnicowane, naturalnie dźwiękowe zestawy audio.

Śledzenie postępów

Obserwuj w czasie rzeczywistym pasek postępów i aktualizacje statusu na rzędzie, gdy Twoja partia jest przetwarzana. Każdy wiersz przechodzi przez kolejkę, przetwarzanie, zakończenie i nieudane stany. Tabela wyników na żywo, tak że możesz rozpocząć podgląd zakończonych plików audio, podczas gdy reszta partii wciąż generuje. Nieudane elementy wyświetlają dane o błędach i mogą być ponownie próbowane.

Eksport ZIP

Pobierz wszystkie generowane pliki audio jako pojedynczy archiwum ZIP jednym kliknięciem. Pliki są nazwane zgodnie z wybranym wzorem nazwy: oryginalne nazwy plików z arkuszu, numery sekwencyjne (001. mp3, 002. mp3) lub własnym prefixem plus numer. ZIP zachowuje porządek wierszy wejściowych dla łatwego powrotu do danych źródłowych.

Często zadawane pytania

Przetwarzanie partii pozwala na konwersję wielu tekstów do mowy naraz. Wyślij arkusz CSV lub XLSX z swoimi tekstami, wybierz głosy i ustawienia i wygeneruj dźwięk dla każdego wiersza. Pobierz wszystkie wyniki jako plik ZIP.

Twoja CSV powinna posiadać co najmniej kolumnę "text". Opcjonalne kolumny: "glas" (identyfikator głosu), "filename" (nazwisko wyjściowe), "model" (model TTS). Jeśli nie są określone kolumny głosu/modelu w wierszu, używane są domyślne ustawienia.

Do 500 pozycji na partię. Dla większych partii, podzielić swój CSV na wiele plików. Każdy element jest przetwarzany niezależnie, więc awaria w jednym wierszu nie wpływa na inne.

Tak. Dodaj do Twojego CSV kolumnę "głosu" z identyfikatorem głosu dla każdego wiersza. Wiersze bez podanego głosu będą używać domyślnego głosu z panelu ustawień partii.

Czas przetwarzania zależy od całkowitej długości tekstu i zastosowanego modelu. Kokoro przetwarza około 100 wierszy (500 znaków każda) w około 2 minuty. Powolniejsze modele jak Tortoise zajmą dłużej.

Tak. Interfejs pokazuje pasek postępu i status per- row (przetworzony, przetwarzany, zakończony, nieudany). Wyniki można zobaczyć w czasie rzeczywistym i rozpocząć pobieranie zakończonych plików przed zakończeniem partii.

Wybierz MP3 lub WAV jako format wyjściowy. Wszystkie pliki w partii używają tego samego formatu. Pobierz pojedyncze pliki lub wszystkie wyniki jako jeden ZIP archiwum.

Domyślnie pliki są numerowane sekwencyjnie (001. mp3, 002. mp3,...). Możesz podać własne nazwy plików za pomocą kolumny "filename" CSV lub ustawić w ustawieniach wzór prefiksu.

Tak. Przekazywanie indywidualnych TTS zapytania do naszego API równolegle. Każdy zwraca UUID do ankietowania. Dla wygody, narzędzie serii internetowej obsługuje orkiestrację, paralelizm i opakowania ZIP dla Ciebie.

E-learning training narration (jeden wiersz na slajd), IVR system telefoniczny pytania, opis produktu audio, dźwięki notyfikacji aplikacji, wielojęzyczna lokalizacja treści i dostępność audio dla dużych bibliotek treści.

Te same stawki, co indywidualne modele TTS. Free-tier (Kokoro, Piper) nie dysponują dodatkiem premiowym i czerpają darmowy dodatek. Modele standardowe używają znaków 2x, a modele premium używają 4x znaków. Narzędzie partii pokazuje szacunkowy koszt całkowity przed rozpoczęciem.

Tak. Po zakończeniu partii, nieudane wiersze są oznaczone komunikatem o błędzie. Możesz powtórzyć nieudane elementy indywidualnie lub filtrować, aby ponownie przerobić wszystkie awarie jednym kliknięciem.

5.0/5 (1)

Przetwarzanie setek tekstów na raz

Wyślij arkusz i wygeneruj dźwięk dla każdego wiersza. Idealny dla e-learningu, IVR i lokalizacji.

Zarejestruj się za darmo Widok Cennik

Przetwarzanie serii TTS

Jak działa

Ustawienia serii

Zasługi

Wskazówki do przetwarzania serii

Jak działa

Dodaj teksty

Konfiguracja ustawień

Generuj & pobieranie ZIP

Przypadki użytkowania serii TTS

Moduły e-uczenia

Zapytania IVR

Opis produktu

Lokalizacja

Katalogi audio

Dźwięki powiadomień

Funkcje przetwarzania serii

Import CSV & XLSX

Kontrola głosu na prawo

Śledzenie postępów

Eksport ZIP

Często zadawane pytania

Co to jest przetwarzanie serii TTS?

Jaki format CSV jest oczekiwany?

Ile przedmiotów mogę przerobić w jednej partii?

Czy mogę przypisać różne głosy w jednym rzędzie?

Ile czasu trwa przetwarzanie serii?

Czy mogę śledzić postępy podczas przetwarzania?

Jakie formaty wyjściowe są dostępne?

Jak nazywa się pliki wyjściowe?

Czy przetwarzanie partii jest dostępne za pośrednictwem API?

Jakie są powszechne przypadki stosowania serii TTS?

Ile kosztuje przetwarzanie partii?

Czy mogę ponownie przeprowadzić nieudane elementy?

Przetwarzanie setek tekstów na raz