Przetwarzanie serii TTS

Konwertuj setki tekstów do mowy naraz. Wprowadź wiersze ręcznie lub wyślij arkusz CSV/XLSX, aby wygenerować dźwięk dla każdego wiersza.

# Tekst Głos Nazwa pliku
1
2
3

Przeciągnij i upuść plik CSV tutaj, lub przeglądaj

CSV z kolumnami: text, voice (opcjonalnie), filename (opcjonalnie)
file.csv
# Tekst Głos Nazwa pliku
Przykład formatu CSV:
textvoicefilename
Witamy w naszej służbieaf_heartwelcome
Twoje zamówienie jest wysłane.order_shipped
Dziękuję, że zadzwoniłeś.bf_emmathanks

Przeciągnij i upuść tutaj plik Excel, lub przeglądaj

XLSX z kolumnami: text, voice (opcjonalnie), filename (opcjonalnie)
file.xlsx
# Tekst Głos Nazwa pliku
Przykład formatu XLSX:
textvoicefilename
Witamy w naszej służbieaf_heartwelcome
Twoje zamówienie jest wysłane.order_shipped
Dziękuję, że zadzwoniłeś.bf_emmathanks
0 elementy gotowe do generowania 0 znaki ogółem
Bezpłatny model Kokoro
Przetwarzanie może zająć kilka minut w przypadku dużych partii
Przetwarzanie 0 / 0... 0%
Wyniki serii
# Nazwa pliku Status Działania

Ustawienia serii

Używane, gdy wiersz nie wskazuje głosu

Zasługi

Szacunkowy całkowity koszt 0 znaki
Saldo bieżące Niezalogowany
Potrzebujesz więcej postaci?

Wskazówki do przetwarzania serii

  • Użyj CSV dla pozycji 100+ dla najszybszego przepływu pracy
  • Każdy wiersz generuje jeden plik audio
  • Maksymalnie 500 pojemników na serię
  • Czas przetwarzania zależy od całkowitej długości tekstu
  • Pozostaw kolumnę głosową pustą, aby użyć domyślnego głosu
  • Pobrany ZIP zachowuje wzór nazwy

Jak prace przetwarzania TTS w serii

Generowanie audio dla setek tekstów w trzech prostych krokach. Nie jest wymagane znajomość skryptów ani API.

Krok 1

Dodaj teksty

Wprowadź teksty ręcznie jeden wiersz na raz, lub wysyłaj arkusz CSV lub XLSX. Każdy wiersz staje się jednym plikiem audio. Opcjonalnie określ nazwę głosu i nazwę pliku w rzędzie dla pełnej kontroli nad każdym wyjściem.

Krok 2

Konfiguracja ustawień

Wybierz domyślny model i głos AI, który ma zastosowanie do wszystkich wiersz bez określonego głosu. Wybierz swój format wyjściowy (MP3 lub WAV) i ustaw wzór nazwy: użyj kolumny nazwy pliku, numerów sekwencyjnych lub własnych prefiksów.

Krok 3

Generuj & pobieranie ZIP

Kliknij Generuj wszystkie i obserwuj postęp w czasie rzeczywistym, gdy każdy wiersz jest przetwarzany. Odtwarzaj lub pobieraj indywidualne wyniki lub pobieraj wszystko na raz jako jeden ZIP archiwum. Niepowodzenie elementów może być ponownie próbowane indywidualnie.

Przypadki użytkowania serii TTS

Przetwarzanie partii oszczędza godziny powtarzającej się pracy w całej edukacji, telefonii, handlu elektronicznego i lokalizacji treści.

Moduły e-uczenia

Generuj narrację dla wszystkich kursów naraz. Wyślij arkusz skryptów lekcji i wyprodukuj spójne, profesjonalne audio we wszystkich modułach bez nagrywania jednego słowa ręcznie.

Zapytania IVR

Tworzysz wszystkie swoje systemy telefoniczne w jednej partii. Opcje menu, przetrzymywanie wiadomości, po godzinach powitania i transfery departamentów -- generuj setki pytań z konsekwentnym głosem i tonem.

Opis produktu

Włącz katalog produktu do opisów audio dla dostępności, inteligentnych głośników lub kiosków in-store. Eksportuj swój produkt CSV i wygeneruj jeden plik audio na jeden element z odpowiednimi nazwami plików.

Lokalizacja

Przetłumacz swoje UI struny lub zawartość na wiele języków, następnie serial-generate audio dla każdej lokalizacji. Idealne dla aplikacji, gier i stron internetowych, które potrzebują lokalizowanych pytań głosowych lub narracji.

Katalogi audio

Budowa wyszukiwanych bibliotek audio z ustrukturyzowanych danych. Muzea, biblioteki i archiwa mogą konwertować metadane, opisy lub transkrypty na przewodniki audio z przetwarzaniem partii.

Dźwięki powiadomień

Generuj pełny zbiór powiadomień, alarmu i potwierdzenia głosu dla aplikacji lub urządzenia. Wyślij listę krótkich wiadomości i pobierz ZIP plików audio gotowych do integracji.

Funkcje przetwarzania serii

Wszystko, czego potrzebujesz, aby przetwarzać duże ilości tekst-to-speech efektywnie i niezawodnie.

Import CSV & XLSX

Wysyłanie arkuszu do Twojego tekstu i system przeanalizuje go automatycznie. Pierwszą kolumną jest tekst do konwersji, a opcjonalne kolumny pozwalają określić głos i nazwę pliku w wierszu. Podtrzymuje standardowe CSV z przecinkami przecinkami lub średnikiem, jak również pliki Excel XLSX. Zagłówki są automatycznie wykrywane, tak że kolejność kolumn nie ma znaczenia.

Kontrola głosu na prawo

Przypisz inny głos do każdego wiersza, aby uzyskać maksymalną elastyczność. Użyj kolumny głosowej w arkuszu lub spadku w trybie ręcznym. Wiersze bez określonego głosu automatycznie używają domyślnego głosu z ustawień partii. Mieszają i pasują do głosów w jednej partii, aby utworzyć zróżnicowane, naturalnie dźwiękowe zestawy audio.

Śledzenie postępów

Obserwuj w czasie rzeczywistym pasek postępów i aktualizacje statusu na rzędzie, gdy Twoja partia jest przetwarzana. Każdy wiersz przechodzi przez kolejkę, przetwarzanie, zakończenie i nieudane stany. Tabela wyników na żywo, tak że możesz rozpocząć podgląd zakończonych plików audio, podczas gdy reszta partii wciąż generuje. Nieudane elementy wyświetlają dane o błędach i mogą być ponownie próbowane.

Eksport ZIP

Pobierz wszystkie generowane pliki audio jako pojedynczy archiwum ZIP jednym kliknięciem. Pliki są nazwane zgodnie z wybranym wzorem nazwy: oryginalne nazwy plików z arkuszu, numery sekwencyjne (001. mp3, 002. mp3) lub własnym prefixem plus numer. ZIP zachowuje porządek wierszy wejściowych dla łatwego powrotu do danych źródłowych.

Często zadawane pytania

Przetwarzanie partii pozwala na konwersję wielu tekstów do mowy naraz. Wyślij arkusz CSV lub XLSX z swoimi tekstami, wybierz głosy i ustawienia i wygeneruj dźwięk dla każdego wiersza. Pobierz wszystkie wyniki jako plik ZIP.

Twoja CSV powinna posiadać co najmniej kolumnę "text". Opcjonalne kolumny: "glas" (identyfikator głosu), "filename" (nazwisko wyjściowe), "model" (model TTS). Jeśli nie są określone kolumny głosu/modelu w wierszu, używane są domyślne ustawienia.

Do 500 pozycji na partię. Dla większych partii, podzielić swój CSV na wiele plików. Każdy element jest przetwarzany niezależnie, więc awaria w jednym wierszu nie wpływa na inne.

Tak. Dodaj do Twojego CSV kolumnę "głosu" z identyfikatorem głosu dla każdego wiersza. Wiersze bez podanego głosu będą używać domyślnego głosu z panelu ustawień partii.

Czas przetwarzania zależy od całkowitej długości tekstu i zastosowanego modelu. Kokoro przetwarza około 100 wierszy (500 znaków każda) w około 2 minuty. Powolniejsze modele jak Tortoise zajmą dłużej.

Tak. Interfejs pokazuje pasek postępu i status per- row (przetworzony, przetwarzany, zakończony, nieudany). Wyniki można zobaczyć w czasie rzeczywistym i rozpocząć pobieranie zakończonych plików przed zakończeniem partii.

Wybierz MP3 lub WAV jako format wyjściowy. Wszystkie pliki w partii używają tego samego formatu. Pobierz pojedyncze pliki lub wszystkie wyniki jako jeden ZIP archiwum.

Domyślnie pliki są numerowane sekwencyjnie (001. mp3, 002. mp3,...). Możesz podać własne nazwy plików za pomocą kolumny "filename" CSV lub ustawić w ustawieniach wzór prefiksu.

Tak. Przekazywanie indywidualnych TTS zapytania do naszego API równolegle. Każdy zwraca UUID do ankietowania. Dla wygody, narzędzie serii internetowej obsługuje orkiestrację, paralelizm i opakowania ZIP dla Ciebie.

E-learning training narration (jeden wiersz na slajd), IVR system telefoniczny pytania, opis produktu audio, dźwięki notyfikacji aplikacji, wielojęzyczna lokalizacja treści i dostępność audio dla dużych bibliotek treści.

Te same stawki, co indywidualne modele TTS. Free-tier (Kokoro, Piper) kosztują 0 znaków. Modele standardowe używają 2x znaków, a modele premium używają 4x znaków. Narzędzie partii pokazuje szacunkowy koszt całkowity przed rozpoczęciem.

Tak. Po zakończeniu partii, nieudane wiersze są oznaczone komunikatem o błędzie. Możesz powtórzyć nieudane elementy indywidualnie lub filtrować, aby ponownie przerobić wszystkie awarie jednym kliknięciem.
5.0/5 (1)

Co moglibyśmy ulepszyć? Twoje zwroty zwrotne pomagają nam rozwiązać problemy.

Przetwarzanie setek tekstów na raz

Wyślij arkusz i wygeneruj dźwięk dla każdego wiersza. Idealny dla e-learningu, IVR i lokalizacji.