Procesamento por lotes de TTS

Converta centos de textos en voz á vez. Introduza filas manualmente ou envíe unha folla de cálculo CSV/XLSX para xerar son para cada liña.

# Texto Voz Nome do ficheiro
1
2
3

Arrastre e solte o seu ficheiro CSV aquí, ou navegar

CSV con columnas: text, voice (opcional), filename (opcional)
file.csv
# Texto Voz Nome do ficheiro
Exemplo de formato CSV:
textvoicefilename
Benvido ao noso servizoaf_heartwelcome
O seu pedido foi enviadoorder_shipped
Grazas por chamar.bf_emmathanks

Arrastre e solte aquí o seu ficheiro de Excel, ou navegar

XLSX con columnas: text, voice (opcional), filename (opcional)
file.xlsx
# Texto Voz Nome do ficheiro
Exemplo de formato XLSX:
textvoicefilename
Benvido ao noso servizoaf_heartwelcome
O seu pedido foi enviadoorder_shipped
Grazas por chamar.bf_emmathanks
0 elementos listos para xerar 0 total de caracteres
Libre co modelo Kokoro
O procesamento pode tardar varios minutos para lotes grandes
A procesar 0 / 0... 0%
Resultados do lote
# Nome do ficheiro Estado Accións

Configuración do lote

Emprégase cando unha fila non especifica unha voz

Créditos

Custo total estimado 0 créditos
Saldo actual Non accedeu
Precisa máis créditos?

Consellos de procesamento por lotes

  • Empregar CSV para máis de 100 elementos para un fluxo de traballo máis rápido
  • Cada fila xera un ficheiro de son
  • Máx. 500 elementos por lote
  • O tempo de procesamento depende da lonxitude total do texto
  • Deixe a columna de voz baleira para empregar a voz predeterminada
  • O ZIP obtido preserva o seu patrón de nomes

Como funciona o procesamento por lotes de TTS

Xere son para centos de textos en tres pasos sinxelos. Non se requiren coñecementos de scripting ou API.

Paso 1

Engadir os seus textos

Introduza os textos manualmente, unha fila á vez, ou envíe unha folla de cálculo CSV ou XLSX. Cada fila convértese nun ficheiro de son. Opcionalmente, especifique unha voz e un nome de ficheiro por fila para ter control total sobre cada saída.

Paso 2

Configurar a configuración

Escolla un modelo de IA predeterminado e unha voz que se aplique a todas as filas sen unha voz específica. Escolla o formato de saída (MP3 ou WAV) e defina un patrón de nomes: use a columna do nome do ficheiro, números secuenciais ou un prefixo personalizado.

Paso 3

Xerar e obter ZIP

Prema Xerar todo e vexa o progreso en tempo real mentres se procesa cada fila. Reproduza ou descargue os resultados individuais, ou obteña todo de unha vez como un único arquivo ZIP. Os elementos que fallen poden ser reintentados individualmente.

Casos de uso de TTS por lotes

O procesamento por lotes aforra horas de traballo repetitivo en educación, telefonía, comercio electrónico e localización de contidos.

Módulos de aprendizaxe electrónica

Xere narración para cursos enteiros á vez. Envíe unha folla de cálculo de guións de lección e produza son consistente e profesional en todos os módulos sen gravar unha soa palabra manualmente.

Preguntas de IVR

Cree todos os avisos do sistema telefónico nun só lote. Opcións de menú, mensaxes en espera, saúdos fóra do horario e transferencias de departamentos -- xere centos de avisos cunha voz e un ton consistentes.

Descricións do produto

Converta o seu catálogo de produtos en descricións de son para accesibilidade, altofalantes intelixentes ou quioscos na tenda. Exporte o seu produto en CSV e xere un ficheiro de son por elemento con nomes de ficheiro correspondentes.

Localización

Traduza as cadeas ou o contido da interface de usuario a varias linguas, e logo xere audio por lotes para cada localización. Perfecto para programas, xogos e sitios web que precisen instrucións de voz ou narración localizadas.

Catálogos de son

Cree bibliotecas de son pesquisábeis a partir de datos estruturados. Os museos, bibliotecas e arquivos poden converter metadatos, descricións ou transcricións en guías de son con procesamento por lotes.

Sons de notificación

Xere un conxunto completo de mensaxes de voz de notificación, alerta e confirmación para o seu programa ou dispositivo. Envíe unha lista de mensaxes curtas e descargue un ZIP de ficheiros de son listos para integrar. Name

Características do procesamento por lotes

Todo o que precisa para procesar grandes volumes de texto a voz de forma eficiente e fiable.

Importación de CSV e XLSX

Envíe unha folla de cálculo cos seus textos e o sistema analiza- los automaticamente. A primeira columna é o texto a converter, e as columnas opcionais permítenlle especificar unha voz e un nome de ficheiro por fila. Soporta CSV estándar con delimitadores de vírgula ou punto e vírgula, así como ficheiros XLSX de Excel. As cabeceiras son detectadas automaticamente, polo que a orde das columnas non importa.

Control de voz por filas

Asigne unha voz diferente a cada fila para ter a máxima flexibilidade. Empregue a columna de voz na folla de cálculo ou a lista despregábel no modo de entrada manual. As filas sen unha voz especificada empregan automaticamente a voz predeterminada da configuración por lotes. Mesture e combine voces nun só lote para crear conxuntos de son variados e naturais.

Seguimento do progreso

Vexa unha barra de progreso en tempo real e as actualizacións de estado por fila mentres se procesa o lote. Cada fila pasa polos estados en fila, procesamento, completado e fallado. A táboa de resultados actualízase en tempo real para que poida comezar a previsualizar os ficheiros de son completados mentres o resto do lote aínda está a xerar. Os ítems fallados mostran os detalles do erro e pódense tentar de novo.

Exportación ZIP

Descarga todos os ficheiros de son xerados como un único arquivo ZIP cun só clic. Os ficheiros son nomeados segundo o patrón de nomes que escolla: nomes de ficheiro orixinais da folla de cálculo, números secuenciais (001. mp3, 002. mp3), ou un prefixo personalizado máis un número. O ZIP preserva a orde das filas de entrada para facilitar o mapeo de volta aos datos de orixe.

Preguntas frecuentes

O procesamento por lotes permítelle converter moitos textos en voz á vez. Envíe unha folla de cálculo CSV ou XLSX cos seus textos, escolla voces e opcións, e xere son para cada fila. Obteña todos os resultados como un ficheiro ZIP.

O CSV debe ter polo menos unha columna « texto ». Columnas opcionais: « voz » (ID da voz), « nome do ficheiro » (nome do ficheiro de saída), « modelo » (modelo TTS). Se non se especifica voz/ modelo por fila, empréganse as opcións por omisión.

Ata 500 elementos por lote. Para lotes maiores, divida o CSV en varios ficheiros. Cada elemento é procesado independentemente, polo que un erro nunha fila non afecta ás outras.

Si. Engadir unha columna « voz » ao CSV co ID da voz para cada fila. As filas sen especificar unha voz empregarán a voz predeterminada do panel de configuración do lote.

O tempo de procesamento depende da lonxitude total do texto e do modelo empregado. Kokoro procesa aproximadamente 100 filas (500 caracteres cada unha) en aproximadamente 2 minutos. Os modelos máis lentos como Tortoise tardarán máis.

Si. A interface mostra unha barra de progreso e o estado por fila (en fila, a procesar, completado, fallado). Pode ver os resultados en tempo real e comezar a obter os ficheiros completados antes de que remate o lote.

Escolla MP3 ou WAV como formato de saída. Todos os ficheiros do lote usan o mesmo formato. Obteña ficheiros individuais ou todos os resultados como un único arquivo ZIP.

Por omisión, os ficheiros son numerados secuencialmente (001. mp3, 002. mp3,...). Pode especificar nomes de ficheiro personalizados mediante a columna CSV « nomedoficheiro », ou establecer un patrón de prefixo na configuración.

Si. Envíe peticións TTS individuais á nosa API en paralelo. Cada unha devolve un UUID para a sondaxe. Para maior comodidade, a ferramenta de lotes web xestiona a orquestración, o paralelismo e o empaquetamento ZIP por vostede.

Narración de cursos de aprendizaxe electrónica (unha fila por diapositiva), mensaxes do sistema telefónico IVR, son de descrición do produto, sons de notificación de aplicacións, localización de contido multilingüe e son de accesibilidade para grandes bibliotecas de contido.

As mesmas taxas de crédito que os TTS individuais. Os modelos de nivel libre (Kokoro, Piper) custan 0 créditos. Os modelos estándar custan 2 créditos por cada 1. 000 caracteres. A ferramenta de lotes mostra o custo total estimado antes de comezar.

Si. Despois de rematar un lote, as filas con fallos son marcadas cunha mensaxe de erro. Pode tentar de novo os elementos con fallos individualmente ou filtrar para volver procesar todos os fallos cun só clic.
5.0/5 (1)

Procese centos de textos á vez

Envíe unha folla de cálculo e xere son para cada fila. Perfecto para aprendizaxe electrónica, IVR e localización. Name