Procesamiento TTS por lotes

Convierta cientos de textos a voz a la vez. Introduzca filas manualmente o cargue una hoja de cálculo CSV/XLSX para generar audio para cada línea.

# Texto Voz Nombre de archivo
1
2
3

Arrastre y suelte su archivo CSV aquí, o navegar

CSV con columnas: text, voice (opcional), filename (opcional)
file.csv
# Texto Voz Nombre de archivo
Ejemplo de formato CSV:
textvoicefilename
Bienvenido a nuestro servicioaf_heartwelcome
Su pedido ha sido enviadoorder_shipped
Gracias por llamar.bf_emmathanks

Arrastre y suelte su archivo Excel aquí, o navegar

XLSX con columnas: text, voice (opcional), filename (opcional)
file.xlsx
# Texto Voz Nombre de archivo
Ejemplo de formato XLSX:
textvoicefilename
Bienvenido a nuestro servicioaf_heartwelcome
Su pedido ha sido enviadoorder_shipped
Gracias por llamar.bf_emmathanks
0 elementos listos para generar 0 caracteres totales
Gratis con el modelo Kokoro
El procesamiento puede tomar varios minutos para lotes grandes
Procesamiento 0 / 0... 0%
Resultados por lotes
# Nombre de archivo Situación Medidas adoptadas

Configuración del lote

Utilizado cuando una fila no especifica una voz

Créditos

Costo total estimado 0 caracteres
Saldo actual No se ha iniciado sesión
¿Necesitas más personajes?

Consejos para el procesamiento de lotes

  • Utilice CSV para más de 100 elementos para el flujo de trabajo más rápido
  • Cada fila genera un archivo de audio
  • Máximo de 500 artículos por lote
  • El tiempo de procesamiento depende de la longitud total del texto
  • Deje la columna de voz vacía para usar la voz predeterminada
  • Descargado ZIP preserva su patrón de nombres

Cómo funciona el procesamiento TTS por lotes

Generar audio para cientos de textos en tres sencillos pasos. No se requieren scripts ni conocimientos de API.

Medida 1

Añadir sus textos

Introduzca textos manualmente una fila a la vez, o cargue una hoja de cálculo CSV o XLSX. Cada fila se convierte en un archivo de audio. Opcionalmente especifique una voz y un nombre de archivo por fila para un control completo sobre cada salida.

Medida 2

Configurar preferencias

Elija un modelo de AI predeterminado y una voz que se aplique a todas las filas sin una voz específica. Seleccione su formato de salida (MP3 o WAV) y establezca un patrón de nombre: utilice la columna de nombre de archivo, números secuenciales o un prefijo personalizado.

Medida 3

Generar y descargar ZIP

Haga clic en Generar todo y ver el progreso en tiempo real a medida que se procesa cada fila. Reproducir o descargar resultados individuales, o tomar todo a la vez como un único archivo ZIP. Los elementos fallidos se pueden volver a probar individualmente.

Casos de uso de TTS por lotes

El procesamiento por lotes ahorra horas de trabajo repetitivo en educación, telefonía, comercio electrónico y localización de contenidos.

Módulos de aprendizaje electrónico

Generar una narración para cursos completos a la vez. Subir una hoja de cálculo de scripts de lecciones y producir audio constante y profesional en todos los módulos sin grabar una sola palabra manualmente.

Prompts IVR

Cree todas las peticiones de su sistema telefónico en un solo lote. Opciones de menú, mantenga los mensajes, saludos después de horas y transferencias del departamento -- genere cientos de peticiones con una voz y tono consistentes.

Descripciones del producto

Convierta su catálogo de productos en descripciones de audio para la accesibilidad, altavoces inteligentes o quioscos en la tienda. Exporte su producto CSV y genere un archivo de audio por elemento con nombres de archivo coincidentes.

Localización

Traduzca sus cadenas de interfaz de usuario o contenido a varios idiomas, luego genere audio por lotes para cada localización. Perfecto para aplicaciones, juegos y sitios web que necesitan avisos de voz localizados o narración.

Catálogos de audio

Construya bibliotecas de audio con datos estructurados. Los museos, bibliotecas y archivos pueden convertir metadatos, descripciones o transcripciones en guías de audio con procesamiento por lotes.

Sonidos de notificación

Genera un conjunto completo de notificaciones, alertas y peticiones de voz de confirmación para tu aplicación o dispositivo. Sube una lista de mensajes cortos y descarga un ZIP de archivos de audio listos para integrar.

Características de procesamiento de lotes

Todo lo que necesita para procesar grandes volúmenes de texto a voz de manera eficiente y fiable.

Importación de CSV & XLSX

Sube una hoja de cálculo con tus textos y el sistema la analiza automáticamente. La primera columna es el texto a convertir, y las columnas opcionales permiten especificar una voz y un nombre de archivo por fila. Soporta CSV estándar con delimitadores de comas o semicolon, así como archivos Excel XLSX. Los encabezados se detectan automáticamente para que el orden de columna no importe.

Control de voz per row

Asigna una voz diferente a cada fila para obtener la máxima flexibilidad. Usa la columna de voz en tu hoja de cálculo o el menú desplegable en modo de entrada manual. Las filas sin una voz específica utilizan automáticamente la voz predeterminada de la configuración de tu lote. Mezcla y combina las voces dentro de un solo lote para crear conjuntos de audio variados y con sonido natural.

Seguimiento de los progresos realizados

Vea una barra de progreso en tiempo real y actualizaciones de estado por fila a medida que se procesa su lote. Cada fila transiciones a través de estados en cola, procesamiento, completado y fallado. La tabla de resultados actualiza en vivo para que pueda empezar a previsualizar archivos de audio completados mientras el resto del lote sigue generando.

Exportación ZIP

Descargue todos los archivos de audio generados como un único archivo ZIP con un solo clic. Los archivos se nombran de acuerdo con el patrón de nombres elegido: nombres de archivo originales de la hoja de cálculo, números secuenciales (001.mp3, 002.mp3), o un prefijo personalizado más número.

Preguntas frecuentes

El procesamiento por lotes te permite convertir muchos textos a voz a la vez. Sube una hoja de cálculo CSV o XLSX con tus textos, elige voces y ajustes y genera audio para cada fila. Descarga todos los resultados como un archivo ZIP.

Su CSV debe tener como mínimo una columna de "texto". Columnas opcionales: "voz" (ID de voz), "nombre de archivo" (nombre de archivo de salida), "modelo" (modelo TTS). Si la voz/modelo no se especifican por fila, se utilizan las configuraciones predeterminadas.

Hasta 500 elementos por lote. Para lotes más grandes, divida su CSV en varios archivos. Cada elemento se procesa de forma independiente, por lo que un fallo en una fila no afecta a los demás.

Sí. Añadir una columna de "voz" a su CSV con el ID de voz para cada fila. Las filas sin una voz especificada usarán la voz predeterminada del panel de configuración de lotes.

El tiempo de procesamiento depende de la longitud total del texto y del modelo utilizado. Kokoro procesa aproximadamente 100 filas (500 caracteres cada una) en unos 2 minutos. Modelos más lentos como Tortuga tardarán más tiempo.

Sí. La interfaz muestra una barra de progreso y el estado por fila (quema, procesamiento, completado, fallado). Puede ver los resultados aparecen en tiempo real y empezar a descargar archivos completados antes de que el lote termine.

Elija MP3 o WAV como formato de salida. Todos los archivos en el lote utilizan el mismo formato. Descargue archivos individuales o todos los resultados como un único archivo ZIP.

Por defecto, los archivos se numeran secuencialmente (001.mp3, 002.mp3,...). Puede especificar nombres de archivos personalizados a través de la columna CSV "nombre de archivo", o establecer un patrón de prefijo en la configuración.

Sí. Enviar solicitudes TTS individuales a nuestra API en paralelo. Cada uno devuelve un UUID para la votación. Para mayor comodidad, la herramienta web por lotes se encarga de la orquestación, paralelismo y embalaje ZIP para usted.

La narración del curso de aprendizaje electrónico (una fila por diapositiva), avisos del sistema telefónico IVR, audio de descripción del producto, sonidos de notificación de aplicaciones, localización de contenido multilingüe y audio de accesibilidad para grandes bibliotecas de contenido.

Los modelos gratuitos (Kokoro, Piper) cuestan 0 caracteres. Los modelos estándar usan 2 caracteres, y los modelos premium usan 4 caracteres. La herramienta por lotes muestra el costo total estimado antes de empezar.

Sí. Después de completar un lote, las filas fallidas se marcan con un mensaje de error. Puede volver a intentar elementos fallidos individualmente o filtrar para volver a procesar todos los fallos con un solo clic.
5.0/5 (1)

¿Qué podríamos mejorar? Sus comentarios nos ayudan a solucionar problemas.

Procesar cientos de textos a la vez

Subir una hoja de cálculo y generar audio para cada fila. Perfecto para el aprendizaje electrónico, IVR y localización.