Procesamiento TTS por lotes

Convierta cientos de textos a voz a la vez. Introduzca filas manualmente o cargue una hoja de cálculo CSV/XLSX para generar audio para cada línea.

# Texto Voz Nombre de archivo
1
2
3

Drag and drop your CSV file here, or navegar

CSV with columns: text, voice (opcional), filename (opcional)
file.csv
# Texto Voz Nombre de archivo
Ejemplo de formato CSV:
textvoicefilename
Bienvenido a nuestro servicioaf_heartwelcome
Su pedido ha sido enviadoorder_shipped
Gracias por llamar.bf_emmathanks

Arrastre y suelte su archivo Excel aquí, o navegar

XLSX con columnas: text, voice (opcional), filename (opcional)
file.xlsx
# Texto Voz Nombre de archivo
Ejemplo de formato XLSX:
textvoicefilename
Bienvenido a nuestro servicioaf_heartwelcome
Su pedido ha sido enviadoorder_shipped
Gracias por llamar.bf_emmathanks
0 elementos listos para generar 0 caracteres totales
Gratis con el modelo Kokoro
El procesamiento puede tomar varios minutos para lotes grandes
Procesamiento 0 / 0... 0%
Resultados por lotes
# Nombre de archivo Situación Medidas adoptadas

Configuración del lote

Utilizado cuando una fila no especifica una voz

Créditos

Costo total estimado 0 Créditos
Saldo actual No se ha iniciado sesión
¿Necesitas más créditos?

Consejos para el procesamiento de lotes

  • Utilice CSV para más de 100 elementos para el flujo de trabajo más rápido
  • Cada fila genera un archivo de audio
  • Máximo de 500 artículos por lote
  • El tiempo de procesamiento depende de la longitud total del texto
  • Deje la columna de voz vacía para usar la voz predeterminada
  • Descargado ZIP preserva su patrón de nombres

Cómo funciona el procesamiento TTS por lotes

Generar audio para cientos de textos en tres sencillos pasos. No se requieren scripts ni conocimientos de API.

Medida 1

Añadir sus textos

Introduzca textos manualmente una fila a la vez, o cargue una hoja de cálculo CSV o XLSX. Cada fila se convierte en un archivo de audio. Opcionalmente especifique una voz y un nombre de archivo por fila para un control completo sobre cada salida.

Medida 2

Configurar preferencias

Choose a default AI model and voice that applies to all rows without a specific voice. Select your output format (MP3 or WAV) and set a naming pattern: use the filename column, sequential numbers, or a custom prefix.

Medida 3

Generar y descargar ZIP

Haga clic en Generar todo y ver el progreso en tiempo real a medida que se procesa cada fila. Reproducir o descargar resultados individuales, o tomar todo a la vez como un único archivo ZIP. Los elementos fallidos se pueden volver a probar individualmente.

Casos de uso de TTS por lotes

El procesamiento por lotes ahorra horas de trabajo repetitivo en educación, telefonía, comercio electrónico y localización de contenidos.

E-Learning Modules

Generate narration for entire courses at once. Upload a spreadsheet of lesson scripts and produce consistent, professional audio across all modules without recording a single word manually.

IVR Prompts

Cree todas las peticiones de su sistema telefónico en un solo lote. Opciones de menú, mantenga los mensajes, saludos después de horas y transferencias del departamento -- genere cientos de peticiones con una voz y tono consistentes.

Descripciones del producto

Convierta su catálogo de productos en descripciones de audio para la accesibilidad, altavoces inteligentes o quioscos en la tienda. Exporte su producto CSV y genere un archivo de audio por elemento con nombres de archivo coincidentes.

Localization

Translate your UI strings or content into multiple languages, then batch-generate audio for each locale. Perfect for apps, games, and websites that need localized voice prompts or narration.

Audio Catalogs

Build searchable audio libraries from structured data. Museums, libraries, and archives can convert metadata, descriptions, or transcripts into audio guides with batch processing.

Sonidos de notificación

Generate a full set of notification, alert, and confirmation voice prompts for your app or device. Upload a list of short messages and download a ZIP of ready-to-integrate audio files.

Características de procesamiento de lotes

Todo lo que necesita para procesar grandes volúmenes de texto a voz de manera eficiente y fiable.

Importación de CSV & XLSX

Upload a spreadsheet with your texts and the system parses it automatically. The first column is the text to convert, and optional columns let you specify a voice and filename per row. Supports standard CSV with comma or semicolon delimiters, as well as Excel XLSX files. Headers are auto-detected so column order does not matter.

Control de voz per row

Asigna una voz diferente a cada fila para obtener la máxima flexibilidad. Usa la columna de voz en tu hoja de cálculo o el menú desplegable en modo de entrada manual. Las filas sin una voz específica utilizan automáticamente la voz predeterminada de la configuración de tu lote. Mezcla y combina las voces dentro de un solo lote para crear conjuntos de audio variados y con sonido natural.

Seguimiento de los progresos realizados

Vea una barra de progreso en tiempo real y actualizaciones de estado por fila a medida que se procesa su lote. Cada fila transiciones a través de estados en cola, procesamiento, completado y fallado. La tabla de resultados actualiza en vivo para que pueda empezar a previsualizar archivos de audio completados mientras el resto del lote sigue generando.

Exportación ZIP

Descargue todos los archivos de audio generados como un único archivo ZIP con un solo clic. Los archivos se nombran de acuerdo con el patrón de nombres elegido: nombres de archivo originales de la hoja de cálculo, números secuenciales (001.mp3, 002.mp3), o un prefijo personalizado más número.

Preguntas frecuentes

Batch processing lets you convert many texts to speech at once. Upload a CSV or XLSX spreadsheet with your texts, choose voices and settings, and generate audio for every row. Download all results as a ZIP file.

Your CSV should have at minimum a "text" column. Optional columns: "voice" (voice ID), "filename" (output filename), "model" (TTS model). If voice/model are not specified per row, the default settings are used.

Up to 500 items per batch. For larger batches, split your CSV into multiple files. Each item is processed independently, so a failure on one row does not affect others.

Yes. Add a "voice" column to your CSV with the voice ID for each row. Rows without a voice specified will use the default voice from the batch settings panel.

Processing time depends on total text length and the model used. Kokoro processes approximately 100 rows (500 characters each) in about 2 minutes. Slower models like Tortoise will take longer.

Yes. The interface shows a progress bar and per-row status (queued, processing, completed, failed). You can see results appear in real-time and start downloading completed files before the batch finishes.

Choose MP3 or WAV as the output format. All files in the batch use the same format. Download individual files or all results as a single ZIP archive.

By default, files are numbered sequentially (001.mp3, 002.mp3, ...). You can specify custom filenames via the "filename" CSV column, or set a prefix pattern in the settings.

Yes. Submit individual TTS requests to our API in parallel. Each returns a UUID for polling. For convenience, the web batch tool handles the orchestration, parallelism, and ZIP packaging for you.

E-learning course narration (one row per slide), IVR phone system prompts, product description audio, app notification sounds, multilingual content localization, and accessibility audio for large content libraries.

Los mismos tipos de crédito que los TTS individuales. Los modelos gratuitos (Kokoro, Piper) cuestan 0 créditos. Los modelos estándar cuestan 2 créditos por 1.000 caracteres. La herramienta por lotes muestra el costo total estimado antes de empezar.

Sí. Después de completar un lote, las filas fallidas se marcan con un mensaje de error. Puede volver a intentar elementos fallidos individualmente o filtrar para volver a procesar todos los fallos con un solo clic.
5.0/5 (1)

Procesar cientos de textos a la vez

Subir una hoja de cálculo y generar audio para cada fila. Perfecto para el aprendizaje electrónico, IVR y localización.