批次 TTS 处理

将数以百计的文本转换为同时讲话。 手动输入行或上传 CSV/ XLSX 电子表格, 以生成每行的音频 。

# 文字文字文字文字文字 语音声音 文件名
1
2
3

拖放您的 CSV 文件到这里, 或者 浏览浏览

CSV 列数 : text, voice (可选), filename (可选)
file.csv
# 文字文字文字文字文字 语音声音 文件名
示例 CSV 格式 :
textvoicefilename
欢迎加入我们的服务af_heartwelcome
您的订单已经发运order_shipped
谢谢你打来电话bf_emmathanks

在此拖放您的 Excel 文件, 或者 浏览浏览

XLSX 列数 : text, voice (可选), filename (可选)
file.xlsx
# 文字文字文字文字文字 语音声音 文件名
示例 XLSX 格式 :
textvoicefilename
欢迎加入我们的服务af_heartwelcome
您的订单已经发运order_shipped
谢谢你打来电话bf_emmathanks
0 已经可以生成的项目 0 字符总字符总数
自由使用 Kokoro 模式
批量大批量的处理可能需要几分钟时间
处理 0 / 0... 0%
批次结果
# 文件名 状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况状况 行动行动和行动行动的行动和行动行动的行动

批次设置

当行不指定声音时使用

信贷信贷

估计费用总额 0 字符字符字符字符
本期结余 未登录
需要更多角色吗?

批处理提示

  • 使用 CSV 100+项目进行最快的工作流程
  • 每行生成一个音频文件
  • 每批最多500件
  • 处理时间取决于总文本长度
  • 保留音列空空以使用默认声音
  • 下载的 ZIP 保存您的命名模式

批次 TTS 处理工作

以三个简单的步骤生成数百条文本的音频,不需要脚本或API知识。

步骤1

添加您的文本

一次手动输入一行文本, 或上传 CSV 或 XLSX 电子表格。 每个行都变成一个音频文件。 可选择为每行指定一个声音和文件名, 以完全控制每个输出 。

步骤2

配置设置

选择一个默认的 AI 模型和声音, 该模型和声音适用于所有没有特定声音的行。 选择输出格式( MP3 或 WAV) 并设置命名模式: 使用文件名列、 序列号或自定义的前缀 。

步骤3

生成和下载 ZIP

点击“ 生成全部”, 并在每行处理时观看实时进度 。 播放或下载单个结果, 或同时将所有内容作为单个 ZIP 归档抓取 。 失败的项目可以单独重审 。

批次 TTS 使用案例

批处理节省了整个教育、电话、电子商务和内容本地化的重复工作的时间。

电子学习模块

立即生成整个课程的解说。 上传一个课程脚本电子表格, 并生成所有模块的一致、 专业的音频, 不手工记录单词 。

IVR 提示器

将您的电话系统所有的提示分批创建。 菜单选项, 保留信息, 下班后问候, 和部门转账 -- 以一致的声音和语气生成数百个提示。

产品说明

将您的产品目录转换成音频描述, 用于访问、 智能扬声器或存储亭。 导出您的产品 CSV 并生成每件匹配文件名的音频文件 。

本地化

将您的 UI 字符串或内容转换为多种语言, 然后为每个语区分批生成音频 。 适合需要本地化语音提示或解说的应用程序、 游戏和网站 。

音频目录

博物馆、图书馆和档案馆可以将元数据、说明或记录誊本转换成分批处理的音频指南。

通知声音

为您的应用程序或设备生成一套完整的通知、提醒和确认语音提示。 上传一份短信息列表, 并下载一个即时到组合音频文件的 ZIP 。

批处理特性

要高效可靠地处理大量的 文本到语音

CSV & XLX 导入

上传一个带有文本的电子表格, 系统将自动解析。 第一列是要转换的文本, 可选列允许您指定每行的语音和文件名。 支持标准 CSV, 使用逗号或分号分隔符, 以及 Excel XLSX 文件。 信头是自动检测的, 因此列顺序无关紧要 。

超声音频控制器

给每行指定一个不同的声音以获得最大灵活性。 使用电子表格中的语音栏或手动输入模式中的下调。 没有指定声音的行将自动使用批次设置中的默认声音。 组合并匹配单个批次中的声音以创建各种自然声音集 。

进展情况跟踪跟踪

在您的批量处理时, 查看实时进度栏和每行状态更新。 每行转换到队列、 处理、 完成和失败状态。 结果表更新现场, 这样您就可以在其余批量仍在生成时开始预览完整的音频文件。 失败的项目显示错误细节, 可以重新检索 。

ZIP 出口

将所有生成的音频文件都下载为单一的 ZIP 归档, 单击一次 。 文件会按照您选择的命名模式命名 : 电子表格中的原始文件名、 序列号( 001. mp3, 002. mp3) 或自定义的前缀加数字 。 ZIP 保存输入行的顺序, 以方便地绘制回源数据 。

常问问题

批处理允许您同时将许多文本转换为语音。 上传 CSV 或 XLSX 电子表格, 上传文本, 选择声音和设置, 并为每行生成音频。 将所有结果作为 ZIP 文件下载 。

您的 CSV 至少应该有一个“ text” 栏。 可选栏 : “voice”(voice ID)、 “filename”(输出文件名) 、 “ model”(TTS 模型) 。 如果没有为每行指定语音/ model, 则使用默认设置 。

每个批次最多500项。 对于较大的批次, 将您的 CSV 分成多个文件。 每个项目都是独立处理的, 因此一行的故障不会影响其它文件 。

是的 。 在您的 CSV 中添加一个“ 声音” 列, 并配有每行的语音代号。 没有指定声音的行将使用批量设置面板的默认声音 。

处理时间取决于文本总长度和使用的模型。 Kokoro 大约在两分钟内处理100行( 每个500个字符) 。 像 Tortoise 这样的较慢模型需要更长的时间 。

是。 接口显示一个进度栏和每个行的状态( 排队、 处理、 完成、 失败) 。 您可以在批量完成前看到实时结果并开始下载完整文件 。

选择 MP3 或 WAV 作为输出格式。 批次中的所有文件都使用相同的格式。 将单个文件或所有结果作为单个 ZIP 归档下载 。

默认情况下, 文件会顺序编号( 001. mp3, 002. mp3,...) 。 您可以通过“ filename” CSV 列指定自定义的文件名, 或者在设置中设置前缀模式 。

是的, 将个人 TTS 请求同时提交到我们的 API 。 每份都返回 UUID 进行投票。 为了方便起见, 网络批量工具会处理您的调制、 平行和 ZIP 包装 。

电子学习课程解说(每张幻灯片一行)、IVR电话提示、产品描述音频、应用程序通知声音、多语言内容本地化和大型内容图书馆无障碍音频。

与单个 TTS 相同。 自由级模型( Kokoro, Piper) 需要 0 个字符 。 标准模型使用 2x 个字符, 溢价模型使用 4x 个字符 。 批量工具显示您启动前的估计总成本 。

是。 批量完成后, 失败的行会被错误信息标记为行。 您可以单独重试失败的项目, 或者通过过滤来重新处理所有失败, 单击一次 。
5.0/5 (1)

我们能改进什么?您的反馈帮助我们解决问题。

立即处理数以百计文本

上传电子表格并生成每行的音频。 适合电子学习、 IVR 和本地化 。