バッチ TTS 処理

何百ものテキストを一度に音声に変換します。手動で行を入力したり、CSV/XLSX スプレッドシートをアップロードして、各行ごとにオーディオを生成します。

# テキスト ファイル名
1
2
3

CSV ファイルをここにドラッグ&ドロップします。 ブラウズ

列付き CSV: text, voice (選択的), filename (選択的)
file.csv
# テキスト ファイル名
例の CSV フォーマット:
textvoicefilename
私たちのサービスへようこそaf_heartwelcome
ご注文は出荷されましたorder_shipped
電話ありがとうbf_emmathanks

Excel ファイルをここにドラッグ&ドロップします。 ブラウズ

列付き XLSX: text, voice (選択的), filename (選択的)
file.xlsx
# テキスト ファイル名
例の XLSX フォーマット:
textvoicefilename
私たちのサービスへようこそaf_heartwelcome
ご注文は出荷されましたorder_shipped
電話ありがとうbf_emmathanks
0 生成可能なアイテム 0 文字数
自由と小室モデル
大量の場合は数分かかる
処理中 0 / 0... 0%
バッチ結果
# ファイル名 ステータス アクション

バッチの設定

行に音声が指定されていないときに使用

クレジット

総費用 0 文字
経常収支 ログインしていません
もっと文字が必要か?

バッチ処理のヒント

  • 100 件以上のアイテムに対して CSV を使用して最も速いワークフローを実現
  • 各行は1つのオーディオファイルを生成します
  • バッチ当たり最大 500 項目
  • 処理時間はテキストの長さに依存します
  • デフォルトの音声を使うには、音声列を空にしておく
  • ダウンロードした ZIP は名前パターンを保持します

バッチ TTS 処理の仕組み

3 つの簡単なステップで数百のテキストのためのオーディオを生成します。スクリプトや API の知識は必要ありません。

ステップ 1

テキストを追加

テキストを手動で一行ずつ入力するか、CSV または XLSX のスプレッドシートをアップロードします。各行はオーディオファイルとなります。全ての出力を完全にコントロールするには、行ごとに音声とファイル名を指定することもできます。

ステップ 2

設定を設定

特定の音声なしのすべての行に適用されるデフォルトの AI モデルと音声を選択します。出力フォーマット (MP3 または WAV) を選択し、名前付けパターンを設定します。ファイル名列、順番番号またはカスタムプレフィックスを使用します。

ステップ 3

ZIP ファイルを作成してダウンロード

すべて生成をクリックして、各行が処理される過程をリアルタイムで見ることができます。個々の結果を再生またはダウンロードするか、全てを一度に ZIP アーカイブとして取得します。失敗したアイテムは個々に再試行できます。

バッチ TTS ユースケース

バッチ処理は教育,電話,電子商取引,コンテンツの地域化における反復的な作業時間を節約する。

電子学習モジュール

一度にコース全体のナレーションを生成します。レッスンスクリプトのスプレッドシートをアップロードし、すべてのモジュールで一貫したプロフェッショナルなオーディオを手動で一言も録音せずに生成します。

IVR プロンプト

電話システムのプロンプトを一つのバッチで作成します。メニューオプション、待ち受けメッセージ、営業時間外の挨拶、部門の移動など、一貫した音声と音色で何百ものプロンプトを生成します。

製品説明

アクセシビリティ、スマートスピーカー、または店内キューブ用のオーディオ説明に製品カタログを変換します。製品を CSV にエクスポートし、一致するファイル名でアイテムごとに一つのオーディオファイルを生成します。

局在化

UI 文字列やコンテンツを複数の言語に翻訳し、それぞれの言語に対応したオーディオを一括生成します。現地化された音声プロンプトやナレーションが必要なアプリケーション、ゲーム、ウェブサイトに最適です。

オーディオカタログ

構造化データから検索可能なオーディオライブラリを構築します。博物館、図書館、アーカイブはメタデータ、説明、または転写をバッチ処理でオーディオガイドに変換できます。

通知音

アプリケーションやデバイスのための通知、警告、確認の音声プロンプトを生成します。短いメッセージのリストをアップロードし、統合用の音声ファイルのZIPファイルをダウンロードします。

バッチ処理の機能

大量のテキストから音声を効率的かつ信頼性の高い方法で処理するために必要なすべて。

CSV & XLSX インポート

テキストを含むスプレッドシートをアップロードすると、システムは自動的にそれを解析します。最初の列は変換するテキストで、オプションの列では行ごとに音声とファイル名を指定できます。コンマまたはセミコロンで区切られた標準の CSV ファイルと Excel XLSX ファイルをサポートします。ヘッダは自動的に検出されるので、列の順序は関係ありません。

列ごとの音声制御

最大限の柔軟性を持つために、各行に異なる声を割り当てます。スプレッドシートの声の列または手動入力モードのドロップダウンを使用してください。声が指定されていない行は、自動的にバッチ設定のデフォルトの声を使用します。一つのバッチ内で声を混ぜ合わせて、多様で自然な音のオーディオセットを作成します。

進捗追跡

バッチ処理中にリアルタイムの進捗表示と行ごとの状態更新を見ることができます。各行はキュー、処理、完了、失敗の状態を経過します。結果テーブルはリアルタイムで更新され、残りのバッチが生成中に完了したオーディオファイルのプレビューを開始できます。失敗した項目はエラーの詳細を表示し、再試行できます。

ZIP エクスポート

生成されたすべてのオーディオファイルを一つの ZIP アーカイブとして一つのクリックでダウンロードします。ファイルは選択した名前付けパターンに従って名付けられます。スプレッドシートからの元のファイル名、順番番号 (001.mp3, 002.mp3)、またはカスタムプレフィックスと数字です。ZIP は入力行の順序を保ち、ソースデータへのマッピングを容易にします。

よくある質問

バッチ処理では、多くのテキストを一度に音声に変換できます。テキストを含む CSV または XLSX のスプレッドシートをアップロードし、音声と設定を選択し、各行ごとにオーディオを生成します。すべての結果を ZIP ファイルとしてダウンロードします。

CSV には少なくともテキスト列が必要です。オプションの列は、「声」(声の ID )、「ファイル名」(出力ファイル名)、「モデル」(TTS モデル)です。声/モデルを行ごとに指定しない場合は、デフォルトの設定を使用します。

バッチごとに最大 500 項目まで。より大きなバッチの場合は、CSV を複数のファイルに分割してください。各項目は独立して処理されます。一行の失敗は他の行に影響しません。

はい。あなたの CSV に各行の音声 ID を含む "音声" 列を追加します。音声が指定されていない行は、バッチ設定パネルのデフォルトの音声を使用します。

処理時間はテキストの長さと使用するモデルに依存します。Kokoroは約100行 (500文字ずつ) を約2分で処理します。Tortoiseのような遅いモデルはより長くかかります。

はい。インターフェースは進捗バーと行ごとの状態 (キュー、処理、完了、失敗) を表示します。結果がリアルタイムで表示され、バッチが終了する前に完了したファイルのダウンロードを開始できます。

出力フォーマットとして MP3 か WAV を選択します。バッチのすべてのファイルは同じフォーマットを使用します。個々のファイルをダウンロードするか、全ての結果を ZIP アーカイブとしてダウンロードします。

デフォルトでは、ファイルは順番に番号付けされます (001.mp3, 002.mp3,..)。ファイル名の CSV 列でカスタムファイル名を指定したり、設定でプレフィックスパターンを設定できます。

はい。個々の TTS リクエストを並列に API に送信します。それぞれはポリングのための UUID を返します。便利さのために、ウェブバッチツールはオーケストラ、並列性、ZIP パッケージを扱います。

電子学習コースナレーション(スライド当たり1行),IVR電話システムプロンプト,製品説明音声,アプリ通知音,多言語コンテンツのロカリゼーション,大規模コンテンツライブラリのアクセシビリティ音声などを提供する。

個々の TTS と同じ料金。フリーモデル (Kokoro, Piper) は文字数が0、標準モデルは文字数が 2x、プレミアムモデルは文字数が 4x です。バッチツールは開始前に予測された総費用を表示します。

はい。バッチ処理が完了した後、失敗した行はエラーメッセージでマークされます。失敗したアイテムを個別に再試行するか、一度クリックですべての失敗を再処理するためにフィルタを使用できます。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

一度に数百のテキストを処理します

プレゼンテーションをアップロードし、各行ごとにオーディオを生成します。e-learning、IVR、ロカリゼーションに最適です。