スタジオ

AI 音声でマルチチャプターオーディオブックやポッドキャストを作成します。章ごとに異なる音声を割り当て、発音を管理し、完了したプロジェクトをエクスポートします。

新規プロジェクト

Draft
0 words · 0 characters
0:00

まだ章はありません。 をクリックしてください。

タイムライン

生成された章はここにタイムラインとして表示されます。 個々の章を生成するには をクリックしてください。

0:00
Generating chapter 1 of 3... 0%

プロジェクトの設定

0s 10s

発音辞典

Example: "TTS" → "tee tee ess"
Word 発音
発音規則はまだありません。上の単語を追加するか、辞書ファイルをアップロードしてください。

エクスポート

すべての章を一つのオーディオファイルにスティッチ 各章を別のファイル (ZIP) としてダウンロード

ホー・イット・ワーク

プロのオーディオブックとポッドキャストを4つの簡単なステップで作成します。

Step 1

プロジェクトを作成

新しいプロジェクトを開始し、オーディオブック、ポッドキャスト、ボイスオーバー、プレゼンテーションのタイプを選択します。名前を付け、デフォルトの声とモデルを設定します。

Step 2

章を追加

プロジェクトに章またはセクションを追加します。各章のテキストを貼り付け、単語数を追跡し、ドラッグしてセクションの順序を変更します。

Step 3

ボイスを割り当てる

各章ごとに異なる AI 音声を選択します。一貫性のためにデフォルトを使用するか、ナレーターとキャラクターにユニークな音声を割り当てます。

Step 4

オーディオブックをエクスポート

一つのクリックですべての章を生成し、単一のステッチされたオーディオブックとしてエクスポートまたは個々の章をZIPアーカイブとしてダウンロードします。

ユースケース

スタジオは産業を超えた長期的なオーディオ製作のために作られた。

オーディオブック

全ての小説、ノンフィクション、短編をプロのオーディオブックに変換します。ナレーターとキャラクターを区別するためにマルチボイスを使用します。Audible、Spotify、Apple Booksで配布するための一つのファイルとしてエクスポートします。

ポッドキャスト

複数のAIホストを使ってポッドキャストエピソードをスクリプトし、プロデュースします。インタビュースタイルのショー、ニュースまとめ、ストーリーテリングシリーズを作成します。スピーカーごとに異なる声を割り当て、チャプターマーカーで放送準備のオーディオをエクスポートします。

電子学習コース

レッスンスクリプトから完全なコースオーディオを作成します。モジュールを章に分け、一貫した講師の声を使い、専門用語の発音規則を追加します。カリキュラム全体をバッチ生成します。

企業トレーニング

訓練資料、オンボードオーディオ、コンプライアンスモジュールを大規模に生成し、部門間で一貫したブランドボイスを維持します。テキストを編集し、再録音なしに再生することでコンテンツを更新します。

ドキュメント

アクセシビリティのために技術文書、ユーザガイド、マニュアルをオーディオフォーマットに変換します。発音辞書を使って略語、製品名、ドメイン特有の用語を正確に扱います。

プレゼンテーション

スライドデッキやビデオプレゼンテーションのためのナレーショントラックを生成します。各スライドを章として整理し、セクションごとにタイミングを割り当て、ウェビナーや会議のためのビジュアルコンテンツと同期するオーディオをエクスポートします。

スタジオ・フィーチャー

プロの長い形式のオーディオプロダクションに必要なすべて。

マルチボイス

各章またはセクションに異なるAI声を割り当てます。1つの声をナレーションに、他の声をキャラクターの対話に使用します。24以上のモデルの100以上の声を切り替えて完璧なキャストを作成します。

チャプター管理

ドラッグアンドドロップで章を追加、削除、並び替えます。それぞれのセクションには単語と文字の数を表示する独自のテキストエディタがあります。個々の章を生成するか、すべて一度に生成します。

発音辞典

名前、略語、技術用語のカスタム発音ルールを定義します。.txt または.pls 辞書ファイルをアップロードするか、正確さを確保するために手動で単語発音ペアを追加します。

One-Click Export

プロジェクト全体を設定可能な章切れを持つ単一のオーディオファイルとしてエクスポートするか、すべての章を ZIP アーカイブの個々のファイルとしてダウンロードします。出力は MP3 または WAV です。

よくある質問

Studio is a long-form audio production workspace. Create multi-chapter audiobooks, podcasts, or voiceover projects. Assign different voices to different sections, manage pronunciation dictionaries, and export as a single stitched audio file.

Each chapter or section can have a different voice assigned. For example, an audiobook can have a narrator voice for descriptions and different character voices for dialogue. You assign voices per section in the project editor.

A pronunciation dictionary lets you define how specific words should be spoken. Upload a .txt or .pls file with word-pronunciation pairs, or add them manually. Useful for character names, brand names, acronyms, and technical terms that AI might mispronounce.

Yes. Each chapter generates independently. If you need to fix a paragraph, just regenerate that section. The rest of your project stays intact. This saves time and credits on long projects.

Export your complete project as a single MP3 or WAV file with all chapters stitched together. You can also export individual chapters as separate files or download everything as a ZIP archive.

There is no hard limit on project length. Each chapter can be up to 50,000 characters. You can have unlimited chapters. Full-length novels (80,000+ words) are fully supported.

Yes. In project settings, you can set the chapter break duration — the silence inserted between chapters in the final export. Default is 2 seconds, adjustable from 0 to 10 seconds.

The core TTS API supports generating speech for individual sections. For full project management (chapters, voice assignment, stitching), use the web Studio interface. API-based project management is on the roadmap.

Using Kokoro (free tier), audiobook production costs 0 credits. A 60,000-word novel is approximately 360,000 characters. With standard-tier models (2 credits/1K chars), that would cost about 720 credits ($25-30).

Team collaboration is coming soon. Currently, projects are tied to individual accounts. The upcoming Teams feature will allow shared projects, team API keys, and usage dashboards.

Yes. You can use SSML tags in your text for fine-grained control over pronunciation, pauses, emphasis, and prosody. Combined with the pronunciation dictionary, you have complete control over how every word is spoken.

Yes. Upload a TXT, DOCX, or EPUB file and Studio will automatically split it into chapters. You can then assign voices, edit text, and generate audio for each chapter independently.
5.0/5 (1)

最初のプロジェクトを作成

マルチチャプターサポート、複数の声、発音制御。