Default
DefaultはStyleTTS 2テキストから音声へのモデルをベースとした neutralのAI音声です。このプレミアム・ティアの音声は英語を話し、スタジオの音声合成を提供します。 生成速度が軽度で、品質評価が5/5のDefaultはstudio-quality single-speaker synthesis, professional narrationに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。
モデル情報
| モデル | StyleTTS 2 |
| 開発者 | Columbia University |
| 品質 | |
| スピード | メディア |
| ライセンス | MIT |
| クローニング | 利用できません |
| 動物 | プレミアム (4 クレジット/1K 文字) |
| パラメータ | 100M |
| 建築 | Style Diffusion + Adversarial Training |
| 訓練データ | 585 時間 |
| 年 | 2024 |
ユースケース Default
この音声の特徴に基づく推奨アプリケーション
オーディオブックとナレーション
Default を使って、自然な韻律と表現で長い内容を語り出す。
音声
YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。
ポッドキャストと放送
スタジオ品質の出力はポッドキャスト、ラジオ、プロの放送に適している。
ゲームとインタラクティブメディア
ゲーム対話,対話型ストーリー,および浸透的な体験のためのプレミアム品質。