StyleTTS 2

Default

プレミアム 英語 Neutral StyleTTS 2

DefaultはStyleTTS 2テキストから音声へのモデルをベースとした neutralのAI音声です。このプレミアム・ティアの音声は英語を話し、スタジオの音声合成を提供します。 生成速度が軽度で、品質評価が5/5のDefaultはstudio-quality single-speaker synthesis, professional narrationに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。

まだ評価はありません

StyleTTS 2モデル情報

モデル StyleTTS 2
開発者 Columbia University
品質
スピード メディア
ライセンス MIT
クローニング 利用できません
動物 プレミアム (4 クレジット/1K 文字)
パラメータ 100M
建築 Style Diffusion + Adversarial Training
訓練データ 585 時間
2024

ユースケース Default

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Default を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

ポッドキャストと放送

スタジオ品質の出力はポッドキャスト、ラジオ、プロの放送に適している。

ゲームとインタラクティブメディア

ゲーム対話,対話型ストーリー,および浸透的な体験のためのプレミアム品質。

よくある質問

StyleTTS2は,大規模な音声言語モデルを用いた対抗訓練とスタイル拡散を組み合わせることにより,人間レベルのTTS合成を達成する。

StyleTTS2はコロンビア大学で開発され,MITライセンスでリリースされ,生成音声の商用利用が許可されている。

StyleTTS 2 は 1 つの言語をサポートします: 英語。

StyleTTS 2 はプレミアムレベルで、1,000 文字あたり 4 クレジットです。 StyleTTS 2 の音声を完全に生成する前に無料でプレビューできます。

StyleTTS 2 は適度な生成速度を持っています。生成にはテキストの長さに応じて数秒かかります。

StyleTTS 2はTTS.aiの音質に5/5の評価を与えています。スタジオ級の人間のような音声を提供します。

いいえ、StyleTTS 2 は固定の内蔵音声セットを使用します。音声クローンのためには CosyVoice 2、GPT-SoVITS、Chatterbox などのモデルを試してください。

スタイルTTS2は,スタジオ品質の単一スピーカー合成,プロフェッショナルなナレーションに特に推奨される。

はい、StyleTTS 2 は MIT ライセンスで商用利用が許可されています。StyleTTS 2 の音声で生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用プロジェクトに使用できます。

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Default ナウ

任意のテキストを入力し、その音声を聞くName Default. フリー.