VITS

Baker (Chinese)

自由 中国語 Neutral VITS

Baker (Chinese)はVITSテキストから音声へのモデルをベースとした neutralのAI音声です。この自由階級の音声は中国語を話し、いいぞの音声合成を提供します。 生成速度がほぼ瞬時にで、品質評価が3/5のBaker (Chinese)はgeneral-purpose text-to-speech with natural prosodyに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。

まだ評価はありません

VITSモデル情報

モデル VITS
開発者 Jaehyeon Kim et al.
品質
スピード ファスト
ライセンス MIT
クローニング 利用できません
動物 自由 (文字は使われません)
パラメータ 25M
建築 VAE + Normalizing Flows + GAN
訓練データ 585 時間
2021

ユースケース Baker (Chinese)

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Baker (Chinese) を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

アプリケーションとアクセシビリティ

これらの音声はリアルタイムアプリケーション,スクリーンリーダ,アクセシビリティツールに適している。

電子学習

明確なAIナレーションを用いて,魅力的なトレーニング資料,コース,教育コンテンツを作成する。

モア VITS 声

同じ TTS モデルの他の音声

Default

英語 Neutral

よくある質問

VITS(Variational Inference with advancerial largering for end‐to‐end Text‐to‐Speak)は,従来の2段階モデルよりも自然な音声を生成する並列エンド‐ト‐エンドTTS法である。

VITSはJaehyeon Kimらによって開発され,MITライセンスでリリースされ,生成音声の商用利用を許可している。

VITSは,英語,中国語,日本語,韓国語の4言語をサポートしている。

VITS はフリー (無料) のレベルであり、クレジットは必要ありません。VITS の音声を完全に生成する前に無料でプレビューできます。

VITSは非常に高速な生成速度を持ち,実時間近傍で動作し,ストリーミングや対話型アプリケーションに適している。

VITS is rated 3/5 for audio quality on TTS.ai. It delivers good quality speech suitable for most applications.

いいえ、VITS は固定の内蔵音声を使用します。音声クローンのためには CosyVoice 2、GPT-SoVITS、Chatterbox などのモデルを試してください。

VITSは,自然な韻律を持つ一般的なテキストから音声への合成に特に推奨される。

はい、VITS は MIT のライセンスを受けており、商用利用が許可されています。VITS の音声で生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用プロジェクトに使用できます。

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Baker (Chinese) ナウ

任意のテキストを入力し、その音声を聞くName Baker (Chinese). フリー 文字を必要としない.