Baker (Chinese)

自由中国語 Neutral

VITS

Baker (Chinese)はVITSテキストから音声へのモデルをベースとした neutralのAI音声です。この自由階級の音声は中国語を話し、いいぞの音声合成を提供します。生成速度がほぼ瞬時にで、品質評価が3/5のBaker (Chinese)はgeneral-purpose text-to-speech with natural prosodyに適している。これは，商用に安全なエンジンである。主要な機能は次のとおりである。

まだ評価はありません

トライ・ザット・ボイスすべて VITS 声

モデル情報

モデル	VITS
開発者	Jaehyeon Kim et al.
品質
スピード	ファスト
ライセンス	MIT
クローニング	利用できません
動物	自由 (文字は使われません)
パラメータ	25M
建築	VAE + Normalizing Flows + GAN
訓練データ	585 時間
年	2021

ユースケース Baker (Chinese)

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Baker (Chinese) を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

アプリケーションとアクセシビリティ

これらの音声はリアルタイムアプリケーション，スクリーンリーダ，アクセシビリティツールに適している。

電子学習

明確なＡＩナレーションを用いて，魅力的なトレーニング資料，コース，教育コンテンツを作成する。

モア VITS 声

同じ TTS モデルの他の音声

Default

英語 Neutral

すべて表示 VITS 声

よくある質問

ＶＩＴＳ（Ｖａｒｉａｔｉｏｎａｌ　Ｉｎｆｅｒｅｎｃｅ　ｗｉｔｈ　ａｄｖａｎｃｅｒｉａｌ　ｌａｒｇｅｒｉｎｇ　ｆｏｒ　ｅｎｄ‐ｔｏ‐ｅｎｄ　Ｔｅｘｔ‐ｔｏ‐Ｓｐｅａｋ）は，従来の２段階モデルよりも自然な音声を生成する並列エンド‐ト‐エンドＴＴＳ法である。

ＶＩＴＳはＪａｅｈｙｅｏｎ　Ｋｉｍらによって開発され，ＭＩＴライセンスでリリースされ，生成音声の商用利用を許可している。

ＶＩＴＳは，英語，中国語，日本語，韓国語の４言語をサポートしている。

VITS はフリー (無料) のレベルであり、クレジットは必要ありません。VITS の音声を完全に生成する前に無料でプレビューできます。

ＶＩＴＳは非常に高速な生成速度を持ち，実時間近傍で動作し，ストリーミングや対話型アプリケーションに適している。

VITS is rated 3/5 for audio quality on TTS.ai. It delivers good quality speech suitable for most applications.

いいえ、VITS は固定の内蔵音声を使用します。音声クローンのためには CosyVoice 2、GPT-SoVITS、Chatterbox などのモデルを試してください。

ＶＩＴＳは，自然な韻律を持つ一般的なテキストから音声への合成に特に推奨される。

はい、VITS は MIT のライセンスを受けており、商用利用が許可されています。VITS の音声で生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用プロジェクトに使用できます。

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Baker (Chinese) ナウ

任意のテキストを入力し、その音声を聞くName Baker (Chinese). フリー文字を必要としない.

音声を生成無料登録

Baker (Chinese)

モデル情報

ユースケース Baker (Chinese)

オーディオブックとナレーション

音声

アプリケーションとアクセシビリティ

電子学習

モア VITS 声

Default

よくある質問

ＶＩＴＳＴＴＳとは何か。

誰がVITSを開発した？

VITS はどの言語をサポートしますか？

VITSの音声を使うにはどれくらいかかりますか。

ＶＩＴＳはどれくらい早く音声を生成するか。

ＶＩＴＳの音質はどうですか。

VITSで声をクローンできる？

ＶＩＴＳは自然な韻律を持つ一般的なテキスト‐音声合成に適しているか。

VITSの音声を商用に使えるか？

この声を商業プロジェクトに使えますか？

どうやってこの音声を API を通して使うのですか？

生成する前に音声をプレビューできますか？

トライ Baker (Chinese) ナウ