Spark TTS

Chinese Default

標準 中国語 Neutral Spark TTS

Chinese DefaultはSpark TTSテキストから音声へのモデルをベースとした neutralのAI音声です。この標準の音声は中国語を話し、高いの音声合成を提供します。 生成速度が軽度で、品質評価が4/5のChinese Defaultはcontent creation with cloned voices and emotional controlに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。 また,Spark TTSモデルは音声クローンをサポートする。

まだ評価はありません

Spark TTSモデル情報

モデル Spark TTS
開発者 SparkAudio
品質
スピード メディア
ライセンス CC BY-NC-SA 4.0
クローニング サポート
動物 標準 (2 クレジット/1K 文字)
パラメータ 500M
建築 BiCodec + LLM + Flow Matching
2025

ユースケース Chinese Default

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Chinese Default を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

カスタムブランドボイス

この音声スタイルを自分のオーディオでクローンして、ユニークなブランドTTS音声を作成します。

電子学習

明確なAIナレーションを用いて,魅力的なトレーニング資料,コース,教育コンテンツを作成する。

モア Spark TTS 声

同じ TTS モデルの他の音声

Default

英語 Neutral

よくある質問

Spark TTSは、音声クローンと制御可能な感情と話し方を組み合わせたテキストから音声へのモデルです。たった5秒の参照音声を使って、声をクローンし、クローンした音声のアイデンティティを保持しながら、異なる感情、速度、スタイルの音声を生成します。Spark TTSはプロンプトベースの制御システムを使用します。

Spark TTSはSparkAudioが開発し,生成音声の商用利用を許可するCC BY NC SA 4.0ライセンスの下でリリースされている。

Spark TTSは英語と中国語の2言語をサポートしています。

Spark TTS は標準レベルで、1,000 文字当たり 2 クレジットです。Spark TTS の音声を完全に生成する前に無料でプレビューできます。

Spark TTS は適度な生成速度を持っています。生成にはテキストの長さに応じて数秒かかります。

Spark TTSはTTS.aiの音質で4/5の評価を得ており、高品質で自然な音声を生成しています。

はい、Spark TTS はゼロショット音声クローンをサポートします。カスタム音声を作成するには、5-30秒の参照音声をアップロードしてください。

音声クローン,感情制御,スタイル制御機能を備えており,このユースケースにおいては優れた選択肢となる。

はい、Spark TTSは商用利用を許可するCC BY-NC-SA 4.0ライセンスで提供されています。Spark TTSの音声で生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用プロジェクトに使用できます。

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Chinese Default ナウ

任意のテキストを入力し、その音声を聞くName Chinese Default. フリー.