MOSS-TTSD

Default Speaker

標準 英語 Neutral MOSS-TTSD

Default SpeakerはMOSS-TTSDテキストから音声へのモデルをベースとした neutralのAI音声です。この標準の音声は英語を話し、スタジオの音声合成を提供します。 生成速度が軽度で、品質評価が5/5のDefault Speakerはpodcasts, audiobooks, dubbed dialogue, conversational content with multiple voicesに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。 また,MOSS-TTSDモデルは音声クローンをサポートする。

まだ評価はありません

MOSS-TTSDモデル情報

モデル MOSS-TTSD
開発者 OpenMOSS
品質
スピード メディア
ライセンス Apache 2.0
クローニング サポート
動物 標準 (2 クレジット/1K 文字)
パラメータ 7B
建築 MOSS-TTS-Delay + dialogue continuation head
2026

ユースケース Default Speaker

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Default Speaker を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

ポッドキャストと放送

スタジオ品質の出力はポッドキャスト、ラジオ、プロの放送に適している。

カスタムブランドボイス

この音声スタイルを自分のオーディオでクローンして、ユニークなブランドTTS音声を作成します。

モア MOSS-TTSD 声

同じ TTS モデルの他の音声

Default (Chinese)

中国語 Neutral

よくある質問

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Default Speaker ナウ

任意のテキストを入力し、その音声を聞くName Default Speaker. フリー.