Sesame CSM

Speaker 0

プレミアム 英語 Neutral Sesame CSM

Speaker 0はSesame CSMテキストから音声へのモデルをベースとした neutralのAI音声です。このプレミアム・ティアの音声は英語を話し、スタジオの音声合成を提供します。 生成速度が音質は低いですがで、品質評価が5/5のSpeaker 0はai assistants, chatbots, conversational ai applicationsに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。

まだ評価はありません

Sesame CSMモデル情報

モデル Sesame CSM
開発者 Sesame
品質
スピード スロー
ライセンス Apache 2.0
クローニング 利用できません
動物 プレミアム (4 クレジット/1K 文字)
パラメータ 1B
建築 Llama Backbone + Audio Codec
2025

ユースケース Speaker 0

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Speaker 0 を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

ポッドキャストと放送

スタジオ品質の出力はポッドキャスト、ラジオ、プロの放送に適している。

ゲームとインタラクティブメディア

ゲーム対話,対話型ストーリー,および浸透的な体験のためのプレミアム品質。

モア Sesame CSM 声

同じ TTS モデルの他の音声

Speaker 1

英語 Neutral

よくある質問

Sesame CSM(Conversational Speech Model)は,会話音声生成のために特別に設計された10億パラメータモデルである。回転タイミング,バックチャネル応答,感情反応,会話フローなどの人間の会話の自然なパターンをモデル化する。CSMは,合成音声ではなく,自然な人間の会話のように聞こえる音を生成する。

Sesame CSMはSesameによって開発され,生成された音声の商用利用を許可するApach 2.0ライセンスの下でリリースされている。

Sesame CSM は 1 言語をサポートします: 英語。

Sesame CSM はプレミアムレベルで、1,000 文字あたり 4 クレジットです。完全なオーディオを生成する前に、どの Sesame CSM 音声も無料でプレビューできます。

Sesame CSM は低速な(品質優先)生成速度を持ち、一世代にかかる時間は長いが、高い忠実度の出力を生成します。

Sesame CSMはTTS.aiで音質に5/5の評価を得ています。スタジオ級の人間らしい音声を提供します。

いいえ、Sesame CSM は固定の内蔵音声セットを使用します。音声クローンのためには CosyVoice 2、GPT-SoVITS、Chatterbox などのモデルを試してください。

CSMは,対話型,自然タイミング,ターンテイク機能を持つため,人工知能アシスタント,チャットボット,対話型人工知能アプリケーションに特に推奨される。

はい、Sesame CSM は Apache 2.0 ライセンスで商用利用が許可されています。Sesame CSM 音声で生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用プロジェクトに使用できます。

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Speaker 0 ナウ

任意のテキストを入力し、その音声を聞くName Speaker 0. フリー.