Parler TTS

Default

標準 英語 Neutral Parler TTS

DefaultはParler TTSテキストから音声へのモデルをベースとした neutralのAI音声です。この標準の音声は英語を話し、高いの音声合成を提供します。 生成速度が軽度で、品質評価が4/5のDefaultはcreative applications where you need custom voice characteristicsに適している。 これは,商用に安全なエンジンである。 主要な機能は次のとおりである。

まだ評価はありません

Parler TTSモデル情報

モデル Parler TTS
開発者 Hugging Face
品質
スピード メディア
ライセンス Apache 2.0
クローニング 利用できません
動物 標準 (2 クレジット/1K 文字)
パラメータ 880M
建築 Transformer Encoder-Decoder
訓練データ 45000 時間
2024

ユースケース Default

この音声の特徴に基づく推奨アプリケーション

オーディオブックとナレーション

Default を使って、自然な韻律と表現で長い内容を語り出す。

音声

YouTubeビデオ、広告、ソーシャルメディアコンテンツにプロのナレーションを追加します。

電子学習

明確なAIナレーションを用いて,魅力的なトレーニング資料,コース,教育コンテンツを作成する。

よくある質問

Parler TTS は生成された音声を制御するために自然言語の音声記述を使用するテキストから音声へのモデルです。プリセットの音声から選択する代わりに、あなたが望む音声を記述します(例えば、「軽いイギリス訛りの温かい女性の声、ゆっくりと明瞭に話す」)そして Parler はその記述に合った音声を生成します。これは、クリエイティブなアプリケーションにとって独特の柔軟性をもたらします。

Parler TTSはHugging Faceによって開発され,生成音声の商用利用を許可するApache 2.0ライセンスの下でリリースされている。

Parler TTSは1言語、英語をサポートします。

Parler TTS は標準レベルで、1,000 文字当たり 2 クレジットです。Parler TTS の音声を完全に生成する前に無料でプレビューできます。

Parler TTS は適度な生成速度を持っています。生成にはテキストの長さに応じて数秒かかります。

Parler TTSはTTS.aiの音質で4/5の評価を得ています。高品質で自然な音声を生成します。

いいえ、Parler TTS は固定の内蔵音声セットを使用します。音声クローンの場合は CosyVoice 2、GPT-SoVITS、Chatterbox のようなモデルを試してください。

はい、Parler TTSはカスタム音声特性が必要なクリエイティブアプリケーションに特に推奨されます。その音声記述、自然言語制御、柔軟な音声作成機能はこのユースケースにとって優れた選択肢となります。

はい、Parler TTS は Apache 2.0 ライセンスで商用利用が許可されています。Parler TTS 音声で生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用プロジェクトに使用できます。

はい、TTS.ai の全ての音声は商用ライセンスのオープンソースモデル (MIT, Apache 2.0) を使用しています。生成されたオーディオは、ビデオ、ポッドキャスト、アプリケーション、ゲーム、その他の商用アプリケーションで使用できます。

モデル名とボイスIDを入力して /api/v1/tts/ に POST を送信します。Python、JavaScript、Go、cURLのコード例は API ドキュメントページを参照してください。

はい、このページの再生ボタンをクリックしてサンプルを聞いてみてください。テキストから音声へページにカスタムテキストを入力して、どんな音声でも無料でプレビューを生成できます。

トライ Default ナウ

任意のテキストを入力し、その音声を聞くName Default. フリー.