多言語テキストから音声へ
30 以上の言語で自然に聞こえる発音を生成します。ヒンディー語や日本語からアラビア語やスペイン語まで、AI モデルは本物の多言語音声合成を提供します。ローカル化、言語学習、国際コンテンツ、クロス言語音声クローンに最適です。
トライ・イット・ナウ
多言語 TTS 機能
世界的な音声合成
30以上の言語
英語、ヒンディー語、日本語、スペイン語、中国語、アラビア語、韓国語、フランス語、ドイツ語、ロシア語、ポルトガル語など30以上の言語で音声を生成します。
母語発音
各モデルは母語話者の録音に基づいて訓練され,サポートされている各言語に対して本物の発音,音調,リズムを確保する。
クロス言語クローン
一つの言語の音声をクローンし、他の言語の音声を生成します。CosyVoice 2 はグローバルコンテンツのために 8 言語の音声アイデンティティを保持します。
RTL 言語サポート
アラビア語、ヘブライ語、ウルドゥー語、ペルシア語を含む右から左への言語を完全にサポートし、正確なテキスト処理と自然な音声出力を提供します。
言語検出
また,自動言語検出は,入力テキスト言語を識別し,適切なモデルと音声へのルートを決定し,最適な発音品質を実現する。
アクセント変種
アメリカ英語、イギリス英語、インド英語、オーストラリア英語、ヨーロッパスペイン語、ラテンアメリカスペイン語、その他の地域の変種。
多言語TTSのベストモデル
最も広い言語サポートと最も良い言語間品質を持つモデル
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
適応する: 最良の多言語モデル — 8 言語のクロス言語音声クローン
試してみる CosyVoice 2
MeloTTS
Free
High-quality multilingual text-to-speech that runs on CPU with minimal latency.
適応する: 言語ごとに複数のアクセントを持つフリーの多言語TTS
試してみる MeloTTS
GPT-SoVITS
Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
適応する: 英語、中国語、日本語、韓国語のクローン
試してみる GPT-SoVITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
適応する: 感情表現と音響効果を備えた13以上の言語
試してみる Bark
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
適応する: スタジオ品質の9言語にわたる超高速生成
試してみる Kokoro多言語音声の生成方法
任意の言語で数秒で自然に話す
言語を選択
30 以上の言語をサポートしています。システムは入力テキストの言語を自動的に検出して便利にします。
任意の言語でテキストを入力
ターゲット言語でテキストを入力または貼り付けます。完全な Unicode サポートは CJK、デヴァナガリ、アラビア語、キリル文字などのすべての文字を扱います。
ネイティブ音声を選択
言語に最適化された音声を選択します。各言語は、利用可能な場合は地域アクセントの変種を含む複数の音声オプションを提供します。
生成とダウンロード
母語発音で音声を生成し、MP3 または WAV としてダウンロードします。複数言語でバッチ生成するための API を使用します。
サポートされている言語
多言語 TTS モデルで利用可能な言語
アメリカとヨーロッパ
- 英語 (米国、イギリス、オーストラリア)
- スペイン語 (ES, MX)
- ポルトガル語 (BR, PT)
- フランス語 (FR, CA)
- ドイツ語
- イタリア語Name
- オランダ語Name
- ポーランド語Name
東アジア
- 中国語 (普通話)
- 中国語 (広東語)
- 日本語
- 韓国語
- ベトナム語Name
- タイ語
- インドネシア語
- マレー語
南アジア・中東
- ヒンディー語Name
- アラビア語
- トルコ語Name
- ベンガル語Name
- タミル語
- ウルドゥー語Name
- ペルシア語
- ヘブライ語
その他の言語
- ロシア語
- ウクライナ語Name
- チェコ語
- ルーマニア語
- ギリシア語
- スウェーデン語
- フィンランド語Name
- ハンガリー語
言語間音声クローン
どんな言語でも自分の声で話せる
クローン・ユア・ボイス・スピーク・アンド・アナウンス
10秒の母国語の声サンプルを録音し、30以上のサポート言語で音声を生成します。AIは、音色、ピッチ、話し方などのユニークな声の特徴を保持しながら、目標言語で母国語のように聞こえる発音を生成します。世界中の聴衆に届けたいコンテンツクリエイターにとって完璧です。
- 10秒の音声サンプルが必要です
- あなたの声の特徴を言語間で保存します
- 母語発音と音調
- モデル: CosyVoice2, OpenVoice, 魚の話し方
コンテンツのローカル化
多言語にビデオ、コース、ポッドキャストを現地化し、同じ発話者の声を保持します。YouTubeクリエイターは、同じビデオを英語、スペイン語、ヒンディー語、日本語で公開できます。それぞれの言語で自然に聞こえる独自の声で。ダビングスタジオは必要ありません。
- 再録音なしでコンテンツをローカル化
- すべての言語版で同じ声
- 大型プロジェクトのバッチ処理
- 自動化パイプラインのAPI統合
多言語API統合
1つのAPIコールで任意の言語で音声を生成します
import requests
languages = {
"en": "Hello, welcome to our service!",
"es": "Hola, bienvenido a nuestro servicio!",
"ja": "こんにちは、サービスへようこそ!",
"hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
"ar": "مرحبا، مرحبا بكم في خدمتنا!"
}
for lang, text in languages.items():
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": text,
"model": "cosyvoice2",
"language": lang,
"format": "mp3"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open(f"welcome_{lang}.mp3", "wb") as f:
f.write(response.content)
言語別価格設定なし
30以上の言語がすべてのプランに含まれています。英語以外の言語は追加料金がかかりません。
フリータイア
$0
登録時に15,000文字
- MeloTTS 多言語 (フリー)
- 6言語以上のフリータイア
- 登録は必要ありません
スターター
$9
月間50万文字
- すべての30以上の言語
- 言語間クローン
- すべての多言語モデル
プロ
$29
月間200万文字
- 優先多言語処理
- バッチローカライゼーション
- エンタープライズAPIアクセス
よくある質問
多言語テキストから音声への関連問題
改善点は何ですか?フィードバックは問題を解決するのに役立ちます。