多言語テキストから音声へ

30 以上の言語で自然に聞こえる発音を生成します。ヒンディー語や日本語からアラビア語やスペイン語まで、AI モデルは本物の多言語音声合成を提供します。ローカル化、言語学習、国際コンテンツ、クロス言語音声クローンに最適です。

30以上の言語 ヒンディー語 日本語 スペイン語 アラビア語

トライ・イット・ナウ

無料でココロ、パイパー、VITS、メロTTS
生成されたオーディオはここに表示されます
生成
TTS.aiが気に入りましたか?友達に教えてあげましょう!

多言語 TTS 機能

世界的な音声合成

30以上の言語

英語、ヒンディー語、日本語、スペイン語、中国語、アラビア語、韓国語、フランス語、ドイツ語、ロシア語、ポルトガル語など30以上の言語で音声を生成します。

母語発音

各モデルは母語話者の録音に基づいて訓練され,サポートされている各言語に対して本物の発音,音調,リズムを確保する。

クロス言語クローン

一つの言語の音声をクローンし、他の言語の音声を生成します。CosyVoice 2 はグローバルコンテンツのために 8 言語の音声アイデンティティを保持します。

RTL 言語サポート

アラビア語、ヘブライ語、ウルドゥー語、ペルシア語を含む右から左への言語を完全にサポートし、正確なテキスト処理と自然な音声出力を提供します。

言語検出

また,自動言語検出は,入力テキスト言語を識別し,適切なモデルと音声へのルートを決定し,最適な発音品質を実現する。

アクセント変種

アメリカ英語、イギリス英語、インド英語、オーストラリア英語、ヨーロッパスペイン語、ラテンアメリカスペイン語、その他の地域の変種。

多言語TTSのベストモデル

最も広い言語サポートと最も良い言語間品質を持つモデル

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 音声クローン

適応する: 最良の多言語モデル — 8 言語のクロス言語音声クローン

試してみる CosyVoice 2

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

適応する: 言語ごとに複数のアクセントを持つフリーの多言語TTS

試してみる MeloTTS

GPT-SoVITSGPT-SoVITS

Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Slow 5/5 音声クローン

適応する: 英語、中国語、日本語、韓国語のクローン

試してみる GPT-SoVITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

適応する: 感情表現と音響効果を備えた13以上の言語

試してみる Bark

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

適応する: スタジオ品質の9言語にわたる超高速生成

試してみる Kokoro

多言語音声の生成方法

任意の言語で数秒で自然に話す

1

言語を選択

30 以上の言語をサポートしています。システムは入力テキストの言語を自動的に検出して便利にします。

2

任意の言語でテキストを入力

ターゲット言語でテキストを入力または貼り付けます。完全な Unicode サポートは CJK、デヴァナガリ、アラビア語、キリル文字などのすべての文字を扱います。

3

ネイティブ音声を選択

言語に最適化された音声を選択します。各言語は、利用可能な場合は地域アクセントの変種を含む複数の音声オプションを提供します。

4

生成とダウンロード

母語発音で音声を生成し、MP3 または WAV としてダウンロードします。複数言語でバッチ生成するための API を使用します。

サポートされている言語

多言語 TTS モデルで利用可能な言語

アメリカとヨーロッパ

  • 英語 (米国、イギリス、オーストラリア)
  • スペイン語 (ES, MX)
  • ポルトガル語 (BR, PT)
  • フランス語 (FR, CA)
  • ドイツ語
  • イタリア語Name
  • オランダ語Name
  • ポーランド語Name

東アジア

  • 中国語 (普通話)
  • 中国語 (広東語)
  • 日本語
  • 韓国語
  • ベトナム語Name
  • タイ語
  • インドネシア語
  • マレー語

南アジア・中東

  • ヒンディー語Name
  • アラビア語
  • トルコ語Name
  • ベンガル語Name
  • タミル語
  • ウルドゥー語Name
  • ペルシア語
  • ヘブライ語

その他の言語

  • ロシア語
  • ウクライナ語Name
  • チェコ語
  • ルーマニア語
  • ギリシア語
  • スウェーデン語
  • フィンランド語Name
  • ハンガリー語

言語間音声クローン

どんな言語でも自分の声で話せる

クローン・ユア・ボイス・スピーク・アンド・アナウンス

10秒の母国語の声サンプルを録音し、30以上のサポート言語で音声を生成します。AIは、音色、ピッチ、話し方などのユニークな声の特徴を保持しながら、目標言語で母国語のように聞こえる発音を生成します。世界中の聴衆に届けたいコンテンツクリエイターにとって完璧です。

  • 10秒の音声サンプルが必要です
  • あなたの声の特徴を言語間で保存します
  • 母語発音と音調
  • モデル: CosyVoice2, OpenVoice, 魚の話し方

コンテンツのローカル化

多言語にビデオ、コース、ポッドキャストを現地化し、同じ発話者の声を保持します。YouTubeクリエイターは、同じビデオを英語、スペイン語、ヒンディー語、日本語で公開できます。それぞれの言語で自然に聞こえる独自の声で。ダビングスタジオは必要ありません。

  • 再録音なしでコンテンツをローカル化
  • すべての言語版で同じ声
  • 大型プロジェクトのバッチ処理
  • 自動化パイプラインのAPI統合

多言語API統合

1つのAPIコールで任意の言語で音声を生成します

Python 多言語音声生成 REST API
import requests

languages = {
    "en": "Hello, welcome to our service!",
    "es": "Hola, bienvenido a nuestro servicio!",
    "ja": "こんにちは、サービスへようこそ!",
    "hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
    "ar": "مرحبا، مرحبا بكم في خدمتنا!"
}

for lang, text in languages.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "cosyvoice2",
        "language": lang,
        "format": "mp3"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"welcome_{lang}.mp3", "wb") as f:
        f.write(response.content)

言語別価格設定なし

30以上の言語がすべてのプランに含まれています。英語以外の言語は追加料金がかかりません。

フリータイア

$0

登録時に15,000文字

  • MeloTTS 多言語 (フリー)
  • 6言語以上のフリータイア
  • 登録は必要ありません

スターター

$9

月間50万文字

  • すべての30以上の言語
  • 言語間クローン
  • すべての多言語モデル

プロ

$29

月間200万文字

  • 優先多言語処理
  • バッチローカライゼーション
  • エンタープライズAPIアクセス
価格を見る

よくある質問

多言語テキストから音声への関連問題

TTS.aiは、英語、ヒンディー語、日本語、スペイン語、中国語(普通話)、アラビア語、韓国語、フランス語、ドイツ語、ロシア語、ポルトガル語、イタリア語、トルコ語、ポーランド語、オランダ語、スウェーデン語など、30以上の言語をサポートしています。カバー範囲はモデルによって異なります。

Bark はヒンディー語をネイティブでサポートしており、発音の質は良いです。ヒンディー語の声のクローンには CosyVoice 2 が言語間合成を提供します。Piper はプロダクションアプリケーションのために CPU で効率的に動作するヒンディー語の声も提供します。

はい。Kokoro、MeloTTS、CosyVoice 2、GPT-SoVITS、VITSはすべて日本語の母語発音をサポートしています。KokoroとCosyVoice 2は、正しいピッチアクセントと音調パターンを持つ最高品質の日本語TTSを提供します。

母語話者データを用いて訓練されたモデルは、サポートされている言語の正確な発音を生成します。Kokoro と CosyVoice 2 は、サポートされている言語のほぼ正確な発音を実現します。正確さはモデルと言語によって異なります。最適な結果を得るには、各モデルの言語リストを確認してください。

これはクロス言語音声クローンと呼ばれます。CosyVoice 2は英語サンプルから音声をクローンし、話者の声のアイデンティティと特徴を保持しながら中国語、日本語、韓国語、その他5言語で音声を生成します。

はい。私たちのテキスト処理パイプラインは RTL 文字を正しく扱います。アラビア語、ヘブライ語、ウルドゥー語、ペルシア語のテキストは、ダイアクリティカルマークや連結文字形式の処理を含めて、正しく処理され、適切な発音を持つ音声に変換されます。

いくつかのモデルはコードスイッチング (言語の混合) を自然に処理します。CosyVoice 2 と GPT-SoVITS は、それぞれの言語セグメントに適切な発音を持つ二言語テキストを処理できます。最良の結果を得るには、各世代を一つの言語で保持してください。

MeloTTSはアメリカ英語、イギリス英語、インド英語、オーストラリア英語のアクセントを提供します。他のモデルは異なる音声選択によって様々な英語アクセントのオプションを提供します。Piperは100以上の音声カタログで最も幅広い英語アクセントの音声を提供します。

はい。フリーモデルは複数の言語をサポートします: Kokoro (9 言語), Piper (30 以上), MeloTTS (6 言語), VITS (4 言語)。多言語の音声をコストなしで生成できます。プレミアムモデルは追加の言語とクロス言語クローンのような機能を提供します。

ココロ、コシーボイス 2、メロTTS、GPT-SoVITS、フィッシュスピーチ、バークなどの多くのモデルが中華語をサポートしています。コシーボイス 2 と GPT-SoVITS は、正しい音色処理で最高の中華語品質を提供します。中国語テキストを貼り付けて中国語音声を選択するだけです。

はい。Kokoro、CosyVoice 2、MeloTTS、GPT-SoVITS、VITS は韓国語をサポートします。Kokoro は韓国語 TTS の速度と品質の最良のバランスを提供します。CosyVoice 2 は韓国語コンテンツのための音声クローン機能を追加しました。

テキスト処理パイプラインは数字、日付、通貨、一般的な略語を各言語の慣習に従って正規化します。例えば、「1,000」は英語とドイツ語で異なる発音をします。システムは選択した言語に基づいてこれらの変換を自動的に処理します。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

人工知能でどんな言語でも話せ

30以上の言語で自然な音声を生成します。無料版には多言語モデルが含まれています。登録は不要です。