オープンソーステキスト・トゥ・スピーチモデル

私たちのプラットフォーム上のすべてのTTSモデルは、商業的に友好的なライセンスでオープンソースです。MIT、Apache 2.0 - プロプライエタリロックイン、使用制限、驚くべきライセンス料はありません。私たちのホストされたAPIを通じて使用するか、完全なコントロールで自分のインフラストラクチャ上で自己ホストします。

オープンソース MITライセンス アパッチ2.0 セルフホスタブル GitHub

トライ・イット・ナウ

無料でココロ、パイパー、VITS、メロTTS
生成されたオーディオはここに表示されます
生成
TTS.aiが気に入りましたか?友達に教えてあげましょう!

オープンソースTTS

オープンソースモデルがプロジェクトに重要な理由

全てオープンソースライセンス

TTS.aiのすべてのモデルはオープンソースライセンスを使用しており、プロプライエタリなブラックボックス、ベンダーロックイン、予想外のライセンス料はありません。

アパッチ

モデルは MIT または Apache 2.0 のライセンスでライセンスされています。これは最も寛容なオープンソースライセンスです。商用利用、修正、再配布は制限なしです。

セルフホスタブル

任意のモデルをダウンロードして、自分のハードウェアで実行します。データ、遅延、インフラストラクチャを完全にコントロールできます。クラウド依存性は必要ありません。

GPU 最適化

モデルはCUDAサポートのNVIDIA GPUに最適化されています。PiperはCPUのみで動作します。効率的な推論にはほとんどのモデルで2-8GBのVRAMが必要です。

コミュニティ管理

活発なオープンソースコミュニティがこれらのモデルを維持し、改善しています。GitHubにバグ、改善、新しい声を提出することで、貢献を歓迎しています。

商用利用OK

すべてのモデルはライセンスの下で商業的な使用を許可しています。製品を作成し、サービスを販売し、商業的なコンテンツをロイヤリティや使用料なしで作成できます。

オープンソースモデルカタログ

それぞれのモデル、ライセンス、 それが最も得意なこと

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

適応する: Apache 2.0 - 最高品質のフリーモデル、82Mパラメータ、簡単なセルフホスティング

試してみる Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

適応する: MIT — CPU のみ、エッジデバイスや組み込みセルフホスティングに適している

試してみる Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

適応する: MIT — 多くのダウンストリームモデルで使われている基礎アーキテクチャ

試してみる VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

適応する: MIT — 標準のTTSを超えるユニークなオーディオ生成能力

試してみる Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 音声クローン

適応する: Apache 2.0 - 最高品質、広く研究された参照実装

試してみる Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 音声クローン

適応する: MIT — 粒状スタイル制御を備えたオープンソースの音声クローン

試してみる OpenVoice

オープンソース TTS の使い方

ホストされた API を使うか、自分でモデルを実行します

1

オープンソースモデルを探索

20以上のオープンソース TTS モデルのカタログをブラウズしてください。各モデルページはライセンス、アーキテクチャ、機能、セルフホスティング要件を示しています。

2

ブラウザで試してみる

何もインストールせずに TTS.ai 上で直接どんなモデルでもテストできます。私たちの GPU サーバが処理を行うので、セルフホスティングに取り組む前に品質を評価できます。

3

自己ホストか、我々の API を使用

GitHub からモデルリポジトリをクローンしてローカルで実行するか、プロダクション用にホストされた API を使用します。セルフホスティングは完全なコントロールを与え、我々の API は管理されたインフラストラクチャを提供します。

4

アプリケーションを作成

自己ホストモデルまたはREST APIを使ってTTSをプロダクトに統合します。すべてのモデルはライセンス料やロイヤリティなしで商用利用可能です。

ライセンス比較

TTS.aiの全モデルは商用に適したオープンソースライセンスを使用している。

モデル ライセンス 商用利用 修正 セルフホスト 著作権
Kokoro Apache 2.0 必須
Piper MIT オプション
VITS MIT オプション
MeloTTS MIT オプション
Chatterbox MIT オプション
Tortoise TTS Apache 2.0 必須
StyleTTS 2 MIT オプション
OpenVoice MIT オプション
Sesame CSM Apache 2.0 必須
Orpheus Llama 3.2 "Built with Llama"

セルフホスティングとホストAPI

自分でモデルを実行するか、インフラストラクチャを我々に任せるか

自分のハードウェアでセルフホスト

TTS.ai のすべてのモデルは GitHub または Hugging Face でオープンソースプロジェクトとして利用できます。重みをダウンロードし、依存関係をインストールし、自分の GPU で推論を実行します。遅延、プライバシー、スケーリングを完全にコントロールできます。

  • 完全なデータプライバシー — オーディオはサーバを離れません
  • 初期設定後はリクエスト当たりのコストはありません
  • 自分のデータをカスタムフィット
  • GPU ハードウェアが必要 (NVIDIA を推奨)
  • 更新、スケールアップ、依存関係の管理

TTS.ai ホスト API を使う

REST APIを使って20以上のモデルに即座にアクセスできます。GPUプロビジョニング、モデル更新、キュー管理、スケーリングを行います。1つのAPIキーで全てのモデルにアクセスできます。別々のデプロイメントを管理する必要はありません。

  • GPU ハードウェアが必要ありません
  • 1つのAPIを通して20以上のモデルを全てサポート
  • 自動モデル更新と改善
  • 冗長インフラで99.9%の稼働率
  • 使用分だけ支払う

クイックスタート: API またはセルフホスト

私たちのホストAPIを使用するか、Kokoroをローカルに数分でインストールします

選択肢 1: TTS.ai ホスト API 最も簡単
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
オプション 2: pip でセルフホスト フルコントロール
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

オープンソースで安価

これらのAPIは,GPUを管理することなくオープンソースのTTSをアクセスできるようにする。

フリー・タイア

$0

登録で50クレジット

  • 4つのオープンソースモデルがフリーで
  • 基本的な使用にはサインインしない
  • 商業利用許可

スターター

$9

500クレジット/月

  • すべての20+オープンソースモデル
  • 声のクローン
  • APIアクセス

プロ

$29

月間200万文字

  • 優先GPU処理
  • プレミアムモデル
  • エンタープライズサポート
価格を見る

よくある質問

オープンソースのテキスト・トゥ・スピーチに関するよくある質問

TTS.aiのすべてのモデルは MIT または Apache 2.0 のいずれかの許容的なオープンソースライセンスを使用しています。制限的なライセンス (Coqui の CPML または非商用の CC-BY-NC のような) を持つモデルは特に除外しています。各モデルのライセンスは GitHub リポジトリで確認できます。

両方とも商用利用、修正、再配布を許容するオープンソースライセンスです。Apache 2.0は明示的な特許権を追加し、コードを修正するときは変更を明示する必要があります。MITは要求が少なく、単純です。両方ともビジネスに適しています。

はい。すべてのモデルは自己ホスト可能です。GitHubからモデルリポジトリをクローンし、依存関係をインストールし、モデル重みをダウンロードし、推論を実行します。GPU、RAM、Pythonバージョンを含む各モデルの自己ホスト要求事項に関するドキュメントを提供しています。

必要条件はモデルによって異なります。PiperはGPUを必要としません(CPUのみ)。KokoroとMeloTTSは1-2GBのVRAMを必要とします。ほとんどの標準モデルは4GBのVRAMを必要とします。TortoiseとSesame CSMは8GBを必要とします。NVIDIA RTX 3060 (12GB) はほとんどのモデルで快適に動作します。

はい。オープンソースライセンスは微調整を含む修正を許可します。GPT-SoVITS や Bark のようなモデルは微調整スクリプトを提供します。自分の音声データでモデルを訓練してカスタム音声を作成したり、特定の言語のパフォーマンスを向上させることができます。

オープンソースのトップモデル(Kokoro,StyleTTS2,Chatterbox)は,品質ベンチマークにおいて,ElevenLabsやGoogleのような商用TTSサービスと同等あるいはそれを上回っている。

これらはすでに除外されています。XTTS/XTTS-v2(Coqui's CPML - 非商用)、F5-TTS(CC-BY-NC - 非商用)、Higgs-v2(ボソンライセンス - 制限)はすべて除外されました。TTS.aiのすべてのモデルは商用に安全であることを確認しました。

はい。ほとんどのモデルは GitHub を通じてコミュニティの貢献を受け入れます。バグレポート、新しい言語の音声録音、コードの改善、ドキュメントを提出できます。各モデルの GitHub リポジトリをチェックして、貢献のガイドラインと活動中の問題を確認してください。

GPU メモリを共有するために、要求に応じてモデルをロードし、無効になったときにロードを解除します。我々の GPU サーバはダイナミックローディングを使用して 4x Tesla P40 (総 VRAM 96GB) 上で 20 以上のモデルを実行します。セルフホスティングの場合、1 つの 24GB GPU は 3-5 モデルを同時にサービスできます。

多くのモデルは公式の Docker イメージまたは Dockファイルを提供しています。複数のモデルを実行する場合は、GPUアクセスのための NVIDIA Container Toolkit でカスタム Docker 設定を作成できます。APIサーバアーキテクチャは参照実装として役立ちます。

ほとんどのモデルは Python 3.10-3.12 を必要とします。Coqui TTS (VITS) は特に Python 3.11 を必要とします。ほとんどのモデルには Python 3.12 を推奨します。正確なバージョン互換性については、各モデルの requirements.txt を確認してください。

はい。MITとApache 2.0ライセンスは明示的に商用利用を許可しています。これらのモデルを使って、ライセンス料、ロイヤリティ、署名要求なしにSaaS製品、モバイルアプリケーション、ゲーム、サービスを作成できます(署名は歓迎されています)。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

オープンソース TTS を今すぐ試してみてください

20以上のオープンソースモデル、すべて商用ライセンス。APIを使用するか、セルフホストを使用するか、あなたが選択できます。