バグ/機能要求を報告

オープンソーステキスト・トゥ・スピーチモデル

私たちのプラットフォーム上のすべてのTTSモデルは、商業的に友好的なライセンスでオープンソースです。MIT、Apache 2.0 - プロプライエタリロックイン、使用制限、驚くべきライセンス料はありません。私たちのホストされたAPIを通じて使用するか、完全なコントロールで自分のインフラストラクチャ上で自己ホストします。

オープンソース MITライセンスアパッチ2.0 セルフホスタブル GitHub

完全な TTS エディタ API ドキュメント

トライ・イット・ナウ

0/500

無料でココロ、パイパー、VITS、メロTTS

生成されたオーディオはここに表示されます

完全な TTS エディタを開く

オープンソースTTS

オープンソースモデルがプロジェクトに重要な理由

全てオープンソースライセンス

TTS.aiのすべてのモデルはオープンソースライセンスを使用しており、プロプライエタリなブラックボックス、ベンダーロックイン、予想外のライセンス料はありません。

アパッチ

モデルは MIT または Apache 2.0 のライセンスでライセンスされています。これは最も寛容なオープンソースライセンスです。商用利用、修正、再配布は制限なしです。

セルフホスタブル

任意のモデルをダウンロードして、自分のハードウェアで実行します。データ、遅延、インフラストラクチャを完全にコントロールできます。クラウド依存性は必要ありません。

GPU 最適化

モデルはCUDAサポートのNVIDIA GPUに最適化されています。PiperはCPUのみで動作します。効率的な推論にはほとんどのモデルで2-8GBのVRAMが必要です。

コミュニティ管理

活発なオープンソースコミュニティがこれらのモデルを維持し、改善しています。GitHubにバグ、改善、新しい声を提出することで、貢献を歓迎しています。

商用利用OK

すべてのモデルはライセンスの下で商業的な使用を許可しています。製品を作成し、サービスを販売し、商業的なコンテンツをロイヤリティや使用料なしで作成できます。

オープンソースモデルカタログ

それぞれのモデル、ライセンス、それが最も得意なこと

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

ファスト 5/5

適応する: Apache 2.0 - 最高品質のフリーモデル、82Mパラメータ、簡単なセルフホスティング

試してみる Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

ファスト 3/5

適応する: MIT — CPU のみ、エッジデバイスや組み込みセルフホスティングに適している

試してみる Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

ファスト 3/5

適応する: MIT — 多くのダウンストリームモデルで使われている基礎アーキテクチャ

試してみる VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

スロー 4/5

適応する: MIT — 標準のTTSを超えるユニークなオーディオ生成能力

試してみる Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

スロー 5/5 音声クローン

適応する: Apache 2.0 - 最高品質、広く研究された参照実装

試してみる Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

メディア 4/5 音声クローン

適応する: MIT — 粒状スタイル制御を備えたオープンソースの音声クローン

試してみる OpenVoice

オープンソース TTS の使い方

ホストされた API を使うか、自分でモデルを実行します

オープンソースモデルを探索

20以上のオープンソース TTS モデルのカタログをブラウズしてください。各モデルページはライセンス、アーキテクチャ、機能、セルフホスティング要件を示しています。

ブラウザで試してみる

何もインストールせずに TTS.ai 上で直接どんなモデルでもテストできます。私たちの GPU サーバが処理を行うので、セルフホスティングに取り組む前に品質を評価できます。

自己ホストか、我々の API を使用

GitHub からモデルリポジトリをクローンしてローカルで実行するか、プロダクション用にホストされた API を使用します。セルフホスティングは完全なコントロールを与え、我々の API は管理されたインフラストラクチャを提供します。

アプリケーションを作成

自己ホストモデルまたはREST APIを使ってTTSをプロダクトに統合します。すべてのモデルはライセンス料やロイヤリティなしで商用利用可能です。

ライセンス比較

TTS.aiの全モデルは商用に適したオープンソースライセンスを使用している。

モデル	ライセンス	著作権
Kokoro	Apache 2.0	必須
Piper	MIT	オプション
VITS	MIT	オプション
MeloTTS	MIT	オプション
Chatterbox	MIT	オプション
Tortoise TTS	Apache 2.0	必須
StyleTTS 2	MIT	オプション
OpenVoice	MIT	オプション
Sesame CSM	Apache 2.0	必須
Orpheus	Llama 3.2	"Built with Llama"

これらのモデルを無料で試してみる

セルフホスティングとホストAPI

自分でモデルを実行するか、インフラストラクチャを我々に任せるか

自分のハードウェアでセルフホスト

TTS.ai のすべてのモデルは GitHub または Hugging Face でオープンソースプロジェクトとして利用できます。重みをダウンロードし、依存関係をインストールし、自分の GPU で推論を実行します。遅延、プライバシー、スケーリングを完全にコントロールできます。

完全なデータプライバシー — オーディオはサーバを離れません
初期設定後はリクエスト当たりのコストはありません
自分のデータをカスタムフィット
GPU ハードウェアが必要 (NVIDIA を推奨)
更新、スケールアップ、依存関係の管理

TTS.ai ホスト API を使う

REST APIを使って20以上のモデルに即座にアクセスできます。GPUプロビジョニング、モデル更新、キュー管理、スケーリングを行います。1つのAPIキーで全てのモデルにアクセスできます。別々のデプロイメントを管理する必要はありません。

GPU ハードウェアが必要ありません
1つのAPIを通して20以上のモデルを全てサポート
自動モデル更新と改善
冗長インフラで99.9%の稼働率
使用分だけ支払う

ホストされた API を使う

クイックスタート: API またはセルフホスト

私たちのホストAPIを使用するか、Kokoroをローカルに数分でインストールします

選択肢 1: TTS.ai ホスト API 最も簡単

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

オプション 2: pip でセルフホストフルコントロール

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API ドキュメントを表示

オープンソースで安価

これらのＡＰＩは，ＧＰＵを管理することなくオープンソースのＴＴＳをアクセスできるようにする。

フリー・タイア

登録で50クレジット

4つのオープンソースモデルがフリーで
基本的な使用にはサインしない
商業利用許可

スター

500クレジット/月

すべての20+オープンソースモデル
声のクローン
APIアクセス

プロ

$29

月間200万文字

優先GPU処理
プレミアムモデル
エンタープライズサポート

価格を見る

よくある質問

オープンソースのテキスト・トゥ・スピーチに関するよくある質問

TTS.aiのすべてのモデルは MIT または Apache 2.0 のいずれかの許容的なオープンソースライセンスを使用しています。制限的なライセンス (Coqui の CPML または非商用の CC-BY-NC のような) を持つモデルは特に除外しています。各モデルのライセンスは GitHub リポジトリで確認できます。

両方とも商用利用、修正、再配布を許容するオープンソースライセンスです。Apache 2.0は明示的な特許権を追加し、コードを修正するときは変更を明示する必要があります。MITは要求が少なく、単純です。両方ともビジネスに適しています。

はい。すべてのモデルは自己ホスト可能です。GitHubからモデルリポジトリをクローンし、依存関係をインストールし、モデル重みをダウンロードし、推論を実行します。GPU、RAM、Pythonバージョンを含む各モデルの自己ホスト要求事項に関するドキュメントを提供しています。

必要条件はモデルによって異なります。PiperはGPUを必要としません(CPUのみ)。KokoroとMeloTTSは1-2GBのVRAMを必要とします。ほとんどの標準モデルは4GBのVRAMを必要とします。TortoiseとSesame CSMは8GBを必要とします。NVIDIA RTX 3060 (12GB) はほとんどのモデルで快適に動作します。

はい。オープンソースライセンスは微調整を含む修正を許可します。GPT-SoVITS や Bark のようなモデルは微調整スクリプトを提供します。自分の音声データでモデルを訓練してカスタム音声を作成したり、特定の言語のパフォーマンスを向上させることができます。

オープンソースのトップモデル（Ｋｏｋｏｒｏ，ＳｔｙｌｅＴＴＳ２，Ｃｈａｔｔｅｒｂｏｘ）は，品質ベンチマークにおいて，ＥｌｅｖｅｎＬａｂｓやＧｏｏｇｌｅのような商用ＴＴＳサービスと同等あるいはそれを上回っている。

これらはすでに除外されています。XTTS/XTTS-v2（Coqui's CPML - 非商用）、F5-TTS（CC-BY-NC - 非商用）、Higgs-v2（ボソンライセンス - 制限）はすべて除外されました。TTS.aiのすべてのモデルは商用に安全であることを確認しました。

はい。ほとんどのモデルは GitHub を通じてコミュニティの貢献を受け入れます。バグレポート、新しい言語の音声録音、コードの改善、ドキュメントを提出できます。各モデルの GitHub リポジトリをチェックして、貢献のガイドラインと活動中の問題を確認してください。

GPU メモリを共有するために、要求に応じてモデルをロードし、無効になったときにロードを解除します。我々の GPU サーバはダイナミックローディングを使用して 4x Tesla P40 (総 VRAM 96GB) 上で 20 以上のモデルを実行します。セルフホスティングの場合、1 つの 24GB GPU は 3-5 モデルを同時にサービスできます。

多くのモデルは公式の Docker イメージまたは Dockファイルを提供しています。複数のモデルを実行する場合は、GPUアクセスのための NVIDIA Container Toolkit でカスタム Docker 設定を作成できます。APIサーバアーキテクチャは参照実装として役立ちます。

ほとんどのモデルは Python 3.10-3.12 を必要とします。Coqui TTS (VITS) は特に Python 3.11 を必要とします。ほとんどのモデルには Python 3.12 を推奨します。正確なバージョン互換性については、各モデルの requirements.txt を確認してください。

はい。MITとApache 2.0ライセンスは明示的に商用利用を許可しています。これらのモデルを使って、ライセンス料、ロイヤリティ、署名要求なしにSaaS製品、モバイルアプリケーション、ゲーム、サービスを作成できます（署名は歓迎されています）。

5.0/5 (1)

オープンソース TTS を今すぐ試してみてください

20以上のオープンソースモデル、すべて商用ライセンス。APIを使用するか、セルフホストを使用するか、あなたが選択できます。

無料登録価格を表示

オープンソーステキスト・トゥ・スピーチモデル

トライ・イット・ナウ

TTS.aiが気に入りましたか？友達に教えてあげましょう！

オープンソースTTS

全てオープンソースライセンス

アパッチ

セルフホスタブル

GPU 最適化

コミュニティ管理

商用利用OK

オープンソースモデルカタログ

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

オープンソース TTS の使い方

オープンソースモデルを探索

ブラウザで試してみる

自己ホストか、我々の API を使用

アプリケーションを作成

ライセンス比較

セルフホスティングとホストAPI

自分のハードウェアでセルフホスト

TTS.ai ホスト API を使う

クイックスタート: API またはセルフホスト

オープンソースで安価

フリー・タイア

スター

プロ

よくある質問

TTS.aiのモデルは全てオープンソースなのか？

MITライセンスとApache 2.0ライセンスの違いは何ですか？

私はこのモデルを自分のサーバでホストできるのか？

TTSモデルをセルフホストするにはどのGPUが必要ですか？

オープンソースのTTSモデルを微調整できるか？

オープンソースＴＴＳモデルは商用サービスとどのように比較されるか。

私が避けるべき限定的なライセンスのモデルはありますか。

私はこのオープンソースモデルに貢献できるのか？

1つのGPUサーバで複数のモデルを実行するにはどうすればよいですか？

自己ホスティングのための Docker イメージはありますか？

自己ホスティングにはどのバージョンの Python が必要ですか？

これらのモデルを用いて商用製品を作成できるか？

オープンソース TTS を今すぐ試してみてください