フリーAI テキストを音声に変換
20+ オープンソースモデルや 107+ 声 32+ アカウントは必要ありません
音声AIに必要なすべて
オープンソースAIモデルに基づく30以上のツール
20+ AIボイスモデル
1つのプラットフォームにおけるオープンソースのTTSモデルの最も包括的なコレクション
Kokoro Free
Kokoroは8200万パラメータのテキストから音声を生成するモデルで、その重量クラスをはるかに上回ります。小さなサイズにもかかわらず、驚くほど自然で表現力のある音声を生成します。Kokoroは英語、日本語、中国語、韓国語を含む複数の言語をサポートし、様々な表現力のある音声を提供します。信じられないほど高速に動作し、GPUでのリアルタイム生成よりも100倍速く音声を生成します。
適応する: 遅延を最小限に抑えた高品質のTTS、ストリーミングアプリケーション
無料トライ
Piper Free
Piperは、Rhasspyが開発した軽量テキストから音声に変換するエンジンで、VITSとlarynxアーキテクチャを使用しています。完全にCPU上で動作し、エッジデバイス、ホームオートメーション、オフライン TTSを必要とするアプリケーションに適しています。30以上の言語に渡る100以上の音声を持ち、PiperはRaspberry Pi 4でもリアルタイムで自然に聞こえる音声を提供します。
適応する: クイックプレビュー、アクセシビリティ、組み込みアプリケーション
無料トライ
VITS Free
VITS(Variational Inference with advanced learning for end‐to‐end Text‐to‐Speak)は,従来の2段階モデルよりも自然に聞こえる音声を生成する並列エンド‐to‐end TTS法である。
適応する: 自然な韻律を持つ汎用テキスト・トゥ・スピーチ
無料トライ
MeloTTS Free
MyShell.ai による MeloTTS は、英語 (アメリカ、イギリス、インド、オーストラリア)、スペイン語、フランス語、中国語、日本語、韓国語をサポートする多言語 TTS ライブラリです。非常に高速で、CPUのみで実時間に近い速度でテキストを処理します。MeloTTS はプロダクション用に設計されており、CPUとGPUの両方の推論をサポートします。
適応する: 高速で多言語のTTSを必要とするプロダクションアプリケーション
無料トライ
CosyVoice 2 Standard
アリババのスケーラブルストリーミングTTSは,人間パリティの自然さと,ほぼゼロの遅延を持つ。
開発者: Alibaba (Tongyi Lab) · ライセンス: Apache 2.0
やってみろ
Parler TTS Standard
自然言語で声を記述すると、Parler はマッチングした音声を生成します。
開発者: Hugging Face · ライセンス: Apache 2.0
やってみろ
IndexTTS-2 Standard
ゼロショットTTSは,微細な感情制御と高い表現力を持つ。
開発者: Index Team · ライセンス: Bilibili Model License
やってみろ
Spark TTS Standard
プロンプトを通して感情や話し方を制御できる音声クローンTTSを提案した。
開発者: SparkAudio · ライセンス: CC BY-NC-SA 4.0
やってみろ
Orpheus Standard
100K時間の音声データを用いて人間レベルの感情TTSモデルを訓練した。
開発者: Canopy Labs · ライセンス: Llama 3.2 Community
やってみろ
Qwen3 TTS Standard
音声クローン,プリセット音声,テキストからの音声デザインを備えたアリババの多言語TTS。
開発者: Alibaba (Qwen) · ライセンス: Apache 2.0
やってみろデベロッパーファーストAPI
OpenAI 互換の REST API。一つのエンドポイント、22以上のモデル。リアルタイムアプリケーションのストリーミングサポート。
- OpenAI互換フォーマット
- リアルタイムアプリケーションのためのストリーミングTTS
- 大型ジョブのバッチ処理
- ウェブフック通知
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
シンプルで透明な価格設定
自由に始めて 成長するにつれて拡大する