About TTS.ai
最も総合的なオープンソースの 音声AIプラットフォーム 24以上のモデル 100以上の声 全て一つの場所に
作成者
TTS.aiはによって作成された。
私たちの使命
TTS.aiは,「最良のAI音声技術は誰にでもアクセス可能であるべきである」という単純な信念に基づいて構築された。
私たちはオープンソースの 最高の音声AIモデルを一つの 使いやすいプラットフォームにまとめました ベンダーロックインなし データ収集なし 公平な価格で 強力な音声技術だけです
私たちが提供するもの
テキストを音声に変換
Kokoro、Chatterbox、Barkなど24以上のモデル。高速で軽量なシンセからスタジオ品質の出力まで。
音声からテキストへ
Whisper、Faster-Whisper、および SenseVoice により動作します。タイムスタンプと話者検出を備えた 100 以上の言語のオーディオを転写します。
音声クローン
5 秒のサンプルからどんな音声でもクローンできます。Chatterbox、GPT-SoVITS、CosyVoice 2 など。プロジェクトのためのカスタム音声を作成します。
オーディオ処理
オーディオを強化し、ボーカルを削除し、ステムを分割し、エコー/リバーブを削除し、キー/BPMを検出し、フォーマットを変換します。すべて人工知能で動作します。
ボイスチャット
人工知能によるリアルタイムの音声会話。インタラクティブなチャット体験のためにモデルと音声を選択してください。
開発者API
OpenAI 互換の REST API。Python SDK、コード例、および詳細なドキュメント。アプリケーションに音声機能をビルドします。
オープンソースファースト
TTS.aiのすべてのモデルはオープンソースであり、MITまたはApache 2.0ライセンス下でライセンスされています。
私たちは
すべてのモデルの重みは公式のリポジトリからダウンロードされます。プロプライエタリな修正は加えません。
インフラ
TTS.ai は NVIDIA Tesla P40 グラフィックプロセッサ (96GB VRAM 合計) を搭載した専用 GPU サーバ上で動作します。
- 推論用の専用 GPU クラスタ - 共有リソースなし
- モデルのVRAM要求に基づく動的GPU割り当て
- 最適スループットのための5キュー優先システム
- インスタント推論のために VRAM に予めロードされたモデル
- 高速ダウンロードのためのCDNサポートオーディオ配信
プライバシーとセキュリティ
- データ訓練なし: モデルを訓練するために音声やテキストを使うことはありません。
- 生成されたオーディオは 24 時間後に自動的に削除されます。
- 暗号化: すべてのデータは転送中 (TLS 1.2+) と停止中に暗号化されます。
- 追跡なし
- GDPR compliant: いつでもデータの削除を要求できます