情報
20以上のモデル 100以上の声 全て一つの場所に
作成者
TTS.aiは John Nader (nadermx), 独立した開発者で オープンソースのAIツールを作っています TTS.aiは 最高のAI音声テクノロジーを 誰にでもアクセス可能にするミッションの一部です
私たちの使命
TTS.aiは 単純な信念に基づいて作られました 最高のAI音声テクノロジーは 誰にでも手に入るべきです. プロプライエタリサービスは基本的なテキストから音声に対してプライム価格を課す一方で,オープンソースコミュニティは商用品質に匹敵するかそれを超えるモデルを作成している。
私たちは最良のオープンソースの 音声AIモデルを 単一の 使いやすいプラットフォームに 集約した 売り手のロックインもなく データ収集もなく 公平な価格で 強力な音声技術だけ
ワット・ウィ・オファー
テキストから音声へ
Kokoro、Chatterbox、Barkなど20以上のモデル。高速で軽量なシンセからスタジオ品質の出力まで。
音声からテキストへ
Whisper、Faster-Whisper、および SenseVoice により動作します。タイムスタンプと話者検出を備えた 100 以上の言語のオーディオを転写します。
音声クローン
5 秒のサンプルからどんな音声でもクローンできます。Chatterbox、GPT-SoVITS、CosyVoice 2 など。プロジェクトのためのカスタム音声を作成します。
オーディオ処理
オーディオを強化し、ボーカルを削除し、ステムを分割し、エコー/リバーブを削除し、キー/BPMを検出し、フォーマットを変換します。すべて人工知能で動作します。
ボイスチャット
人工知能を使ったリアルタイムの音声会話。インタラクティブなチャット体験のためにモデルと音声を選択してください。
開発者API
OpenAI 互換の REST API。Python SDK、コード例、および詳細なドキュメント。アプリケーションに音声機能をビルドします。
オープンソースファースト
TTS.aiのすべてのモデルはオープンソースであり、MITまたはApache 2.0ライセンス下でライセンスされています。
私たちは
すべてのモデルの重みは公式のリポジトリからダウンロードされます。プロプライエタリな修正は加えません。
インフラ
TTS.ai は NVIDIA Tesla P40 グラフィックプロセッサ (96GB VRAM 合計) を搭載した専用 GPU サーバ上で動作します。
- 推論用の専用 GPU クラスタ - 共有リソースなし
- モデルのVRAM要求に基づく動的GPU割り当て
- 最適スループットのための5列優先システム
- インスタント推論のために VRAM に予めロードされたモデル
- 高速ダウンロードのためのCDNサポートオーディオ配信
プライバシーとセキュリティ
- データ訓練なし: モデルを訓練するために 音声やテキストを使うことはありません
- 自動削除: 生成されたオーディオは24時間後に自動的に削除されます
- 暗号化: すべてのデータは転送中 (TLS 1.2+) と静止中に暗号化されます。
- 追跡なし: 私たちは
- GDPR に準拠: いつでもデータの削除を要求できます