About TTS.ai

最も総合的なオープンソースの 音声AIプラットフォーム 24以上のモデル 100以上の声 全て一つの場所に

私たちの使命

TTS.aiは,「最良のAI音声技術は誰にでもアクセス可能であるべきである」という単純な信念に基づいて構築された。

私たちはオープンソースの 最高の音声AIモデルを一つの 使いやすいプラットフォームにまとめました ベンダーロックインなし データ収集なし 公平な価格で 強力な音声技術だけです

私たちが提供するもの

テキストを音声に変換

Kokoro、Chatterbox、Barkなど24以上のモデル。高速で軽量なシンセからスタジオ品質の出力まで。

音声からテキストへ

Whisper、Faster-Whisper、および SenseVoice により動作します。タイムスタンプと話者検出を備えた 100 以上の言語のオーディオを転写します。

音声クローン

5 秒のサンプルからどんな音声でもクローンできます。Chatterbox、GPT-SoVITS、CosyVoice 2 など。プロジェクトのためのカスタム音声を作成します。

オーディオ処理

オーディオを強化し、ボーカルを削除し、ステムを分割し、エコー/リバーブを削除し、キー/BPMを検出し、フォーマットを変換します。すべて人工知能で動作します。

ボイスチャット

人工知能によるリアルタイムの音声会話。インタラクティブなチャット体験のためにモデルと音声を選択してください。

開発者API

OpenAI 互換の REST API。Python SDK、コード例、および詳細なドキュメント。アプリケーションに音声機能をビルドします。

オープンソースファースト

TTS.aiのすべてのモデルはオープンソースであり、MITまたはApache 2.0ライセンス下でライセンスされています。

私たちは

Kokoro
Chatterbox
CosyVoice 2
Bark
Fish Speech
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Whisper
Demucs
And more...

すべてのモデルの重みは公式のリポジトリからダウンロードされます。プロプライエタリな修正は加えません。

インフラ

TTS.ai は NVIDIA Tesla P40 グラフィックプロセッサ (96GB VRAM 合計) を搭載した専用 GPU サーバ上で動作します。

  • 推論用の専用 GPU クラスタ - 共有リソースなし
  • モデルのVRAM要求に基づく動的GPU割り当て
  • 最適スループットのための5キュー優先システム
  • インスタント推論のために VRAM に予めロードされたモデル
  • 高速ダウンロードのためのCDNサポートオーディオ配信

プライバシーとセキュリティ

  • データ訓練なし: モデルを訓練するために音声やテキストを使うことはありません。
  • 生成されたオーディオは 24 時間後に自動的に削除されます。
  • 暗号化: すべてのデータは転送中 (TLS 1.2+) と停止中に暗号化されます。
  • 追跡なし
  • GDPR compliant: いつでもデータの削除を要求できます

TTS.aiについて

TTS.aiは、AI音声技術を誰にでもアクセス可能にすることに情熱を持つ独立した開発チームによって構築された。私たちは、プロプライエタリなものを訓練するよりも、コミュニティからの最良のオープンソースモデルを管理し、サービスを提供している。

インフラストラクチャは96GBのVRAMを提供するNVIDIA Tesla P40 GPUを備えた専用サーバ上で動作し,ウェブフロントエンドとGPU推論サーバは低遅延接続のセキュリティデータセンタにホストされている。

テキスト入力はリアルタイムで処理され、永続的に保存されません。アップロードされたすべての音声ファイルは24時間以内に自動的に削除されます。AIモデルを訓練するためにあなたのデータを使用することはありません。

TTS.aiは,世界中の開発者,コンテンツクリエイタ,企業のコミュニティにサービスを提供し,24以上のAIモデルで毎日数千の音声生成要求を処理している。

私たちは専用のGPUインフラストラクチャと5キュー優先システムで高い可用性を追求し,フリーユーザには正式なSLAを提供していないが,有料プランは優先処理とより高い信頼性の利点を得ている。

はい、TTS.aiのすべてのモデルはオープンソースであり、MITまたはApache 2.0のライセンス下にある。我々はオープンソース音声AIコミュニティを積極的にサポートし、最適化とエコシステムへの統合に寄与しています。

私たちのロードマップには,リリースに伴う最新のモデルの追加,言語サポートの拡張,リアルタイム音声チャット機能の改善,さらなる音声処理ツールの構築が含まれ,最新のオープンソース音声AI進歩を継続的に統合している。

私たちは常に音声AIとオープンソース技術に情熱を持つ才能ある開発者に興味を持っています。貢献に興味があれば、私たちのコンタクトページを通じて連絡してください。

音声AIを自社製品に統合したい開発者、企業、組織とのパートナーシップを歓迎します。API統合、ボリュームプライシング、カスタムモデルデプロイメントについては、お気軽にお問い合わせください。

We conduct regular security reviews of our infrastructure. All data is encrypted in transit with TLS 1.2+, passwords are hashed with industry-standard algorithms, and API keys use one-way hashing. Server access is restricted to authorized personnel via SSH keys.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

We continuously monitor the open-source voice AI landscape and add new models as they become available and prove their quality. Major model updates typically happen monthly, with minor optimizations deployed on an ongoing basis.