情報

20以上のモデル 100以上の声 全て一つの場所に

作成者

TTS.aiは John Nader (nadermx), 独立した開発者で オープンソースのAIツールを作っています TTS.aiは 最高のAI音声テクノロジーを 誰にでもアクセス可能にするミッションの一部です

私たちの使命

TTS.aiは 単純な信念に基づいて作られました 最高のAI音声テクノロジーは 誰にでも手に入るべきです. プロプライエタリサービスは基本的なテキストから音声に対してプライム価格を課す一方で,オープンソースコミュニティは商用品質に匹敵するかそれを超えるモデルを作成している。

私たちは最良のオープンソースの 音声AIモデルを 単一の 使いやすいプラットフォームに 集約した 売り手のロックインもなく データ収集もなく 公平な価格で 強力な音声技術だけ

ワット・ウィ・オファー

テキストから音声へ

Kokoro、Chatterbox、Barkなど20以上のモデル。高速で軽量なシンセからスタジオ品質の出力まで。

音声からテキストへ

Whisper、Faster-Whisper、および SenseVoice により動作します。タイムスタンプと話者検出を備えた 100 以上の言語のオーディオを転写します。

音声クローン

5 秒のサンプルからどんな音声でもクローンできます。Chatterbox、GPT-SoVITS、CosyVoice 2 など。プロジェクトのためのカスタム音声を作成します。

オーディオ処理

オーディオを強化し、ボーカルを削除し、ステムを分割し、エコー/リバーブを削除し、キー/BPMを検出し、フォーマットを変換します。すべて人工知能で動作します。

ボイスチャット

人工知能を使ったリアルタイムの音声会話。インタラクティブなチャット体験のためにモデルと音声を選択してください。

開発者API

OpenAI 互換の REST API。Python SDK、コード例、および詳細なドキュメント。アプリケーションに音声機能をビルドします。

オープンソースファースト

TTS.aiのすべてのモデルはオープンソースであり、MITまたはApache 2.0ライセンス下でライセンスされています。

私たちは

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
それに...

すべてのモデルの重みは公式のリポジトリからダウンロードされます。プロプライエタリな修正は加えません。

インフラ

TTS.ai は NVIDIA Tesla P40 グラフィックプロセッサ (96GB VRAM 合計) を搭載した専用 GPU サーバ上で動作します。

  • 推論用の専用 GPU クラスタ - 共有リソースなし
  • モデルのVRAM要求に基づく動的GPU割り当て
  • 最適スループットのための5列優先システム
  • インスタント推論のために VRAM に予めロードされたモデル
  • 高速ダウンロードのためのCDNサポートオーディオ配信

プライバシーとセキュリティ

  • データ訓練なし: モデルを訓練するために 音声やテキストを使うことはありません
  • 自動削除: 生成されたオーディオは24時間後に自動的に削除されます
  • 暗号化: すべてのデータは転送中 (TLS 1.2+) と静止中に暗号化されます。
  • 追跡なし: 私たちは
  • GDPR に準拠: いつでもデータの削除を要求できます

TTS.aiについて

TTS.aiは、AI音声技術を誰にでもアクセス可能にするために情熱を持つ独立開発者のジョン・ネイダー(nadermx)によって作成された。私たちは、プロプライエタリなものを訓練するよりも、コミュニティからの最良のオープンソースモデルを管理し、サービスしています。

インフラストラクチャは96GBのVRAMを提供するNVIDIA Tesla P40 GPUを備えた専用サーバ上で動作し,ウェブフロントエンドとGPU推論サーバは低遅延接続のセキュリティデータセンタにホストされている。

テキスト入力はリアルタイムで処理され、永続的に保存されません。アップロードされたすべての音声ファイルは24時間以内に自動的に削除されます。AIモデルを訓練するためにあなたのデータを使用することはありません。

TTS.ai serves a growing community of developers, content creators, and businesses worldwide. Our platform handles thousands of voice generation requests daily across 20+ AI models.

無料プランでは正式なSLAを提供していないが,有料プランでは優先処理と高い信頼性を得ることができる。

TTS.aiの全モデルは MITまたはApache 2.0のライセンスで オープンソースです オープンソースの音声AIコミュニティを積極的にサポートし、最適化と統合を生態系に貢献します

また,音声処理ツールの開発においても,オープンソースの音声AI技術を継続的に統合し,音声処理の高度化を図る。

TTS.aiはソロ開発者によって作成され、維持されています。 だから、空きポジションはありません。 しかし、オープンソースの貢献はいつでも歓迎されます。 コンタクトページまたは GitHub を通じて連絡してください。

音声AIを自社製品に統合したい開発者、企業、組織とのパートナーシップを歓迎します。API統合、ボリュームプライシング、カスタムモデルデプロイメントについては、お気軽にお問い合わせください。

私たちはインフラストラクチャの定期的なセキュリティレビューを行っています。全てのデータは TLS 1.2+ で暗号化されており、パスワードは産業標準アルゴリズムでハッシュされ、APIキーは一方向ハッシュを使用しています。サーバアクセスはSSHキーを通じて認可された人員に限定されています。

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

オープンソースの音声AI環境を継続的にモニタし,新しいモデルが利用可能になり,その品質が証明されたときに追加する。

質問は?フィードバックは?

連絡先 API ドキュメント