정보

가장 포괄적인 오픈 소스 음성 AI 플랫폼. 20+ 모델, 100+ 음성, 모두 한 곳에서.

작성자

TTS.ai는 다음에 의해 만들어졌습니다 John Nader (nadermx), TTS.ai는 모든 사람이 최고의 AI 음성 기술에 접근할 수 있도록 하는 사명의 일부입니다. 공급업체에 의존하지 않고, 데이터를 수집하지 않고, 공정한 가격에 강력한 음성 기술만을 제공합니다.

우리의 임무

TTS.ai는 다음과 같은 간단한 믿음을 바탕으로 구축되었습니다. 최고의 AI 음성 기술은 모두가 접근할 수 있어야 합니다.. 독점 서비스는 기본 텍스트 음성 변환에 대해 프리미엄 가격을 부과하는 반면, 오픈 소스 커뮤니티는 상업적 품질과 일치하거나 그 이상의 모델을 만들었습니다.

최고의 오픈소스 음성 AI 모델을 사용이 간편한 단일 플랫폼에 통합합니다. 벤더 독점이 없고 데이터 수집도 없습니다. 단지 강력한 음성 기술을 공정한 가격에 제공합니다.

우리가 제공하는

텍스트 음성 변환기Name

Kokoro, Chatterbox, Bark 등 20개 이상의 모델. 빠른 가벼운 합성에서 스튜디오 품질의 출력까지.

음성을 텍스트로

Whisper, Faster-Whisper 및 SenseVoice에 의해 구동됩니다. 타임스탬프 및 스피커 감지와 함께 100 개 이상의 언어로 오디오를 녹음합니다.

음성 복제

Chatterbox, GPT-SoVITS, CosyVoice 2 등 다양한 음성을 5초짜리 샘플에서 복제할 수 있습니다. 프로젝트를 위해 맞춤형 음성을 만들어 보세요.

오디오 처리

오디오를 향상시키고, 보컬을 제거하고, 줄기를 분할하고, 에코/잔향을 제거하고, 키/BPM을 감지하고, 형식을 변환합니다.

음성 채팅

AI를 이용한 실시간 음성 대화. 대화형 채팅 경험을 위해 모델과 음성을 선택하세요.

개발자 API

OpenAI 호환 REST API. Python SDK, 코드 샘플 및 포괄적인 문서. 앱에 음성 기능을 구축하세요.

오픈 소스 우선

TTS.ai의 모든 모델은 MIT 또는 Apache 2.0 라이선스 하에 오픈 소스입니다. 우리는 투명성과 커뮤니티 중심의 혁신을 믿습니다.

우리는

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
호텔 레지던스 앤드 스위트...

모든 모델 무게는 공식 저장소에서 다운로드됩니다. 우리는 독점 수정을 추가하지 않습니다.

인프라

TTS.ai는 NVIDIA Tesla P40 GPU(총 96GB VRAM)가 장착된 전용 GPU 서버에서 실행됩니다. 당사의 인프라는 지연 시간이 짧고 처리량이 높도록 설계되었습니다.

  • 추론을 위한 전용 GPU 클러스터 - 공유 리소스 없음
  • 모델 VRAM 요구 사항을 기반으로 한 동적 GPU 할당
  • 최적의 처리량을 위한 5개 큐 우선 시스템
  • 즉각적인 추론을 위해 VRAM에 미리 로드된 모델
  • 빠른 다운로드를 위한 CDN 지원 오디오 전송

개인정보 보호 및 보안

  • 데이터 훈련 없음: 우리는 모델을 훈련하기 위해 오디오 또는 텍스트를 사용하지 않습니다
  • 자동 삭제: 생성된 오디오는 24시간 후 자동으로 삭제됩니다.
  • 암호화: 모든 데이터는 전송 중(TLS 1.2+) 및 정지 상태에서 암호화됩니다.
  • 추적 안함: 우리는
  • GDPR 준수: 언제든지 데이터 요청 또는 삭제

TTS.ai에 대해 자주 묻는 질문

TTS.ai은 John Nader(nadermx)가 만든 독립 개발자 앱으로, AI 음성 기술을 모두가 접근할 수 있도록 열정적으로 만들었습니다. 우리는 독점 모델을 훈련하는 대신 커뮤니티에서 최고의 오픈 소스 모델을 큐레이션하고 제공합니다.

당사의 인프라는 96GB의 VRAM을 제공하는 NVIDIA Tesla P40 GPU가 장착된 전용 서버에서 실행되며, 웹 프론트엔드 및 GPU 추론 서버는 저지연 연결이 가능한 안전한 데이터 센터에서 호스팅됩니다.

데이터 저장을 최소화합니다. 텍스트 입력은 실시간으로 처리되며 영구적으로 저장되지 않습니다. 업로드 및 생성된 모든 오디오 파일은 24시간 이내에 자동으로 삭제됩니다.

TTS.ai은 전 세계적으로 점점 커지는 개발자, 콘텐츠 제작자, 기업 커뮤니티를 지원합니다. TTS.ai 플랫폼은 20개 이상의 AI 모델을 통해 매일 수천 건의 음성 생성 요청을 처리합니다.

전용 GPU 인프라와 5개 큐 우선 시스템을 통해 고가용성을 달성하기 위해 노력하고 있습니다. 무료 계층 사용자에게는 공식적인 SLA를 제공하지 않지만 유료 계층은 우선 처리 및 높은 신뢰성의 이점을 누릴 수 있습니다.

TTS.ai의 모든 모델은 MIT 또는 Apache 2.0 라이선스 하에 오픈 소스입니다. 우리는 오픈 소스 음성 AI 커뮤니티를 적극적으로 지원하고 최적화 및 통합을 생태계에 기여합니다.

우리의 로드맵에는 출시될 때마다 최첨단 모델을 추가하고, 언어 지원을 확장하고, 실시간 음성 채팅 기능을 개선하고, 더 많은 오디오 처리 도구를 구축하는 것이 포함됩니다.

TTS.ai은 개발자가 혼자서 만들고 유지 관리하므로, 채용 공고는 없습니다. 그러나 오픈 소스 기여는 언제나 환영합니다. 연락처 페이지 또는 GitHub를 통해 연락하십시오.

예, 음성 AI를 제품에 통합하고자 하는 개발자, 기업 및 조직과의 파트너십을 환영합니다. API 통합, 볼륨 가격 또는 맞춤형 모델 배포를 논의하려면 문의하십시오.

우리는 정기적으로 인프라 보안 검토를 실시합니다. 모든 데이터는 전송 중 TLS 1.2+로 암호화되며, 암호는 업계 표준 알고리즘으로 해시되며, API 키는 일방향 해시를 사용합니다. 서버 액세스는 SSH 키를 통해 승인된 직원에게만 제한됩니다.

TTS.ai는 GDPR을 준수하며 데이터 최소화 원칙을 따릅니다. 개인 오디오 데이터를 24시간 이상 저장하지 않으며 고객 데이터를 교육 목적으로 사용하지 않으며 요청 시 데이터에 대한 완전한 액세스, 수정 및 삭제 권한을 제공합니다.

당사는 오픈소스 음성 AI 환경을 지속적으로 모니터링하고 새로운 모델이 출시되고 품질이 입증되면 추가합니다. 주요 모델 업데이트는 일반적으로 월별로 이루어지며, 지속적으로 사소한 최적화가 이루어집니다.