About TTS.ai

가장 포괄적인 오픈 소스 음성 AI 플랫폼. 24+ 모델, 100+ 음성, 모두 한 곳에서.

작성자

TTS.ai는

우리의 임무

TTS.ai는 모든 사람이 최고의 AI 음성 기술에 접근할 수 있어야 한다는 간단한 믿음을 바탕으로 구축되었습니다. 독점 서비스는 기본적인 텍스트 음성 변환에 대해 프리미엄 가격을 부과하는 반면, 오픈 소스 커뮤니티는 상업적 품질과 동일하거나 그 이상의 모델을 만들었습니다.

우리는 최고의 오픈 소스 음성 AI 모델을 사용이 간편한 단일 플랫폼으로 통합합니다. 벤더에 의존하지 않고, 데이터 수집 없이, 공정한 가격에 강력한 음성 기술만을 제공합니다.

우리가 제공하는

텍스트에서 음성으로Name

Kokoro, Chatterbox, Bark 등 24개 이상의 모델. 빠른 경량 합성부터 스튜디오 품질의 출력까지.

음성을 텍스트로

Whisper, Faster-Whisper 및 SenseVoice에 의해 구동됩니다. 타임스탬프 및 스피커 감지와 함께 100 개 이상의 언어로 오디오를 녹음합니다.

음성 복제

Chatterbox, GPT-SoVITS, CosyVoice 2 등 다양한 음성을 5초짜리 샘플에서 복제할 수 있습니다. 프로젝트를 위해 맞춤형 음성을 만들어 보세요.

오디오 처리Name

오디오를 향상시키고, 보컬을 제거하고, 줄기를 분할하고, 에코/잔향을 제거하고, 키/BPM을 감지하고, 형식을 변환합니다.

음성 채팅

AI를 이용한 실시간 음성 대화. 대화형 채팅 경험을 위해 모델과 음성을 선택하세요.

개발자 API

OpenAI 호환 REST API. Python SDK, 코드 샘플 및 포괄적인 문서. 앱에 음성 기능을 구축하세요.

오픈 소스 우선

TTS.ai의 모든 모델은 MIT 또는 Apache 2.0 라이선스 하에 오픈 소스입니다. 우리는 투명성과 커뮤니티 중심의 혁신을 믿습니다.

우리는

Kokoro
Chatterbox
CosyVoice 2
Bark
Fish Speech
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Whisper
Demucs
And more...

모든 모델 무게는 공식 저장소에서 다운로드됩니다. 우리는 독점 수정을 추가하지 않습니다.

인프라

TTS.ai는 NVIDIA Tesla P40 GPU(총 96GB VRAM)가 장착된 전용 GPU 서버에서 실행됩니다. 당사의 인프라는 지연 시간이 짧고 처리량이 높도록 설계되었습니다.

  • 추론을 위한 전용 GPU 클러스터 - 공유 리소스 없음
  • 모델 VRAM 요구 사항을 기반으로 한 동적 GPU 할당
  • 최적의 처리량을 위한 5개 큐 우선 시스템
  • 즉각적인 추론을 위해 VRAM에 미리 로드된 모델
  • 빠른 다운로드를 위한 CDN 지원 오디오 전송

개인정보 보호 및 보안

  • 데이터 트레이닝 없음: 모델 트레이닝에 오디오나 텍스트를 사용하지 않습니다.
  • 자동 삭제: 생성 된 오디오는 24 시간 후 자동으로 삭제됩니다
  • 암호화: 모든 데이터는 전송 중(TLS 1.2+) 및 휴지 상태에서 암호화됩니다.
  • 추적 없음: 우리는하지 않습니다
  • GDPR 준수: 언제든지 데이터 요청 또는 삭제

TTS.ai에 대해 자주 묻는 질문

TTS.ai는 AI 음성 기술을 모두가 접근할 수 있도록 만드는 데 열정을 기울이는 개발자들로 구성된 독립 팀에 의해 개발되었습니다. 우리는 독점 모델을 훈련하는 대신 커뮤니티에서 최고의 오픈 소스 모델을 큐레이션하고 제공합니다.

당사의 인프라는 96GB의 VRAM을 제공하는 NVIDIA Tesla P40 GPU가 장착된 전용 서버에서 실행되며, 웹 프론트엔드 및 GPU 추론 서버는 저지연 연결이 가능한 안전한 데이터 센터에서 호스팅됩니다.

데이터 저장을 최소화합니다. 텍스트 입력은 실시간으로 처리되며 영구적으로 저장되지 않습니다. 업로드 및 생성된 모든 오디오 파일은 24시간 이내에 자동으로 삭제됩니다.

TTS.ai는 전 세계 개발자, 콘텐츠 제작자 및 기업의 커뮤니티를 지원합니다. TTS.ai 플랫폼은 24개 이상의 AI 모델을 통해 매일 수천 건의 음성 생성 요청을 처리합니다.

당사는 전용 GPU 인프라와 5개 큐 우선 순위 시스템을 통해 고가용성을 달성하기 위해 노력하고 있습니다. 무료 계층 사용자에게는 공식적인 SLA를 제공하지 않지만 유료 계층 사용자는 우선 처리 및 높은 신뢰성의 이점을 누릴 수 있습니다.

예. TTS.ai의 모든 모델은 MIT 또는 Apache 2.0 라이선스 하에 오픈 소스입니다. 우리는 오픈 소스 음성 AI 커뮤니티를 적극적으로 지원하고 최적화 및 통합을 생태계에 기여합니다.

우리의 로드맵에는 새로운 최첨단 모델을 출시할 때마다 추가하고, 언어 지원을 확장하고, 실시간 음성 채팅 기능을 개선하고, 더 많은 오디오 처리 도구를 구축하는 것이 포함됩니다.

저희는 언제나 음성 인공지능과 오픈소스 기술에 대한 열정을 가진 재능 있는 개발자들에게 관심이 있습니다. 기여에 관심이 있으시다면 저희 연락처 페이지를 통해 연락 주십시오.

예, 음성 AI를 제품에 통합하고자 하는 개발자, 기업 및 조직과의 파트너십을 환영합니다. API 통합, 볼륨 가격 또는 맞춤형 모델 배포를 논의하려면 문의하십시오.

We conduct regular security reviews of our infrastructure. All data is encrypted in transit with TLS 1.2+, passwords are hashed with industry-standard algorithms, and API keys use one-way hashing. Server access is restricted to authorized personnel via SSH keys.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

We continuously monitor the open-source voice AI landscape and add new models as they become available and prove their quality. Major model updates typically happen monthly, with minor optimizations deployed on an ongoing basis.