버그 보고 / 기능 요청

오픈 소스 텍스트 음성 변환 모델

당사 플랫폼의 모든 TTS 모델은 상업적으로 친화적인 라이선스로 오픈 소스입니다. MIT, Apache 2.0 — 독점적 잠금, 사용 제한, 놀라운 라이선스 수수료 없음. 당사의 호스팅 API를 통해 사용하거나 완전한 제어를 통해 자신의 인프라에서 셀프 호스팅하십시오.

오픈 소스 MIT 라이선스 아파치 2.0 셀프 호스팅 깃허브

전체 TTS 편집기 API 문서

지금 시도해 보세요

0/500

Kokoro, 파이퍼, VITS, MeloTTS와 무료

생성된 오디오가 여기에 나타납니다

전체 TTS 편집기 열기

오픈 소스 TTS 혜택

오픈 소스 모델이 프로젝트에 중요한 이유

모든 오픈 소스 라이선스

TTS.ai의 모든 모델은 허용적인 오픈 소스 라이선스를 사용합니다. 독점적인 블랙박스, 벤더 잠금, 예기치 않은 라이선스 수수료가 없습니다.

MIT / 아파치 2.0

모델은 가장 허용성이 높은 오픈 소스 라이선스인 MIT 또는 Apache 2.0 라이선스로 라이선스되어 있습니다. 상업적으로 사용, 수정, 재배포 — 제한 없음.

셀프 호스팅

모든 모델을 다운로드하여 귀사의 하드웨어에서 실행할 수 있습니다. 데이터, 지연 시간, 인프라를 완벽하게 제어할 수 있으며 클라우드 의존성이 필요하지 않습니다.

GPU 최적화

모델은 CUDA 지원이 있는 NVIDIA GPU에 최적화되었습니다. Piper는 CPU에서만 실행됩니다. 대부분의 모델은 효율적인 추론을 위해 2-8GB VRAM이 필요합니다.

커뮤니티 유지

활발한 오픈소스 커뮤니티가 이러한 모델을 유지하고 개선합니다. 기여를 환영합니다. GitHub에 버그, 개선 사항 및 새로운 목소리를 제출하십시오.

상업적 사용 OK

모든 모델은 라이선스에 따라 상업적 사용을 허용합니다. 로열티 또는 사용료 없이 제품을 제작하고 서비스를 판매하며 상업적 콘텐츠를 만들 수 있습니다.

오픈 소스 모델 카탈로그

각 모델, 그것의 라이센스, 그리고 그것이 가장 잘하는

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

최적의 용도: 아파치 2.0 — 최고의 품질 무료 모델, 82M 파라미터, 쉽게 셀프 호스팅

시도해 보기 Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

최적의 용도: MIT — CPU 전용, 엣지 장치 및 임베디드 셀프 호스팅에 완벽

시도해 보기 Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

최적의 용도: MIT — 많은 다운스트림 모델에서 사용되는 기초 아키텍처

시도해 보기 VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

최적의 용도: MIT — 표준 TTS를 뛰어넘는 고유한 오디오 생성 기능

시도해 보기 Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 음성 복제

최적의 용도: 아파치 2.0 — 최고의 품질, 널리 연구된 참조 구현

시도해 보기 Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 음성 복제

최적의 용도: MIT — 세밀한 스타일 제어를 가진 오픈 소스 음성 복제

시도해 보기 OpenVoice

오픈 소스 TTS를 사용하는 방법

호스팅된 API 사용 또는 직접 모델 실행

오픈 소스 모델 탐색

각 모델 페이지에는 라이선스, 아키텍처, 기능 및 셀프 호스팅 요구 사항이 표시됩니다.

귀하의 브라우저에서 시도하십시오

아무것도 설치하지 않고 TTS.ai에서 모든 모델을 직접 테스트할 수 있습니다. 당사의 GPU 서버가 처리를 처리하므로 셀프 호스팅에 투자하기 전에 품질을 평가할 수 있습니다.

셀프 호스팅 또는 API 사용

GitHub에서 모델 리포지토리를 복제하고 로컬에서 실행하거나 프로덕션을 위해 호스팅된 API를 사용합니다. 셀프 호스팅은 완벽한 제어를 제공하며 API는 관리형 인프라를 제공합니다.

귀하의 애플리케이션 구축

자체 호스팅 모델 또는 REST API를 사용하여 TTS를 제품에 통합하십시오. 모든 모델은 라이선스 수수료 또는 로열티 없이 상업적으로 사용할 수 있습니다.

라이선스 비교

TTS.ai의 모든 모델은 상업적으로 친화적인 오픈 소스 라이선스를 사용합니다.

모델	라이선스	속성
Kokoro	Apache 2.0	필요
Piper	MIT	선택사항
VITS	MIT	선택사항
MeloTTS	MIT	선택사항
Chatterbox	MIT	선택사항
Tortoise TTS	Apache 2.0	필요
StyleTTS 2	MIT	선택사항
OpenVoice	MIT	선택사항
Sesame CSM	Apache 2.0	필요
Orpheus	Llama 3.2	"Built with Llama"

이 모델들을 무료로 시도해 보세요

셀프 호스팅 vs 호스팅 API

직접 모델을 실행하거나 인프라를 처리하도록 허용

귀하의 하드웨어에서 셀프 호스팅

TTS.ai의 모든 모델은 GitHub 또는 Hugging Face에서 오픈 소스 프로젝트로 사용할 수 있습니다. 가중치를 다운로드하고, 종속성을 설치하고, 자신의 GPU에서 추론을 실행할 수 있습니다. 지연 시간, 개인 정보 보호 및 확장을 완벽하게 제어할 수 있습니다.

완전한 데이터 개인정보 보호 — 오디오가 서버를 떠나지 않음
초기 설정 후 요청당 비용 없음
자신의 데이터에 대한 맞춤형 미세 조정
GPU 하드웨어 필요(NVIDIA 권장)
업데이트, 확장 및 종속성 관리

TTS.ai 호스팅 API 사용

단일 REST API를 통해 20개 이상의 모델에 즉시 액세스할 수 있습니다. GPU 프로비저닝, 모델 업데이트, 큐 관리, 확장을 처리합니다. 하나의 API 키로 모든 모델에 액세스할 수 있으므로 별도의 배포를 관리할 필요가 없습니다.

GPU 하드웨어 필요 없음
하나의 API를 통해 모든 20+ 모델
자동 모델 업데이트 및 개선
중복 인프라로 99.9% 가동 시간 보장
사용한 만큼만 지불하세요

대신 호스팅 API 사용

빠른 시작: API 또는 셀프 호스팅

호스팅 API를 사용하거나 로컬에 Kokoro를 설치하십시오.

옵션 1: TTS.ai 호스팅 API 가장 쉬운

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

옵션 2: pip와 셀프 호스트 전체 제어

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API 문서 보기

오픈 소스, 저렴한 가격

호스팅된 API를 통해 GPU를 관리하지 않고도 오픈 소스 TTS에 액세스할 수 있습니다.

무료 계층

가입시 15 크레딧

4 오픈 소스 모델 무료
기본 사용에 대한 가입이 필요하지 않음
상업적 사용 허용

시작

500 크레딧/월

모든 20+ 오픈 소스 모델
음성 복제
API 액세스

전문가

$29

2,000,000 문자/월

우선순위 GPU 처리
모든 프리미엄 모델
엔터프라이즈 지원

전체 가격 보기

자주 묻는 질문

오픈 소스 텍스트 음성 변환에 대한 일반적인 질문

예. TTS.ai의 모든 모델은 MIT 또는 Apache 2.0과 같은 허용적인 오픈 소스 라이선스를 사용합니다. Coqui의 CPML 또는 비상업적 CC-BY-NC와 같은 제한적인 라이선스를 사용하는 모델은 특별히 제외합니다. GitHub 저장소에서 각 모델의 라이선스를 확인할 수 있습니다.

두 라이선스 모두 상업적 사용, 수정, 재배포를 허용하는 허용적인 오픈 소스 라이선스입니다. 아파치 2.0은 명시적인 특허 허가를 추가하고 코드를 수정할 경우 변경 사항을 명시해야 합니다. MIT는 요구 사항이 덜하며 간단합니다.

모든 모델은 셀프 호스팅이 가능합니다. GitHub에서 모델 저장소를 복제하고 종속성을 설치하고 모델 가중치를 다운로드하고 추론을 실행합니다. GPU, RAM, Python 버전을 포함한 각 모델의 셀프 호스팅 요구 사항에 대한 문서를 제공합니다.

Piper는 GPU가 필요하지 않습니다(CPU만 필요). Kokoro와 MeloTTS는 1-2GB VRAM이 필요합니다. 대부분의 표준 모델은 4GB VRAM이 필요합니다. Tortoise와 Sesame CSM은 8GB가 필요합니다. NVIDIA RTX 3060(12GB)은 대부분의 모델을 편안하게 실행할 수 있습니다.

예. 오픈 소스 라이선스는 미세 조정을 포함한 수정을 허용합니다. GPT-SoVITS 및 Bark와 같은 모델은 미세 조정 스크립트를 제공합니다. 자신의 음성 데이터로 모델을 훈련하여 맞춤형 음성을 생성하거나 특정 언어의 성능을 향상시킬 수 있습니다.

최고의 오픈 소스 모델(Kokoro, StyleTTS 2, Chatterbox)은 이제 품질 벤치마크에서 ElevenLabs 및 Google TTS와 같은 상용 서비스와 일치하거나 이를 초과합니다. 상용 서비스의 주요 장점은 오디오 품질이 아닌 관리 인프라 및 지원입니다.

XTTS/XTTS-v2 (Coqui의 CPML — 비상업적), F5-TTS (CC-BY-NC — 비상업적), Higgs-v2 (보손 라이선스 — 제한적) 모두 제거되었습니다. TTS.ai의 모든 모델은 상업적 사용에 안전하다고 검증되었습니다.

예. 대부분의 모델은 GitHub를 통해 커뮤니티의 기여를 받습니다. 버그 보고서, 새로운 언어의 음성 녹음, 코드 개선 사항 및 문서를 제출할 수 있습니다. 각 모델의 GitHub 저장소에서 기여 지침 및 활성 문제를 확인하십시오.

GPU 메모리를 공유하기 위해 주문형으로 모델을 로드하고 유휴 상태일 때 로드를 풀 수 있습니다. 당사의 GPU 서버는 동적 로딩을 사용하여 4x Tesla P40(총 VRAM 96GB)에서 20개 이상의 모델을 실행합니다. 셀프 호스팅의 경우 단일 24GB GPU가 3-5개의 모델을 동시에 서비스할 수 있습니다.

많은 모델이 공식 Docker 이미지 또는 Dockerfiles를 제공합니다. 여러 모델을 실행하려면 GPU 액세스를 위한 NVIDIA Container Toolkit을 사용하여 맞춤형 Docker 설정을 구축할 수 있습니다. API 서버 아키텍처는 참조 구현으로 사용할 수 있습니다.

대부분의 모델은 파이썬 3.10-3.12가 필요합니다. Coqui TTS (VITS)는 파이썬 3.11이 필요합니다. 대부분의 모델에 대해 파이썬 3.12를 권장합니다.

예. MIT 및 Apache 2.0 라이선스는 상업적 사용을 명시적으로 허용합니다. 이러한 모델을 사용하여 SaaS 제품, 모바일 앱, 게임 및 서비스를 라이선스 수수료, 로열티 또는 크리에이티브 커먼즈 요구 사항 없이 구축할 수 있습니다(크리에이티브 커먼즈는 환영합니다).

5.0/5 (1)

오늘 오픈 소스 TTS를 시도해 보세요

20개 이상의 오픈 소스 모델, 모두 상업용 라이선스. API 또는 셀프 호스팅 사용 — 선택은 당신에게 달려 있습니다.

무료로 가입하기 가격 정보 보기

오픈 소스 텍스트 음성 변환 모델

지금 시도해 보세요

TTS.ai가 마음에 드시나요? 친구들에게 알려주세요!

오픈 소스 TTS 혜택

모든 오픈 소스 라이선스

MIT / 아파치 2.0

셀프 호스팅

GPU 최적화

커뮤니티 유지

상업적 사용 OK

오픈 소스 모델 카탈로그

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

오픈 소스 TTS를 사용하는 방법

오픈 소스 모델 탐색

귀하의 브라우저에서 시도하십시오

셀프 호스팅 또는 API 사용

귀하의 애플리케이션 구축

라이선스 비교

셀프 호스팅 vs 호스팅 API

귀하의 하드웨어에서 셀프 호스팅

TTS.ai 호스팅 API 사용

빠른 시작: API 또는 셀프 호스팅

오픈 소스, 저렴한 가격

무료 계층

시작

전문가

자주 묻는 질문

모든 TTS.ai 모델이 정말 오픈 소스입니까?

MIT 라이선스와 아파치 2.0 라이선스의 차이점은 무엇인가요?

내 자신의 서버에서 이러한 모델을 셀프 호스팅할 수 있습니까?

TTS 모델을 셀프 호스팅하려면 어떤 GPU가 필요합니까?

오픈 소스 TTS 모델을 미세 조정할 수 있습니까?

오픈 소스 TTS 모델은 상용 서비스와 어떻게 비교됩니까?

제한적인 라이선스를 가진 모델이 있습니까?

이러한 오픈 소스 모델에 기여할 수 있습니까?

하나의 GPU 서버에서 여러 모델을 실행하려면 어떻게 합니까?

셀프 호스팅을 위한 Docker 이미지가 있습니까?

셀프 호스팅을 위해 어떤 파이썬 버전이 필요합니까?

이러한 모델을 사용하여 상업용 제품을 만들 수 있습니까?

오늘 오픈 소스 TTS를 시도해 보세요