자유 AI 텍스트에서 음성으로Name
20+ 오픈소스 모델, 107+ 목소리, 32+ 계정이 필요하지 않습니다.
음성 AI에 필요한 모든 것
오픈소스 AI 모델을 기반으로 한 30개 이상의 도구
20+ AI 음성 모델
하나의 플랫폼에서 가장 포괄적인 오픈 소스 TTS 모델 컬렉션
Kokoro Free
Kokoro는 8,200만 파라미터의 텍스트 음성 변환 모델로, 그 무게 클래스를 뛰어넘는 성능을 자랑합니다. 작은 크기에도 불구하고 놀랍도록 자연스럽고 표현력 있는 음성을 생성합니다. Kokoro는 영어, 일본어, 중국어, 한국어 등 다양한 표현력 있는 음성을 지원합니다. 놀라울 정도로 빠르게 실행되어 GPU에서 실시간으로 생성하는 것보다 거의 100배 빠른 오디오를 생성합니다.
최적의 용도: 지연 시간을 최소화한 고품질 TTS, 스트리밍 애플리케이션
무료로 사용해 보기
Piper Free
Piper는 Rhasspy가 개발한 VITS와 larynx 아키텍처를 사용하는 경량 텍스트 음성 엔진으로, 전적으로 CPU에서 실행되므로 엣지 기기, 홈 오토메이션, 오프라인 TTS가 필요한 애플리케이션에 이상적입니다. 30개 이상의 언어로 100개 이상의 음성을 제공하는 Piper는 Raspberry Pi 4에서도 실시간으로 자연스럽게 들리는 음성을 제공합니다.
최적의 용도: 빠른 미리보기, 접근성 및 임베디드 애플리케이션
무료로 사용해 보기
VITS Free
VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)는 현재의 2단계 모델보다 더 자연스럽게 들리는 오디오를 생성하는 병렬 엔드-투-엔드 TTS 방법입니다. 이 방법은 정상화 흐름과 대립 훈련 프로세스로 향상된 변화 추론을 채택하여 자연스러움을 크게 향상시킵니다.
최적의 용도: 자연스러운 음조를 갖춘 일반적인 텍스트-음성 변환
무료로 사용해 보기
MeloTTS Free
MyShell.ai의 MeloTTS는 영어(미국, 영국, 인도, 오스트레일리아), 스페인어, 프랑스어, 중국어, 일본어, 한국어를 지원하는 다국어 TTS 라이브러리입니다. 매우 빠르며 CPU만으로 실시간에 가까운 속도로 텍스트를 처리합니다. MeloTTS는 생산용으로 설계되었으며 CPU 및 GPU 추론을 모두 지원합니다.
최적의 용도: 빠른 다국어 TTS가 필요한 프로덕션 애플리케이션
무료로 사용해 보기
CosyVoice 2 Standard
알리바바의 확장 가능한 스트리밍 TTS는 인간과 같은 자연스러움과 거의 제로 지연 시간을 제공합니다.
개발자: Alibaba (Tongyi Lab) · 라이선스: Apache 2.0
시도해 보세요
Parler TTS Standard
자연어로 원하는 목소리를 설명하고 Parler가 일치하는 음성을 생성합니다.
개발자: Hugging Face · 라이선스: Apache 2.0
시도해 보세요
IndexTTS-2 Standard
미세한 감정 제어와 높은 표현력을 갖춘 제로 샷 TTS.
개발자: Index Team · 라이선스: Bilibili Model License
시도해 보세요
Spark TTS Standard
음성 복제 TTS 제어 가능한 감정과 프롬프트를 통해 말하는 스타일.
개발자: SparkAudio · 라이선스: CC BY-NC-SA 4.0
시도해 보세요
Orpheus Standard
100K 시간의 음성 데이터를 기반으로 훈련된 인간 수준의 감정 TTS 모델.
개발자: Canopy Labs · 라이선스: Llama 3.2 Community
시도해 보세요
Qwen3 TTS Standard
음성 복제, 사전 설정 음성, 텍스트에서 음성 디자인과 알리바바의 다국어 TTS.
개발자: Alibaba (Qwen) · 라이선스: Apache 2.0
시도해 보세요개발자 우선 API
OpenAI 호환 REST API. 하나의 엔드포인트, 22개 이상의 모델. 실시간 애플리케이션을 위한 스트리밍 지원.
- OpenAI 호환 형식
- 실시간 앱을 위한 TTS 스트리밍
- 대규모 작업을 위한 일괄 처리
- 웹훅 알림
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
간단하고 투명한 가격
무료로 시작하고 성장함에 따라 확장하세요.