Default Speaker
Default Speaker은 MOSS-TTSD 텍스트 음성 변환 모델을 기반으로 하는 neutral AI 음성입니다. 이 레벨 음성은 영어를 구사하며 스튜디오-품질의 음성 합성을 제공합니다. 중간 생성 속도와 5/5의 품질 평가로 Default Speaker는 podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices에 적합합니다. 엔진은 OpenMOSS under the Apache 2.0 license에 의해 개발되었으며, 상업용으로 안전하게 사용할 수 있다. 주요 기능은 다음과 같습니다. multi-speaker dialogue, up to 5 speakers, 60min coherent audio, voice cloning, 20 languages. MOSS-TTSD 모델은 또한 음성 복제를 지원합니다. 짧은 오디오 샘플을 업로드하여 동일한 품질 특성을 유지하는 사용자 지정 음성을 생성합니다.
모델 정보
| 모델 | MOSS-TTSD |
| 개발자 | OpenMOSS |
| 품질 | |
| 속도 | 미디어 |
| 라이선스 | Apache 2.0 |
| 복제 | 지원됨 |
| 동물 | 표준 (2 크레딧/1K 문자) |
| 파라미터 | 7B |
| 아키텍처 | MOSS-TTS-Delay + dialogue continuation head |
| 년도 | 2026 |
최고의 사용 사례 Default Speaker
이 음성의 특성을 기반으로 한 권장 응용 프로그램
오디오북 & 내레이션
Default Speaker 를 사용하여 자연스러운 음운과 표현으로 긴 형식의 콘텐츠를 설명합니다.
비디오 보이스오버
YouTube 동영상, 광고 및 소셜 미디어 콘텐츠에 전문적인 내레이션을 추가합니다.
팟캐스트 & 방송
팟캐스트, 라디오 및 전문 방송에 적합한 스튜디오 품질의 출력.
맞춤형 브랜드 음성
이 음성 스타일을 자신의 오디오로 복제하여 고유한 브랜드 TTS 음성을 만들 수 있습니다.