VibeVoice

Speaker 2 (Chinese)

표준 중국어Name Neutral VibeVoice

Speaker 2 (Chinese)은 VibeVoice 텍스트 음성 변환 모델을 기반으로 하는 neutral AI 음성입니다. 이 레벨 음성은 중국어Name를 구사하며 스튜디오-품질의 음성 합성을 제공합니다. 순간 생성 속도와 5/5의 품질 평가로 Speaker 2 (Chinese)는 podcasts, dialogues, long-form narration, multi-speaker content에 적합합니다. 엔진은 Microsoft under the MIT license에 의해 개발되었으며, 상업용으로 안전하게 사용할 수 있다. 주요 기능은 다음과 같습니다. multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

아직 평가가 없습니다

VibeVoice모델 정보

모델 VibeVoice
개발자 Microsoft
품질
속도 빠르게
라이선스 MIT
복제 사용할 수 없음
동물 표준 (2 크레딧/1K 문자)
파라미터 1.5B
아키텍처 LLM + DAC
훈련 데이터 100000 시간
년도 2025

최고의 사용 사례 Speaker 2 (Chinese)

이 음성의 특성을 기반으로 한 권장 응용 프로그램

오디오북 & 내레이션

Speaker 2 (Chinese) 를 사용하여 자연스러운 음운과 표현으로 긴 형식의 콘텐츠를 설명합니다.

비디오 보이스오버

YouTube 동영상, 광고 및 소셜 미디어 콘텐츠에 전문적인 내레이션을 추가합니다.

앱 & 접근성

빠른 생성 속도로 실시간 앱, 화면 리더, 접근성 도구에 이상적입니다.

팟캐스트 & 방송

팟캐스트, 라디오 및 전문 방송에 적합한 스튜디오 품질의 출력.

더 보기 VibeVoice 목소리

동일한 TTS 모델의 다른 음성

Speaker 1

영어 Neutral

Speaker 1 (Chinese)

중국어Name Neutral

Speaker 2

영어 Neutral

Speaker 3

영어 Neutral

Speaker 4

영어 Neutral

자주 묻는 질문

Microsoft의 VibeVoice는 두 가지 버전으로 제공됩니다. 긴 형식의 콘텐츠(최대 90분, 4명의 스피커)를 위한 1.5B 모델과 첫 번째 오디오 지연 시간이 약 200ms인 스트리밍을 위한 Realtime 0.5B 모델입니다. 1.5B 버전은 긴 구절에 걸쳐 스피커 일관성을 갖춘 팟캐스트 및 오디오북에서 뛰어납니다. 참고: Microsoft는 TTS 코드를 저장소에서 제거했으며 생성된 오디오에는 청취 가능한 AI 면책 조항이 포함되어 있습니다.

바이브보이스는 마이크로소프트에서 개발했으며, 생성된 오디오의 상업적 사용을 허용하는 MIT(연구용) 라이선스 하에 배포된다.

VibeVoice 는 영어 를 포함하여 1 개의 언어를 지원합니다.

VibeVoice는 프리미엄 계층에 있습니다. 1,000자당 4 크레딧입니다. 전체 오디오를 생성하기 전에 VibeVoice 음성을 무료로 미리 볼 수 있습니다.

VibeVoice는 적당한 생성 속도를 가지고 있습니다. 일반적으로 생성에는 텍스트 길이에 따라 몇 초가 소요됩니다.

VibeVoice는 TTS.ai에서 오디오 품질에 대해 5/5를 받았습니다. 스튜디오급의 인간과 같은 음성을 제공합니다.

아니요, VibeVoice는 고정된 내장 음성 세트를 사용합니다. 음성 복제를 위해 CosyVoice 2, GPT-SoVITS 또는 Chatterbox와 같은 모델을 사용해 보십시오.

예, VibeVoice는 팟캐스트, 오디오북, 장식형 다중 스피커 콘텐츠에 특히 권장됩니다. 최대 90분의 다중 스피커 팟캐스트 생성 기능으로 이러한 사용 사례에 탁월한 선택입니다.

예, VibeVoice는 MIT(연구용 전용)의 라이선스를 받아 상업적 사용이 허용됩니다. VibeVoice 음성으로 생성된 오디오는 비디오, 팟캐스트, 앱, 게임 및 기타 상업적 프로젝트에 사용할 수 있습니다.

TTS.ai의 모든 음성은 상업적으로 라이선스된 오픈 소스 모델(MIT, Apache 2.0)을 사용합니다. 생성된 오디오는 비디오, 팟캐스트, 앱, 게임 및 기타 상업적 애플리케이션에 사용할 수 있습니다.

모델 이름과 음성 ID를 포함한 POST 요청을 /api/v1/tts/로 보내세요. Python, JavaScript, Go, cURL 코드 예제는 API 문서 페이지를 참조하세요.

예, 이 페이지의 재생 버튼을 클릭하여 샘플을 들을 수 있습니다. 텍스트 음성 변환 페이지에 사용자 정의 텍스트를 입력하여 어떤 음성으로든 무료 미리보기를 생성할 수도 있습니다.

시도해 보기 Speaker 2 (Chinese) 지금

텍스트를 입력하고 음성으로 듣기 Speaker 2 (Chinese). 사용할 수 있는 무료.