Tuairiscigh Fabht / Iarratas Gné

CosyVoice3 TTS

Alibaba FunAudioLLM's latest multilingual model with ~150ms bi-streaming, instruction control, and zero-shot cloning.

0/500 carachtair · Cláraigh le haghaidh 5,000 in aghaidh an ghlúin →

Cláraigh anois! le haghaidh teorainn 5,000 carachtar

Mód SSML (Teanga Marcála Sintéise Urlabhra le haghaidh rialú mín)

Cuir do théacs i gclibeanna SSML le haghaidh rialú beacht:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Mothúchán / Stíl Clibeanna

Clibeanna a thuigeann an tsamhail roghnaithe — cliceáil chun ceann a scaoileadh isteach i do théacs nuair a tharlaíonn sé:

Foclóir Fuaime

Sainmhínigh fuaimniú saincheaptha (focal = fuaimniú):

Painéal 0

-12 +12

Samhail AI

Guth

Teanga

Formáid Aschurtha

Luas 1.0x

0.5x 2.0x

Saor in Aisce le Piper, VITS, MeloTTS

Taispeánfar an fhuaim a ghintear anseo. Roghnaigh samhail, iontráil téacs, agus cliceáil Giniúint.

Eolas Faoi CosyVoice3

CosyVoice3 is the newest generation from Alibaba's FunAudioLLM team and a clear step up from CosyVoice 2. It introduces bi-streaming inference with roughly 150ms latency and instruction-based control, letting you steer emotion, speed, and volume through prompts. Speaker similarity for zero-shot voice cloning is improved, and coverage spans 9 languages plus 18 Chinese dialects. An RL-tuned variant pushes prosody to a state-of-the-art level. With a 5,000-character ceiling, fast generation, and strong cloning, it's geared toward multilingual production TTS and real-time applications.

Is Fearr le haghaidh: Multilingual production TTS, real-time applications, voice cloning

Brabhsáil Uile CosyVoice3 guthanna

Ag Sracfhéachaint

Forbróir: Alibaba (FunAudioLLM)
Ceadúnas: Apache 2.0
Tír: standard
Luas: fast
Clónáil gutha: Tá
Teangacha: English, Chinese, Japanese, Korean, German, Spanish, French, Italian, Russian
Carachtair Uasta: 5000

CosyVoice3 guthanna

Chinese Female

Chinese

Caighdeán Female

Chinese Male

Chinese

Caighdeán Male

English Female

English

Caighdeán Female

English Male

English

Caighdeán Male

French Female

French

Caighdeán Female

German Female

German

Caighdeán Female

Italian Female

Italian

Caighdeán Female

Japanese Female

Japanese

Caighdeán Female

Korean Female

Korean

Caighdeán Female

Russian Female

Russian

Caighdeán Female

Spanish Female

Spanish

Caighdeán Female

CosyVoice3 TTS - Ceisteanna Coitianta

CosyVoice3 adds bi-streaming inference at around 150ms latency, instruction-based control over emotion/speed/volume, improved speaker similarity for cloning, and coverage of 9 languages plus 18 Chinese dialects, with an RL-tuned variant for state-of-the-art prosody.

Yes. It supports zero-shot voice cloning from a reference clip (around 3 seconds minimum) with improved speaker similarity over the previous generation.

Yes. CosyVoice3 is licensed under Apache 2.0, permitting commercial use.

← Gach guth

CosyVoice3 TTS

Leabaigh an Tweet Ag tabhairt freagra ar friends!

Eolas Faoi CosyVoice3

Ag Sracfhéachaint

CosyVoice3 guthanna

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Russian Female

Spanish Female

CosyVoice3 TTS - Ceisteanna Coitianta

What makes CosyVoice3 different from CosyVoice 2?

Does CosyVoice3 support voice cloning?

Is CosyVoice3 free for commercial use?