Raporteer Fout / eienskap Versoek

CosyVoice3 TTS

Alibaba FunAudioLLM's latest multilingual model with ~150ms bi-streaming, instruction control, and zero-shot cloning.

Teks
Lêers

0/500 karakters · Teken 5 000 per geslag aan →

Teken op vir 5 000 karakterbeperking

SSML Modus (Speke sintesis Markup Taal vir goeie beheer)

Oorvloei jou teks in SSML etiket vir presiese beheer:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Emosie / Styl etiket

Merk die gekose model verstaan ooit die woord ooit om een in jou teks te laat val waar dit gebeur:

Woordeboeke

Definieer pasmaak uitspraak (woord = uitspraak):

Pitch 0

-12 +12

Kunsmatige inteligensie Model

Stem

Taal

Uitset Formaat

Spoed 1.0x

0.5x 2.0x

Vry met Pyper, VITS, MiloTTS

Jou gegenereer oudio sal hier verskyn. Kies 'n model, invoer teks, en kliek Genereer.

Aangaande CosyVoice3

CosyVoice3 is the newest generation from Alibaba's FunAudioLLM team and a clear step up from CosyVoice 2. It introduces bi-streaming inference with roughly 150ms latency and instruction-based control, letting you steer emotion, speed, and volume through prompts. Speaker similarity for zero-shot voice cloning is improved, and coverage spans 9 languages plus 18 Chinese dialects. An RL-tuned variant pushes prosody to a state-of-the-art level. With a 5,000-character ceiling, fast generation, and strong cloning, it's geared toward multilingual production TTS and real-time applications.

Beste vir: Multilingual production TTS, real-time applications, voice cloning

Blaai deur almal CosyVoice3 stemme

Met'n blik

Ontwikkelingvloeistof is minDeveloper: Alibaba (FunAudioLLM)
Lisensie: Apache 2.0
Tier: standard
Spoed: fast
Stem kloning: Ja
Tale: English, Chinese, Japanese, Korean, German, Spanish, French, Italian, Russian
Voeg- agteraan- by Taal: 5000

CosyVoice3 stemme

Chinese Female

Chinese

Kalender Female

Chinese Male

Chinese

Kalender Male

English Female

English

Kalender Female

English Male

English

Kalender Male

French Female

French

Kalender Female

German Female

German

Kalender Female

Italian Female

Italian

Kalender Female

Japanese Female

Japanese

Kalender Female

Korean Female

Korean

Kalender Female

Russian Female

Russian

Kalender Female

Spanish Female

Spanish

Kalender Female

CosyVoice3 TTS ← FAQ

CosyVoice3 adds bi-streaming inference at around 150ms latency, instruction-based control over emotion/speed/volume, improved speaker similarity for cloning, and coverage of 9 languages plus 18 Chinese dialects, with an RL-tuned variant for state-of-the-art prosody.

Yes. It supports zero-shot voice cloning from a reference clip (around 3 seconds minimum) with improved speaker similarity over the previous generation.

Yes. CosyVoice3 is licensed under Apache 2.0, permitting commercial use.

← Alle stemme

CosyVoice3 TTS

Liefde TTS.ai, vertel jou vriende!

Aangaande CosyVoice3

Met'n blik

CosyVoice3 stemme

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Russian Female

Spanish Female

CosyVoice3 TTS ← FAQ

What makes CosyVoice3 different from CosyVoice 2?

Does CosyVoice3 support voice cloning?

Is CosyVoice3 free for commercial use?