Ilmoita vika / Ominaisuuspyyntö

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 hahmot · Ilmoittaudu 5 000:een per sukupolvi →

Rekisteröidy 5 000 merkin raja-arvo

SSML-tila (Puheen yhteenveto Markup Language for fine control)

Kääri tekstisi SSML-tunnisteisiin tarkan valvonnan varmistamiseksi:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Tunteet / tyyli Tunnisteet

Merkitse valittu malli ymmärtää – klikkaa pudottaaksesi yhden tekstiisi, missä se tapahtuu:

Lausumissanakirja

Määrittele custom-äänet (sana = ääntäminen):

Pistoke 0

-12 +12

Tekoälymalli

Ääni

Kieli

Tuotosmuoto

Nopeus 1.0x

0.5x 2.0x

Vapaa Piperin, VITS:n, MeloTTS:n kanssa

Luomasi ääni näkyy tässä. Valitse malli, kirjoita teksti ja napsauta Luo.

Tietoja CosyVoice 2

CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.

Paras: Real-time applications, streaming TTS, voice assistants

Selaa kaikkia CosyVoice 2 äänet

Silmäyksellä

Kehittäjä: Alibaba (Tongyi Lab)
Lisenssi: Apache 2.0
Määrittämistaso: standard
Nopeus: medium
Äänien kloonaus: Kyllä
Kielet: English, Chinese, Japanese, Korean, French, German, Italian, Spanish
Maksimimerkit: 1000

CosyVoice 2 äänet

Chinese Female

Chinese

Standardi Female

Chinese Male

Chinese

Standardi Male

English Female

English

Standardi Female

English Male

English

Standardi Male

French Female

French

Standardi Female

German Female

German

Standardi Female

Italian Female

Italian

Standardi Female

Japanese Female

Japanese

Standardi Female

Korean Female

Korean

Standardi Female

Spanish Female

Spanish

Standardi Female

CosyVoice 2 TTS – FAQ

Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.

Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.

Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.

← Kaikki äänet

CosyVoice 2 TTS

Rakasta TTS.aita, kerro ystävillesi!

Tietoja CosyVoice 2

Silmäyksellä

CosyVoice 2 äänet

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS – FAQ

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?