Αναφορά σφάλματος / αίτησης χαρακτηριστικών

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 χαρακτήρες · Εγγραφείτε για 5.000 ανά γενιά →

Εγγραφείτε για όριο 5.000 χαρακτήρων

Λειτουργία SIML (Σύνθεση λόγου Markup Language for fine control)

Τυλίξτε το κείμενο σας σε ετικέτες EEML για τον ακριβή έλεγχο:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Συναίσθημα / Ετικέτες στυλ

Ετικέτες το επιλεγμένο μοντέλο καταλαβαίνει □ κάντε κλικ για να ρίξετε ένα στο κείμενο σας όπου συμβαίνει:

Λεξικό προφοράς

Define custom προφορές (word = εκφώνηση):

ΠίσσαCity name (optional, probably does not need a translation) 0

-12 +12

Μοντέλο AI

Φωνή

Γλώσσα

Μορφή εξόδου

Ταχύτητα 1.0x

0.5x 2.0x

Δωρεάν με Piper, VITS, MeloTTS

Επιλέξτε ένα μοντέλο, εισάγετε το κείμενο και κάντε κλικ στη Δημιουργία.

Σχετικά CosyVoice 2

CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.

Το καλύτερο για: Real-time applications, streaming TTS, voice assistants

Περιήγηση σε όλα CosyVoice 2 φωνές

Με μια ματιά.

Προγραμματιστής: Alibaba (Tongyi Lab)
Άδεια: Apache 2.0
Βαθμίδα: standard
Ταχύτητα: medium
Κλωνοποίηση φωνής: Ναι.
Γλώσσες: English, Chinese, Japanese, Korean, French, German, Italian, Spanish
Μεγ. χαρακτήρες: 1000

CosyVoice 2 φωνές

Chinese Female

Chinese

Πρότυπο Female

Chinese Male

Chinese

Πρότυπο Male

English Female

English

Πρότυπο Female

English Male

English

Πρότυπο Male

French Female

French

Πρότυπο Female

German Female

German

Πρότυπο Female

Italian Female

Italian

Πρότυπο Female

Japanese Female

Japanese

Πρότυπο Female

Korean Female

Korean

Πρότυπο Female

Spanish Female

Spanish

Πρότυπο Female

CosyVoice 2 TTS □ Συχνές ερωτήσεις

Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.

Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.

Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.

← Όλες οι φωνές

CosyVoice 2 TTS

Αγάπη TTS.ai; Πες στους φίλους σου!

Σχετικά CosyVoice 2

Με μια ματιά.

CosyVoice 2 φωνές

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS □ Συχνές ερωτήσεις

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?