CosyVoice 2 TTSName

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 სიმბოლოები · ოპთ£აგთ ჟვ ჱა 5.000 ნა ოჲკჲლვნთვ. →

დარეგისტრირება 5000 სიმბოლოს საზღვარი

SSML რეჟიმი (საუბრის სინთეზის მარკერების ენა ფუნქციური კონტროლისთვისName)

ტექსტის გადატანა SSML ჭდეებში ზუსტი კონტროლისთვის:

<speak><prosody rate="slow">Slow speech</prosody></speak>

ემოცია/ სტილის ჭდეები

მონიშნული მოდელისთვის გასაგები ჭდეები - დააწკაპუნეთ, რომ ერთი ჭდე თქვენს ტექსტში ჩააგდოთ, სადაც ის მოხდება:

გამოთქმის ლექსიკონიName

ინდივიდუალური გამოთქმების განსაზღვრა (სიტყვი = გამოთქმა):

პიქსელი 0

-12 +12

AI მოდელი

ხმა

ენა

გამონატანის ფორმატი

სიჩქარე 1.0x

0.5x 2.0x

თავისუფალი Piper, VITS, MeloTTS- ით

აქ გამოჩნდება თქვენი შექმნილი აუდიო. აირჩიეთ მოდელი, შეიყვანეთ ტექსტი და დააჭირეთ "შექმნა".

ინფორმაცია CosyVoice 2

CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.

საუკეთესოა: Real-time applications, streaming TTS, voice assistants

ყველას დათვალიერება CosyVoice 2 ხმა

ჟ მალკჲ ოჲდლვენსგაŒვ

პროგრამისტი: Alibaba (Tongyi Lab)
ლიცენზია: Apache 2.0
იანვარი: standard
სიჩქარე: medium
ხმა: ეა
ენაName: English, Chinese, Japanese, Korean, French, German, Italian, Spanish
სიმბოლოების მაქსიმალური რაოდენობა: 1000

CosyVoice 2 ხმა

Chinese Female

Chinese

სტანდარტული Female

Chinese Male

Chinese

სტანდარტული Male

English Female

English

სტანდარტული Female

English Male

English

სტანდარტული Male

French Female

French

სტანდარტული Female

German Female

German

სტანდარტული Female

Italian Female

Italian

სტანდარტული Female

Japanese Female

Japanese

სტანდარტული Female

Korean Female

Korean

სტანდარტული Female

Spanish Female

Spanish

სტანდარტული Female

CosyVoice 2 TTS - ხშირად დასმული კითხვები

Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.

Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.

Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.

← ყველა ხმა

CosyVoice 2 TTSName

ჟაკაქ TTS.ai? კაზთ თმ ნა ოპთ£არვლთრვ ჟთ!

ინფორმაცია CosyVoice 2

ჟ მალკჲ ოჲდლვენსგაŒვ

CosyVoice 2 ხმა

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS - ხშირად დასმული კითხვები

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?