Poročilo o napaki / Zahteva o lastnostih

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 znaki · Vpišite se za 5000 na generacijo. →

Vpišite se. za 5000 mejnih vrednosti znakov

SSML način (Sinteze govora Oznaka jezika za dober nadzor)

Za natančen nadzor zavijte svoje besedilo v oznake SSML:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Oznake čustev / stila

Oznake izbranega modela razume – kliknite, da spustite enega v svoje besedilo, kjer se zgodi:

Izgovorni slovar

Opredelitev posebnih izgovorov (beseda = izgovor):

Višina 0

-12 +12

Oblika pogovornega okna Dia: Uporabi

[S1] in [S2] za označevanje različnih govornikov. Primer: [S1] Pozdravljeni! [S2] Živjo, kako ste?



                

                
                
                    
                    
                        Vzorec AI
                        
                    

                    
                    
                        
                            Glas
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Jezik
                        
                    

                    
                    
                        Izhodna oblika
                        
                    

                    
                    
                        
                            Hitrost
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Brez Piper, VITS, Melotts



        
        
            
                Tukaj se bo pojavil vaš ustvarjeni zvok. Izberite model, vnesite besedilo in kliknite Generiraj.
            
            
            
                
                
                    Generacija ni uspela
                    
                
            
        

            
                
                    
                        
                            Uspešno ustvarjen zvok
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Prenesi zvok
                            
                            
                                Prenesi.rt
                            
                            
                            
                            Povezava poteče čez 24h
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Brezplačna stopnja: osebna uporaba. Trgovska licenca od 5 $/mo
                        
                        
                    
                
            
        

        
        
            
                
                    Pomanjkanje prostih znakov
                    Dobite 200K znakov vsak mesec – $5/mo
                    ali enkratno 100K pakiranje za 5 dolarjev
                
            
            
                
                    Naj to naredi tvoj glas.
                    Kloniraj glas v 30 sekundah.
                    
                
            
        

        

    
        
            
                
                    Ljubi TTS.ai, povej prijateljem!





    
        
            
                ✨ Zgled glasa Premium
                
            
            
                To je premium glasovni model, ki je na voljo na vsakem plačanem načrtu. Še vedno lahko predvidijo glasove brezplačno z gumbom za igranje poleg glas izbiralca.
                
                    Odkleni premium glasove – $5/mo
                    Primerjaj načrte
                
            
        
    





    
        
            
                
                
                    Kupi več znakov
                    
    Nobenih oglasov
    Neomejena uporaba
    Prednostna podpora
    Zgodnji dostop do novih funkcij


                
                

                
                    
                        Zberi več znakov






    
    
        
            O projektu CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Najboljše za: Real-time applications, streaming TTS, voice assistants
            
            Brskaj vse CosyVoice 2 glasovi
        
        
            
                
                    Na pogled
                    
                        Razvijalec
Alibaba (Tongyi Lab)
                        Licenca
Apache 2.0
                        Stopnja
standard
                        Hitrost
medium
                        kloniranje glasu
Da, da.
                        Jeziki
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Največ znakov
1000
                    
                
            
        
    

    
    
    CosyVoice 2 glasovi
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Standardno
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Standardno
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Standardno
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 TTS – Pogosta vprašanja
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Vsi glasovi

CosyVoice 2 TTS

Ljubi TTS.ai, povej prijateljem!

O projektu CosyVoice 2

Na pogled

CosyVoice 2 glasovi

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS – Pogosta vprašanja

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?