Raporti cimon / funkcipeton

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 signoj · Subskribu por 5,000 po generacio →

Aliĝi for 5, 000 character limit

SSML- reĝimo (Parolsinteza markolingvo por preciza kontroloName)

Envolvu vian tekston en SSML- etikedojn por preciza kontrolo:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Emociaj/ stilaj etikedoj

Etikedoj kiujn la elektita modelo komprenas - klaku por meti unu en vian tekston kie ĝi okazas:

Prononca vortaro

Difini proprajn elparolojn (vorto = elparolo):

Alteco 0

-12 +12

Dia dialoga formato: Uzu [S1] kaj [S2] por marki malsamajn parolantojn. Ekzemplo:

[S1] Saluton! [S2] Saluton, kiel vi fartas?



                

                
                
                    
                    
                        AI- modelo
                        
                    

                    
                    
                        
                            Voĉo
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Lingvo:
                        
                    

                    
                    
                        Eligoformato
                        
                    

                    
                    
                        
                            Rapideco
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Libera kun Piper, VITS, MeloTTS



        
        
            
                Via generita sono aperos tie ĉi. Elektu modelon, entajpu tekston, kaj alklaku Generi.
            
            
            
                
                
                    Generado malsukcesis
                    
                
            
        

            
                
                    
                        
                            Sondosiero sukcese generita
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Elŝuti sonon
                            
                            
                                Elŝuti.srt
                            
                            
                            
                            Ligo eksvalidiĝas post 24 horoj
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Libera programaro: persona uzo. Komerca licenco ekde $5/mo
                        
                        
                    
                
            
        

        
        
            
                
                    Running low on free characters
                    Get 200K characters every month — $5/mo
                    aŭ unufoje 100K pakaĵo por $5
                
            
            
                
                    Faru tion via propra voĉo
                    Kloni voĉon post 30 sekundoj
                    
                
            
        

        

    
        
            
                
                    Ĉu vi ŝatas TTS.ai? Diru al viaj amikoj!





    
        
            
                ✨ Premium Voice Model
                
            
            
                Tio estas altnivela voĉmodelo, havebla ĉe ĉiu paganta plano. Vi povas ankoraŭ antaŭrigardi ĝiajn voĉojn senpage per la ludobutono apud la voĉelektilo.
                
                    Malŝlosi altkvalitajn voĉojn — $5/mo
                    Kompare planojn
                
            
        
    





    
        
            
                
                
                    Aĉeti pliajn signojn
                    
    Neniu reklamado
    Senlima uzo
    Prioritata subteno
    Antaŭtempa aliro al novaj ecoj


                
                

                
                    
                        Preni pliajn signojn






    
    
        
            Pri CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Plej bona por: Real-time applications, streaming TTS, voice assistants
            
            Foliumi ĉiujn CosyVoice 2 voĉoj
        
        
            
                
                    Unu rigardo
                    
                        Programisto
Alibaba (Tongyi Lab)
                        Licenco
Apache 2.0
                        Tamuz
standard
                        Rapideco
medium
                        Voĉo- klonado
Jes
                        Lingvoj
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Maksimuma nombro da signoj
1000
                    
                
            
        
    

    
    
    CosyVoice 2 voĉoj
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Defaŭlta
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 TTS - FAQ
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Ĉiuj voĉoj

CosyVoice 2 TTS

Ĉu vi ŝatas TTS.ai? Diru al viaj amikoj!

Pri CosyVoice 2

Unu rigardo

CosyVoice 2 voĉoj

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS - FAQ

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?