Ndesịta ihenhọrọ ndị ahụ

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 Ụdị · Nweta 5,000 kwa afọ →

Akaụntụ maka 5,000 akara oghe

SSML Mode (Asụsụ Markup nke Nsụgharị Asụsụ maka nlekọta nke ọma)

Kpọchie ngwe gị n'ime SSML táàbụ̀ maka nlekọta ziri ezi:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Emóòyì/Sdị́ọ̀tụ̀tụ̀

Táàbụ̀ nke móòdù ahụ a họọrọ na-aghọta - pịa ka ịkpụga otu n'ime ngwe gị ebe ọ na-eme:

Dìfọ́ọ̀ltụ̀

Ndesịta okwu emeredịkachọrọ:

Nhazi 0

-12 +12

Dia dialog format: Jiri [S1] na [S2] táàbụ̀ ka ịkọwapụta ndị na-ekwu okwu dị iche iche. Ụdịdị:

[S1] Hello there! [S2] Hi, how are you?



                

                
                
                    
                    
                        Model
                        
                    

                    
                    
                        
                            Òtù
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Asụsụ
                        
                    

                    
                    
                        Ụdị pụtapụta
                        
                    

                    
                    
                        
                            Nhazi
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Free na Piper, VITS, MeloTTS



        
        
            
                Ọdịdị gị ga-egosipụta ebe a. Họrọ móòdù, tinye ngwe, ma pịa Kewapụta.
            
            
            
                
                
                    Ọrụ ahụ ebidoghị
                    
                
            
        

            
                
                    
                        
                            Ọdịdị a mepụtala nke ọma
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Bubata ụda
                            
                            
                                Bubata.srt
                            
                            
                            
                            Ndesịta njikọ ahụ ga-agwụ n'ime 24h
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Free tier: ojiji onwe onye. Commercial license site na $5/mo
                        
                        
                    
                
            
        

        
        
            
                
                    Na-arụ ọrụ na akara ndị ahụ
                    Nweta 200K akara ọnwa ọ bụla - $5/mo
                    ma ọ bụ otu oge 100K pake maka $5
                
            
            
                
                    Mee ka ọ bụrụ ụda gị
                    Kloo ụda n'ime sekọnd 30
                    
                
            
        

        

    
        
            
                
                    Ị hụrụ TTS.ai? Kpọtụrụ enyi gị!





    
        
            
                ✨ Premium Voice Model
                
            
            
                Nke a bụ ụda premium model, dị na ọbụla n'ime ntọala n'efu. I nwere ike ịhụ n'ihu ụda ya n'efu site na bọtịn n'okpuru onyenhọrọ ụda.
                
                    Wepụ ụda ndị dị n'elu — $5/mo
                    Tụnyere usoroiheomume
                
            
        
    





    
        
            
                
                
                    Zụlite ihenhọrọ ndị ọzọ
                    
    Enweghị mgbasaozi
    Oge ojiji enweghị oke
    Nnyemaka Priority
    Nnweta n'oge gara aga ka ihenhọrọ ndị ọfụụ


                
                

                
                    
                        Wepụta akara ndị ọzọ






    
    
        
            _N'ihe banyere CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Ọkachasị maka: Real-time applications, streaming TTS, voice assistants
            
            Nlegharịa niile CosyVoice 2 ụda
        
        
            
                
                    N'ime nlele
                    
                        Ńkwádò
Alibaba (Tongyi Lab)
                        Ikikere
Apache 2.0
                        Tier
standard
                        Nhazi
medium
                        Nhazi ụda
Ee
                        Asụsụ ndị ahụ
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Ụhara Max
1000
                    
                
            
        
    

    
    
    CosyVoice 2 ụda
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Dìfọ́ọ̀ltụ̀
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 TTS - Ajụjụ ndị na-emekarị
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Agụgụala niile

CosyVoice 2 TTS

Ị hụrụ TTS.ai? Kpọtụrụ enyi gị!

_N'ihe banyere CosyVoice 2

N'ime nlele

CosyVoice 2 ụda

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS - Ajụjụ ndị na-emekarị

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?