Tatero kilema / fangatahana endri-javatra

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

Text
Rakitra

0/500 marika · Misoratra anarana ho an'ny 5.000 isan-taranaka →

Misoratra anarana fetra 5000 marika

Fomba SSML (Teny fanoritsoritana ny fiteny ho an'ny fifehezana tsara)

Ampidiro anatin'ny tag SSML ny lahabolana mba hahazoana fifehezana mazava tsara:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Tag Emotion / Style

Tag fantatry ny modely voafaritra — tsindrio mba hametrahana iray ao anatin'ny lahatsoratrao izay misy azy:

Rakibolan'ny fiteny

Mamaritra ny fanononana safidy (teny = fanononana):

Haavo 0

-12 +12

Lamin'ny takila Dia: Ampiasao ny tag [S1] sy [S2] mba hamantarana mpiteny samihafa. Ohatra:

[S1] Misaotra! [S2] Misaotra, ahoana ny toe-draharaha?



                

                
                
                    
                    
                        Modelin'ny AI
                        
                    

                    
                    
                        
                            Feo
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Teny
                        
                    

                    
                    
                        Lamin'ny famoahana
                        
                    

                    
                    
                        
                            Hafainganan'ny fanovana
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Malalaka miaraka amin'ny Piper, VITS, MeloTTS



        
        
            
                Hiseho eto ny feo namoronanao. Misafidiana modely iray, soraty ny lahabolana, dia tsindrio ny Mamorona.
            
            
            
                
                
                    Tsy nety ny famoronana
                    
                
            
        

            
                
                    
                        
                            Namorona feo tsara
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Handefa feo
                            
                            
                                Hidina.srt
                            
                            
                            
                            Tapitra ao anatin'ny 24 ora ity rohy ity
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Ny faritr'ora dia GMT+1. : Tranonkala ofisialy Lisansa ara-barotra manomboka amin'ny $5/volana
                        
                        
                    
                
            
        

        
        
            
                
                    Tsy ampy ny marika malalaka
                    Mahazo marika 200K isan-kerinandro — $5/mo
                    na fonosana 100K tokana amin'ny $5
                
            
            
                
                    Ataovy ho feonao manokana ity
                    Mamorona feo anaty 30 segondra
                    
                
            
        

        

    
        
            
                
                    Tianao ve ny TTS.ai? Lazao amin'ny namanao!





    
        
            
                ✨ Modelin'ny feo Premium
                
            
            
                Ity dia modelin-teny premium, azo ampiasaina amin'ny fifanarahana mividy. Azonao atao ny mijery mialoha maimaimpoana ny feon'ny feo amin'ny alalan'ny tsindry "play" eo akaikin'ny mpifidy feo.
                
                    Avelao hiditra ny feo premium — $5/volana
                    Ampitahao ny drafitra
                
            
        
    





    
        
            
                
                
                    Mividy marika fanampiny
                    
    Tsy misy dokambarotra
    Tsy misy fetra ny fampiasana
    Fandraisana an-tànana ny laharam-pahamehana
    Fahazoana mialoha ireo endri-javatra vaovao


                
                

                
                    
                        Maka marika fanampiny






    
    
        
            Mombamomba CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Tsara indrindra ho an'ny: Real-time applications, streaming TTS, voice assistants
            
            Jereo izy rehetra CosyVoice 2 feo
        
        
            
                
                    Amin'ny fijery fohy
                    
                        Mpamorona
Alibaba (Tongyi Lab)
                        Lisansa
Apache 2.0
                        Taona
standard
                        Hafainganan'ny fanovana
medium
                        Fandraisana feo
Eny
                        Teny
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Marika betsaka indrindra
1000
                    
                
            
        
    

    
    
    CosyVoice 2 feo
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Standard
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Standard
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Standard
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 TTS - Fanontaniana matetika
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Ny feo rehetra

CosyVoice 2 TTS

Tianao ve ny TTS.ai? Lazao amin'ny namanao!

Mombamomba CosyVoice 2

Amin'ny fijery fohy

CosyVoice 2 feo

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS - Fanontaniana matetika

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?