کړاو راپورول / د ځانتيا غوښتنه

CosyVoice3 ټي ټي اېس

Alibaba FunAudioLLM's latest multilingual model with ~150ms bi-streaming, instruction control, and zero-shot cloning.

0/500 لوښه · د هر نسل لپاره د 5,000 لپاره نوم لیکنه وکړئ →

ننوتل د 5,000 لوښه حد

SSML اکر (د ښه کنټرول لپاره د وينا ترکیب نښه کولو ژبه)

د دقیق کنټرول لپاره په SSML نښانونو خپل متن واچوئ:

<speak><prosody rate="slow">Slow speech</prosody></speak>

احساس / ډول نښانې

توري د ټاکل شوي ماډل پوهیږي - کلیک وکړئ چې ستاسو په متن کې یو راښکته کړئ چیرې چې دا پیښیږي:

د لوستنې ويېپانګه

دوديزه لوستنه پېژندل (ويې = لوستنه):

غږ 0

-12 +12

:Dia کړکۍ بڼه [S1] او [S2] نښانې وکاروئ چې مختلف غږوونکي وښيي. مثال:

[S1] هلته سلام! [S2] سلام، تاسو څنګه ياست؟



                

                
                
                    
                    
                        AI ماډل
                        
                    

                    
                    
                        
                            غږ
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        ژبه
                        
                    

                    
                    
                        وتۍ بڼه
                        
                    

                    
                    
                        
                            چټکتيا
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        د پيپر، VITS، MeloTTS سره وړيا



        
        
            
                ستاسو توليد شوي غږيز به دلته ښکاره شي. يو ماډل وټاکئ، ليکنه وليکﺉ، او توليد کېکاږﺉ.
            
            
            
                
                
                    جوړول پاتې راغلل
                    
                
            
        

            
                
                    
                        
                            غږ په برياليتوب سره جوړ شو
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                غږيز رالېښنې
                            
                            
                                .srt ډاونلوډ
                            
                            
                            
                            تړنه په 24h کې پای ته رسیږي
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            وړیا طبقه: شخصي کارولو. د $ 5 / mo څخه سوداګریز جواز
                        
                        
                    
                
            
        

        
        
            
                
                    د وړيا لوښو کمښت
                    د 200K کرکټرونه هر میاشت ترلاسه کړئ - $ 5 / mo
                    یا د $ 5 لپاره یوځل 100K بسته
                
            
            
                
                    دا خپل غږ جوړ کړئ
                    په ۳۰ سېکېنډونو کې غږ کلونول
                    
                
            
        

        

    
        
            
                
                    TTS.ai مینه؟ خپل ملګرو ته ووایاست!





    
        
            
                ✨ د غږ ډول
                
            
            
                دا د پریمیم غږ ماډل دی، په هرې پیسې پلان کې شتون لري. تاسو لاهم کولی شئ د غږ غږونکي سره د غږ غږولو ت buttonۍ سره د غږ غږونه وړیا وړ
                
                    د پریمیم غږونه غیر فعال کړئ - $ 5 / mo
                    پلانونه پرتله کول
                
            
        
    





    
        
            
                
                
                    نور لوښه پېرل
                    
    هېڅ اعلانونه
    نامحدود کارونه
    لومړیتوب ملاتړ
    نوې بڼې ته مخکې لاسرسی


                
                

                
                    
                        نور لوښه اخيستل






    
    
        
            په اړه CosyVoice3
            CosyVoice3 is the newest generation from Alibaba's FunAudioLLM team and a clear step up from CosyVoice 2. It introduces bi-streaming inference with roughly 150ms latency and instruction-based control, letting you steer emotion, speed, and volume through prompts. Speaker similarity for zero-shot voice cloning is improved, and coverage spans 9 languages plus 18 Chinese dialects. An RL-tuned variant pushes prosody to a state-of-the-art level. With a 5,000-character ceiling, fast generation, and strong cloning, it's geared toward multilingual production TTS and real-time applications.
            
            غوره د: Multilingual production TTS, real-time applications, voice cloning
            
            ټول لټول CosyVoice3 غږونه
        
        
            
                
                    په يوه کتنه کې
                    
                        جوړوونکی
Alibaba (FunAudioLLM)
                        منښتليک
Apache 2.0
                        :د پاڼې نوم
standard
                        چټکتيا
fast
                        غږ کلونول
هو
                        ژبې
English, Chinese, Japanese, Korean, German, Spanish, French, Italian, Russian
                        ټولوجګه لوښه
5000
                    
                
            
        
    

    
    
    CosyVoice3 غږونه
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        تلواله
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        تلواله
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Russian Female
                            Russian
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        تلواله
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice3 د پوښتنو ځوابول
    
        
        
            
                
            
            
                CosyVoice3 adds bi-streaming inference at around 150ms latency, instruction-based control over emotion/speed/volume, improved speaker similarity for cloning, and coverage of 9 languages plus 18 Chinese dialects, with an RL-tuned variant for state-of-the-art prosody.
            
        
        
        
            
                
            
            
                Yes. It supports zero-shot voice cloning from a reference clip (around 3 seconds minimum) with improved speaker similarity over the previous generation.
            
        
        
        
            
                
            
            
                Yes. CosyVoice3 is licensed under Apache 2.0, permitting commercial use.
            
        
        
    
    

    ← ټول غږونه

CosyVoice3 ټي ټي اېس

TTS.ai مینه؟ خپل ملګرو ته ووایاست!

په اړه CosyVoice3

په يوه کتنه کې

CosyVoice3 غږونه

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Russian Female

Spanish Female

CosyVoice3 د پوښتنو ځوابول

What makes CosyVoice3 different from CosyVoice 2?

Does CosyVoice3 support voice cloning?

Is CosyVoice3 free for commercial use?