Сообщить об ошибке / запросить функцию

CosyVoice 2 ТТС

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 Аломатҳо · Бақайдгирӣ барои 5000 дар як насл →

Бақайдгирӣ барои 5000 аломат маҳдудият

Ҳолати SSML (Синтезатори гуфтугӯи Markdown барои идоракунии дақиқName)

Матнро дар SSML тегҳо барои идоракунии дақиқ гузоред:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Мавзӯъ/ Услуби тегҳо

Барчаспҳо, ки аз тарафи намунаи интихобшуда фаҳмида мешаванд - барои гузоштани яке аз онҳо дар матни худ, ки дар он ҷо рӯй медиҳад, пахш кунед:

Луғат

Муайян кардани талаффузи оддӣ (калима = талаффуз):

& Баландии овоз 0

-12 +12

Диалоги диаграммаи формат: Истифодаи [S1] ва [S2] тегҳо барои нишон додани баландгӯякҳои гуногун. Мисол:

[S1] Салом! [S2] Салом, шумо чӣ гуна ҳастед?



                

                
                
                    
                    
                        Намунаи AI
                        
                    

                    
                    
                        
                            & Забон
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Забонҳо
                        
                    

                    
                    
                        Андозаи хурӯҷ
                        
                    

                    
                    
                        
                            Суръат
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Озод бо Piper, VITS, MeloTTS



        
        
            
                Дар ин ҷо садои эҷодшудаи шумо пайдо мешавад. Намунаро интихоб кунед, матнро ворид кунед ва пахш кунед Эҷод кунед.
            
            
            
                
                
                    Наметавонам эҷод кунам
                    
                
            
        

            
                
                    
                        
                            Аудио бо муваффақият эҷод шуд
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Боргирии аудио
                            
                            
                                Боргирӣ
                            
                            
                            
                            Мӯҳлати пайванд баъди 24 соат ба итмом мерасад
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Шаблон:Шаҳристон Лицензияи тиҷоратӣ аз $5/мо
                        
                        
                    
                
            
        

        
        
            
                
                    Аломатҳои озод ба итмом расиданд
                    200K ҳарфҳоро ҳар моҳ гиред — $5/мо
                    ё як бор 100K баста барои $5
                
            
            
                
                    Ин овозро овози худ созед
                    Нусхаи овоз дар 30 сония
                    
                
            
        

        

    
        
            
                
                    Шумо TTS.ai-ро дӯст медоред? Ба дӯстонатон бигӯед!





    
        
            
                ✨ Модули овози Premium
                
            
            
                Ин як намунаи овози Premium мебошад, ки дар ҳар як нақшаи пардохтшаванда дастрас аст. Шумо метавонед овозҳоро бо истифодаи тугмаи бозикунии дар канори интихобкунандаи овоз пешнамоиш кунед.
                
                    Кушодани овозҳои Premium — $5/мо
                    Муқоисаи нақшаҳо
                
            
        
    





    
        
            
                
                
                    & Хариди аломатҳои иловагӣ
                    
    Бе реклама
    Истифодаи бемаҳдуд
    Пуштибонии пешрафт
    Дастрасии пешакӣ ба хусусиятҳои нав


                
                

                
                    
                        Гирифтани аломатҳои иловагӣ






    
    
        
            Дар бораи CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Беҳтарин барои: Real-time applications, streaming TTS, voice assistants
            
            Баррасии ҳама CosyVoice 2 овозҳо
        
        
            
                
                    Дар як назар
                    
                        Тайёркунанда
Alibaba (Tongyi Lab)
                        Иҷозатнома
Apache 2.0
                        & Тағйиротҳо
standard
                        Суръат
medium
                        Тасвири овоз
& Тасвир
                        Забонҳо
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Аломатҳои зиёд
1000
                    
                
            
        
    

    
    
    CosyVoice 2 овозҳо
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        & Стандартӣ
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 Саволҳои зиёд
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Ҳамаи овозҳо

CosyVoice 2 ТТС

Шумо TTS.ai-ро дӯст медоред? Ба дӯстонатон бигӯед!

Дар бораи CosyVoice 2

Дар як назар

CosyVoice 2 овозҳо

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 Саволҳои зиёд

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?