Хата турында хәбәр итү / мөмкинлекләр сорау

CosyVoice 2 ТТС

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 символлар · 5000 елда нигезләнгән. →

Регистрация 5000 символга кадәр

SSML режимы (Сүз синтезы маркировка теле төгәл контроль өчен)

Матныгызны төгәл контроль өчен SSML теглары белән әйләндерегез:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Эмоциональ халәт / стиль теглары

Сайланган модель аңлаган теглар — аларны җөмләгә төшерү өчен өстәп куегыз:

Тану сүзлеге

Үзенчәлекле әйтелешне билгеләгез (сүз = әйтелеш):

Тынлык 0

-12 +12

Диалог форматы: [S1] һәм [S2] тегларын кулланып, төрле сөйләүчеләрне билгеләгез. Мәсәлән:

[S1] Сезгә сәлам! [S2] Сезгә ничек?



                

                
                
                    
                    
                        Модель
                        
                    

                    
                    
                        
                            Сүз
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Тел
                        
                    

                    
                    
                        Чыгу форматы
                        
                    

                    
                    
                        
                            Югары тизлек
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Piper, VITS, MeloTTS белән бушлай



        
        
            
                Сезнең барлыкка китерелгән аудио монда күренәчәк. Модельне сайлагыз, мәтнне кертегез, һәм "Ярату" төймәсен басыгыз.
            
            
            
                
                
                    Төзү хаталанды
                    
                
            
        

            
                
                    
                        
                            Аудио уңышлы төзелде
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Аудио йөкләү
                            
                            
                                .srt файлын төшерү
                            
                            
                            
                            Сүзнең вакыты 24 сәгатьтән соң бетә
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            РФ су реестры мәгълүматлары: Персона. Коммерцияле лицензия $5/аена
                        
                        
                    
                
            
        

        
        
            
                
                    Үзгәрешләр юк
                    Һәр айга 200К символны алу — $5/мо
                    яки бер тапкыр 100К пакет $5 өчен
                
            
            
                
                    Сүзне үзегезнеке итеп ясау
                    30 секунд эчендә тавышны клонлау
                    
                
            
        

        

    
        
            
                
                    TTS.ai-ны яратасызмы? Дусларыгызга сөйләгез!





    
        
            
                ✨ Premium тавыш моделе
                
            
            
                Бу - премиум тавыш моделье, ул түләүле планнар белән генә эшли. Сез аның тавышларын тавыш сайлап алучы янындагы уйнату төймәсенә басып, бушлай карый аласыз.
                
                    500 дән артык фәнни хезмәт авторы.
                    Планнарны чагыштыру
                
            
        
    





    
        
            
                
                
                    Каты дискны сатып алу
                    
    Реклама юк
    Кагыйдәсез куллану
    Приоритетлар ярдәме
    Яңа мөмкинлекләргә алдан керү


                
                

                
                    
                        Янә символлар алу






    
    
        
            Бәйләнешләр CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Иң яхшысы: Real-time applications, streaming TTS, voice assistants
            
            Барлыгын карау CosyVoice 2 тавышлар
        
        
            
                
                    Бер карашка
                    
                        Программист
Alibaba (Tongyi Lab)
                        Лицензия
Apache 2.0
                        Гыйнвар
standard
                        Югары тизлек
medium
                        Сүзләрне клонлау
Әйе
                        Телләр
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Макс. символлар саны
1000
                    
                
            
        
    

    
    
    CosyVoice 2 тавышлар
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Стандарт
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 РФ су реестры мәгълүматлары: Фурга.
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Барлык тавышлар

CosyVoice 2 ТТС

TTS.ai-ны яратасызмы? Дусларыгызга сөйләгез!

Бәйләнешләр CosyVoice 2

Бер карашка

CosyVoice 2 тавышлар

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 РФ су реестры мәгълүматлары: Фурга.

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?