Txostendu programa- errorea / Eskaera

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

0/500 karaktereak · 5.000 belaunaldiko. →

Izena eman 5.000 karaktereko muga

SSML modua (Hizketa-sintesiaren markatze-lengoaia kontrol finetarako)

Itzulbiratu zure testua SSML etiketetan kontrol zehatzagoa lortzeko:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Emozioa / Estilo etiketak

Hautatutako modeloak ulertzen dituen etiketak — egin klik testuan jartzeko:

Ahoskera hiztegia

Definitu ahoskera pertsonalizatuak (hitza = ahoskera):

Tonalitatea 0

-12 +12

Dia elkarrizketa-koadroaren formatua: Erabili [S1] eta [S2] etiketak hizlari desberdinak markatzeko. Adibidea:

[S1] Kaixo! [S2] Kaixo, nola zaude?



                

                
                
                    
                    
                        AI modeloa
                        
                    

                    
                    
                        
                            Ahotsa
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Hizkuntza
                        
                    

                    
                    
                        Irteerako formatua
                        
                    

                    
                    
                        
                            Abiadura
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Librea Piper, VITS, MeloTTS-ekin



        
        
            
                Zure sortutako audioa hemen agertuko da. Aukeratu modelo bat, idatzi testua eta egin klik Sortu botoian.
            
            
            
                
                
                    Huts egin du sortzean
                    
                
            
        

            
                
                    
                        
                            Audioa behar bezala sortu da
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Deskargatu audioa
                            
                            
                                Deskargatu.srt
                            
                            
                            
                            Esteka 24 ordutan iraungiko da
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Librea: erabiltzaile pribatuentzat. Lizentzia komertziala $5/mo-tik
                        
                        
                    
                
            
        

        
        
            
                
                    Karaktere libreak agortu dira
                    Lortu 200K karaktere hilean — $5/mo
                    edo behin-behineko 100.000 pakete bat $5-en.
                
            
            
                
                    Zure ahotsa izan dadila.
                    Klonatu ahotsa 30 segundotan
                    
                
            
        

        

    
        
            
                
                    Maite TTS.ai? Esan zure lagunei!





    
        
            
                ✨ Premium ahots-modeloa
                
            
            
                Premium ahots-modeloa da hau, ordaindutako edozein planetan eskuragarri. Hala ere, ahotsak doan aurrez ikusi ditzakezu ahots-hautatzailearen ondoan dagoen erreproduzitu botoiarekin.
                
                    Desblokeatu premium ahotsak — $5/mo
                    Konparatu planak
                
            
        
    





    
        
            
                
                
                    Erosi karaktere gehiago
                    
    Iragarkirik ez
    Erabilera mugagabea
    Lehentasunaren euskarria
    Ezaugarri berrietarako sarbide goiztiarra


                
                

                
                    
                        Eskuratu karaktere gehiago






    
    
        
            Honi buruz CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Honako hauentzako onena: Real-time applications, streaming TTS, voice assistants
            
            Arakatu dena CosyVoice 2 ahotsak
        
        
            
                
                    Begirada batean
                    
                        Garatzailea
Alibaba (Tongyi Lab)
                        Lizentzia
Apache 2.0
                        Tier
standard
                        Abiadura
medium
                        Ahots klonaketa
Bai
                        Hizkuntzak
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Gehienezko karaktereak
1000
                    
                
            
        
    

    
    
    CosyVoice 2 ahotsak
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Lehenetsia
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 TTS — Galdera ohikoenak
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Ahots guztiak

CosyVoice 2 TTS

Maite TTS.ai? Esan zure lagunei!

Honi buruz CosyVoice 2

Begirada batean

CosyVoice 2 ahotsak

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS — Galdera ohikoenak

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?