Laporan Kesalahan / Panggonan Fitur

CosyVoice 2 TTS

Alibaba Tongyi Lab's streaming TTS reaching human-parity naturalness with near-zero latency and zero-shot cloning.

Teks
Fayl

0/500 aksara · 5000 kanggo saben generasi →

Ndaftar for 5,000 characters limit

Modus SSML (Speech Synthesis Markup Language for fine controlName)

Nglapisi teks ing tag SSML kanggo kontrol sing tepat:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Emotion / Style tags

Tag kang dipahami model kang dipilih — klik kanggo ngethok siji menyang teks sampeyan ing ngendi iku kedadeyan:

Kamus Pengucapan

Nyathet pangucapan standar (kata = pangucapan):

Pitch 0

-12 +12

Формат диалога: Gunake tag [S1] lan [S2] kanggo nyambungake pamicara sing beda. Conto:

[S1] Halo! [S2] Halo, apa kabarmu?



                

                
                
                    
                    
                        Model AI
                        
                    

                    
                    
                        
                            Suara
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Basa
                        
                    

                    
                    
                        Format Keluaran
                        
                    

                    
                    
                        
                            Kecepatan
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Bebas karo Piper, VITS, MeloTTS



        
        
            
                Audio anu dihasilkeun bakal muncul di dieu. Pilih model, ketok teks, sarta ketok Janji.
            
            
            
                
                
                    Penciptaan gagal
                    
                
            
        

            
                
                    
                        
                            Audio berhasil diciptakan
                            
                        
                        






    
        
            
                
                
                
                0:00
                
                    
                    
                        
                    
                
                
                    
                
                
            
        
    



                        
                            
                                Muat turun audio
                            
                            
                                Muat turun.srt
                            
                            
                            
                            Link expires in 24h
                            
                                
                                
                                
                                
                                
                            
                        
                        
                        
                            Kacamatan iki kalebu: Kacamatan Semarang. Lisénsi komersial saka $ 5 / mo
                        
                        
                    
                
            
        

        
        
            
                
                    Aksara bebas kurang
                    Njupuk 200K karakter saben wulan - $ 5/mo
                    utawa siji-wektu 100K paket kanggo $5
                
            
            
                
                    Buat iki suaramu dhewe
                    Klon suara dalam 30 detik
                    
                
            
        

        

    
        
            
                
                    Love TTS.ai? Nyathet kanca-kancamu!





    
        
            
                ✨ Model Suara Premium
                
            
            
                Ieu model sora premium, aya dina sagala rencana bayar. Anjeun masih bisa ningalikeun sorana sacara bébas ku tombol mainkeun di samping pamilihan sora.
                
                    Unlock premium suara — $5/mo
                    Ngbandingkeun rencana
                
            
        
    





    
        
            
                
                
                    Tuku karakter tambahan
                    
    Ora ana iklan
    Nggunakake tanpa wates
    Pitulung Prioritas
    Akses awal kanggo fitur anyar


                
                

                
                    
                        Tambah Karakter






    
    
        
            About CosyVoice 2
            CosyVoice 2, from Alibaba's Tongyi Lab, was designed to make high-quality speech viable in real time. It uses a finite scalar quantization approach combined with flow matching to support streaming synthesis at extremely low latency, while reaching human-comparable naturalness that outperforms many commercial systems in subjective tests. Beyond quality, it offers zero-shot voice cloning from about 3 seconds of audio, cross-lingual synthesis, and fine-grained emotion control. Covering 8 languages with a 1,000-character cap, it's a strong fit for voice assistants, streaming TTS, and other real-time applications.
            
            Paling apik kanggo: Real-time applications, streaming TTS, voice assistants
            
            Nglayar kabeh CosyVoice 2 suara
        
        
            
                
                    Ing cetha
                    
                        Pangembang
Alibaba (Tongyi Lab)
                        Lisensi
Apache 2.0
                        Tingkat
standard
                        Kecepatan
medium
                        Kloning suara
Iya
                        Basa
English, Chinese, Japanese, Korean, French, German, Italian, Spanish
                        Karakter paling akeh
1000
                    
                
            
        
    

    
    
    CosyVoice 2 suara
    
        
        
            
                
                    
                        
                            Chinese Female
                            Chinese
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Chinese Male
                            Chinese
                        
                        
                        
                        
                    
                    
                        Standar
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Female
                            English
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            English Male
                            English
                        
                        
                        
                        
                    
                    
                        Standar
                        Male
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            French Female
                            French
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            German Female
                            German
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Italian Female
                            Italian
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Japanese Female
                            Japanese
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Korean Female
                            Korean
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
        
            
                
                    
                        
                            Spanish Female
                            Spanish
                        
                        
                        
                        
                    
                    
                        Standar
                        Female
                    
                    
                    
                    
                
            
        
        
    
    

    
    
    CosyVoice 2 TTS — FAQ
    
        
        
            
                
            
            
                Yes. CosyVoice 2 uses finite scalar quantization for streaming synthesis at very low latency, which is what makes it suitable for voice assistants and real-time applications.
            
        
        
        
            
                
            
            
                Yes. It offers zero-shot voice cloning from roughly 3 seconds of reference audio, plus cross-lingual synthesis and emotion control.
            
        
        
        
            
                
            
            
                Yes. CosyVoice 2 is Apache 2.0 licensed. It supports 8 languages: English, Chinese, Japanese, Korean, French, German, Italian, and Spanish.
            
        
        
    
    

    ← Sekabeh swara

CosyVoice 2 TTS

Love TTS.ai? Nyathet kanca-kancamu!

About CosyVoice 2

Ing cetha

CosyVoice 2 suara

Chinese Female

Chinese Male

English Female

English Male

French Female

German Female

Italian Female

Japanese Female

Korean Female

Spanish Female

CosyVoice 2 TTS — FAQ

Can CosyVoice 2 stream audio in real time?

Does CosyVoice 2 support voice cloning?

Is CosyVoice 2 free for commercial use?