Soratra mankany amin'ny feo

Manova ny lahabolana ho teny mivoaka toy ny tena izy amin'ny alalan'ny modely AI loharano misokatra. Afaka ampiasaina maimaimpoana, tsy mila kaonty.

Misoratra anarana maimaimpoana

Tsy mbola manana feo TTS amin'ny teny malagasy izahay. Ataovy izay hampidirina ny anareo! Mivarotra ny Feonao

0/500 marika · Sign up for 5,000 per generation →

Misoratra anarana fetra 5000 marika

Fomba SSML (Teny fanoritsoritana ny fiteny ho an'ny fifehezana tsara)

Ampidiro anatin'ny tag SSML ny lahabolana mba hahazoana fifehezana mazava tsara:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Tag Emotion / Style

Ampidiro ireo marika fihetseham-po mba hitondra fiantraikany amin'ny fandefasana (miovaova ny modely fanohanana):

Rakibolan'ny fiteny

Mamaritra ny fanononana safidy (teny = fanononana):

Haavo 0

-12 +12

Lamin'ny takila Dia: Ampiasao ny tag [S1] sy [S2] mba hamantarana mpiteny samihafa. Ohatra:

[S1] Misaotra! [S2] Misaotra, ahoana ny toe-draharaha?



                
                
                    
                    
                        Modelin'ny AI
                        
                    

                    
                    
                        Feo
                        
                    
                
                

                
                
                    
                    
                        Teny
                        
                    

                    
                    
                        Lamin'ny famoahana
                        
                    

                    
                    
                        
                            Hafainganan'ny fanovana
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Malalaka miaraka amin'ny Piper, VITS, MeloTTS



        
        
            
                Hiseho eto ny feo namoronanao. Misafidiana modely iray, soraty ny lahabolana, dia tsindrio ny Mamorona.
            
            
            
                
                
                    Tsy nety ny famoronana
                    
                
            
        

            
                
                    
                        Namorona feo tsara
                        
                    
                    
                        


    
        
            
            
                
                    
                
                
            
        
    


                        
                            
                                Handefa feo
                            
                            
                            
                            Tapitra ao anatin'ny 24 ora ity rohy ity
                            
                                
                                    
                                    
                                    
                                    
                                    
                                
                            
                        
                    
                
            
        

        

    
        
            
                
                    Tianao ve ny TTS.ai? Lazao amin'ny namanao!



    
    
        
        
            
                Antsipirian'ilay modely
            
            
                
                
                    
                    Dia TTS
                
                Standard
                Dia by Nari Labs is a 1.6B parameter text-to-speech model designed specifically for generating multi-speaker dialogue. It can produce natural-sounding conversations between two speakers with appropriate turn-taking, prosody, and emotional expression. Dia is perfect for creating podcast-style content, audiobook dialogues, and interactive conversational AI.
                
                    
                        
                            Mpamorona:
                            Nari Labs
                        
                        
                            Lisansa:
                            Apache 2.0
                        
                        
                            _Hafainganana:
                            
                                Medium
                            
                        
                        
                            Kalitao:
                            
                                
                            
                        
                        
                            Teny
                            1 fiteny
                        
                        
                            VRAM
                            4GB
                        
                        
                            Fandraisana an-tsoratra feo
                             Tsy raisina an-tànana
                        
                    
                
                
                
                    Toetoetra:
                    
                        
                        Multi-speaker
                        
                        Dialog generation
                        
                        Natural turn-taking
                        
                        Emotional expression
                        
                        1.6B parameters
                        
                    
                
                
                
                Tsara indrindra ho an'ny:: 
                Podcasts, audiobook dialogues, conversational content
                
                
            
        

        
        
            
                Torohevitra ho an'ny vokatra tsara kokoa
            
            
                
                    Ampiasao ny fanononana mety amin'ny fiatoana sy ny fiteny
                    Soraty ny isa sy ny fanononana mba ho mazava kokoa ny fehezanteny
                    Hampiditra virtoaly mba hamoronana fiatoana fohy eo anelanelan'ny fehezanteny
                    Ampiasao ny ellipsis (...) raha mila fiatoana lava kokoa
                    Andramo ny Kokoro na ny CosyVoice 2 ho an'ny vokatra tena voajanahary indrindra
                    Ny Dia no ampiasaina amin'ny takila misy mpiteny maro sy ny votoaty podcast
                
            
        

        
        
            
                Fampiasàna marika
            
            
                
                    
                        
                            Taona
                            Ny vidin'ny marika 1K
                        
                    
                    
                        
                            Free
                            1:1 (tsy voafetra)
                        
                        
                            Stock label
                            Marika 2x
                        
                        
                            Premium
                            Marika 4x
                        
                    
                
            
            
                Maka marika fanampiny

Taona	Ny vidin'ny marika 1K
Free	1:1 (tsy voafetra)
Stock label	Marika 2x
Premium	Marika 4x






    
        
            
                
                
                    
                    
    Tsy misy dokambarotra
    Tsy misy fetra ny fampiasana
    Fandraisana an-tànana ny laharam-pahamehana
    Fahazoana mialoha ireo endri-javatra vaovao


                
                

                
                    
                        Mahazo fanehoan-kevitra bebe kokoa






    
        Ahoana ny fomba fiasan'ny AI Text to Speech
        Mamorona feo avo lenta amin'ny dingana telo tsotra. Tsy mila fahalalana ara-teknika.
        
            
                
                    
                        
                            
                        
                        Andalana 1
                        Soraty ny lahabolana
                        Manorata, apetaho na alefa ny lahabolana tianao ovaina ho teny mivaky. Mandray an-tànana hatramin'ny marika 5000 isan-karazany ho an'ireo mpampiasa efa niditra. Ampiasao ny lahabolana tsotra na ampio tag SSML mba hifehezana ny fehezanteny, ny fiatoana, ary ny fanasongadinana.
                    
                
            
            
                
                    
                        
                            
                        
                        Andalana 2
                        Safidio ny modely sy ny feo
                        Misafidiana modely AI mihoatra ny 20 amin'ny ambaratonga telo. Misafidiana feo mifanaraka amin'ny votoatiny, misafidiana ny teny tianao ampiasaina, manova ny hafainganan'ny famakiana eo anelanelan'ny 0.5x ka hatramin'ny 2.0x, ary misafidy ny endrika famoahana tianao (MP3, WAV, OGG, na FLAC).
                    
                
            
            
                
                    
                        
                            
                        
                        Andalana 3
                        Hamorona sy hisintona
                        Tsindrio ny "Mamorona" dia ho vonona ao anatin'ny segondra vitsy ny feonao. Jereo aloha amin'ny alalan'ny mpilalao mipetaka ao anatiny, vakio amin'ny lamina safidinao, na adikao amin'ny alalan'ny rohy azo zaraina. Ampiasao ny API ho an'ny fiasan'ny batch sy ny fampidirana amin'ny fizotranao.
                    
                
            
        
    






    
        Soratra mankany amin'ny fiteny
        Manova ny fomba famoronan'ny olona, fanjifana, ary fifandraisan'izy ireo amin'ny votoaty am-peo manerana ny indostria am-polony ny lahatsoratra-ho-teny mifototra amin'ny AI.
        
            
                
                    
                        
                        Boky am-peo
                        Manova boky iray manontolo ho toy ny boky audio manana feo natoraly miaraka amin'ny fitantarana tsara kalitao. Mandray an-tànana ny mpiteny maro miaraka amin'ny Dia ho an'ny takila momba ny mpilalao.
                    
                
            
            
                
                    
                        
                        Fampidirana horonantsary
                        Mamorona feo ho an'ny YouTube, TikTok, Instagram Reels, ary ny lahatsary fohy. Feo mihoatra ny 100 na adikao ny anao manokana.
                    
                
            
            
                
                    
                        
                        Podcasts
                        Mamorona fizarana podcast avy amin'ny baiko soratra miaraka amin'ny feo AI marobe. Ampiasao ny Dia ho an'ny resadresaka amin'ny mpiteny roa.
                    
                
            
            
                
                    
                        
                        Lalao
                        Feon'ny AI ho an'ny lalao indie, tantara an-tsary, ary tantara an-tsary mifampiresaka. Dikan-teny NPC, feon'ny cutscene, fiteny mihoatra ny 30.
                    
                
            
            
                
                    
                        
                        E-Fianarana
                        Manova ireo fitaovana fianarana, lahateny, ary votoaty fanazarantena ho feo. Fandraisana an-tànana fiteny maro ho an'ny sehatra manerantany.
                    
                
            
            
                
                    
                        
                        Fahafahana miditra
                        Ataovy azo idirana ireo tranonkala, tahirin-kevitra, ary rindran'asa. Fampidirana ny API'ny mpamaky efijery ary fanovàna lahatsoratra ho feo.
                    
                
            
            
                
                    
                        
                        Rafi-pifandraisana
                        Ampitomboy ny herin'ny rafitra IVR, ny tolotra an-telefaonina, ary ny tolotra ho an'ny mpanjifa amin'ny alalan'ny feo voajanahary avy amin'ny AI.
                    
                
            
            
                
                    
                        
                        Media sosialy
                        Fitantarana ao amin'ny TikTok, Instagram Reels, fanehoan-kevitra ao amin'ny Twitter/X, lahatsary fohy YouTube.
                    
                
            
            
                
                    
                        
                        Mivezivezy
                        Fampandrenesana Twitch TTS, resadresaka amin'ny feo, AI mpiara-mikarakara, ary robot Discord. Tsy misy fiatoana, feo mihoatra ny 100, mifanaraka amin'ny StreamElements.
                    
                
            
            
                
                    
                        
                        Fivarotana
                        Fanehoan-kevitra amin'ny dokambarotra, lahatsary fanazavana, fampisehoana ny vokatra, ary fampisehoana ny varotra.
                    
                
            
            
                
                    
                        
                        Fandraiketana & Fiteny
                        Dikan-teny sy fandikana lahatsary amin'ny teny mihoatra ny 30 miaraka amin'ny AI mifanaraka amin'ny feo.
                    
                
            
            
                
                    
                        
                        Fieritreretana & Fahasalamana
                        Fieritreretana mitarika, tantaran'ny torimaso, fanazaran-tena amin'ny fiasan'ny rivotra, ary fanamarinana amin'ny feo AI milamina sy mandrehitra fo.
                    
                
            
        
        
            Jereo daholo ireo tranga sy fitaovana ampiasana
        
    






    
        Ireo modelin'ny fandikana lahabolana rehetra
        Famaritana amin'ny antsipiriany ho an'ny modely AI rehetra hita ao amin'ny TTS.ai. Ampitahao ny kalitao, ny hafainganam-pandeha, ny fanohanana ny teny, ary ny endri-javatra mba hahitana ny modely mety indrindra ho an'ny tetikasao.

        
        
            Ny rehetra (32)
            Free (7)
            Stock label (18)
            Premium (7)
        

        
            
            
                
                    
                    
                        
                            
                                Kokoro
                                Free
                            
                            
                                Kokoro dia modely 82 tapitrisa amin'ny famaritana ny soratra ho teny izay misongadina tsara noho ny lanjany. Na dia kely aza ny habeny, dia mamorona teny tena natiora sy maneho hevitra izy. Manohana fiteny marobe ny Kokoro, anisan'izany ny teny Anglisy, Japoney, Shinoa, ary Koreana miaraka amin'ny feo marobe maneho hevitra. Mandroso haingana dia haingana izy — mamorona feo haingana 100 heny noho ny fotoana tena izy amin'ny GPU.

                                
                                    
                                        Mpamorona::

                                        Hexgrad
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, ja, zh, ko, fr, de, it, pt, es, hi, ru
                                    
                                    
                                        VRAM:

                                        1.5GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Mpizahaky ny macro
                                        
                                        Tena haingana
                                        
                                        Feon'ny fitenenana
                                        
                                        Teny maro
                                        
                                        Fandraisana an-tànana streaming
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa streaming TTS avo lenta miaraka amin'ny fotoana fiatoana kely indrindra
                                
                            
                            
                                
                                    Andramo Kokoro
                                
                            
                        
                    
                    
                    
                        
                            
                                Piper
                                Free
                            
                            
                                Ny Piper dia milina madinika iray hanova ny soratra ho teny namboarin'ny Rhasspy izay mampiasa ny VITS sy ny larynx architecture. Miasa tanteraka amin'ny CPU izy, ka mahatonga azy ho tsara indrindra ho an'ny fitaovana eny amin'ny sisiny, ny fanaraha-maso ny trano, ary ny rindran'asa mila TTS tsy misy fifandraisana. Miaraka amin'ny feo maherin'ny 100 amin'ny teny 30+ ny Piper, manome feo voajanahary amin'ny fiteny amin'ny hafainganam-pandeha tena izy na dia amin'ny Raspberry Pi 4 aza.

                                
                                    
                                        Mpamorona::

                                        Rhasspy
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, ar, cs, da, fi, el, hu, is, ka, kk, ne, no, ro, sk, sr, sv, sw, tr, uk, vi
                                    
                                    
                                        VRAM:

                                        0 (CPU only)
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        CPU-friendly
                                        
                                        Azo ampiasaina tsy misy fifandraisana
                                        
                                        Feo mihoatra ny 100
                                        
                                        Teny mihoatra ny 30
                                        
                                        Fandraisana an-tànana SSML
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Topy maso haingana, fidirana mora, ary rindran'asa tafiditra
                                
                            
                            
                                
                                    Andramo Piper
                                
                            
                        
                    
                    
                    
                        
                            
                                VITS
                                Free
                            
                            
                                Ny VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) dia fomba TTS mifamatotra miainga avy amin'ny farany ka hatrany amin'ny farany izay mamorona feo miafina miavaka kokoa noho ny modely roa dingana ankehitriny. Mandray ny fiheverana miovaova ampitomboina amin'ny fikorianan'ny normalization sy ny fizotry ny fanazaran-tena mifanohitra izy, ary mahazo fanatsarana goavana amin'ny natiora.

                                
                                    
                                        Mpamorona::

                                        Jaehyeon Kim et al.
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko
                                    
                                    
                                        VRAM:

                                        1GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Famaritana feno
                                        
                                        Fiteny natoraly
                                        
                                        Famaritana haingana
                                        
                                        Mpiteny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Soratra mankany amin'ny fitenenana amin'ny fomba tsotra
                                
                            
                            
                                
                                    Andramo VITS
                                
                            
                        
                    
                    
                    
                        
                            
                                MeloTTS
                                Free
                            
                            
                                Ny MeloTTS avy amin'ny MyShell.ai dia tranomboky TTS maro teny izay manohana ny teny Anglisy (Amerikana, Britanika, Indiana, Aostraliana), Espaniola, Frantsay, Shinoa, Japoney, ary Koreana. Tena haingana dia haingana izy io, mandray andraikitra amin'ny teny amin'ny hafainganam-pandeha mitovy amin'ny fotoana tena izy amin'ny CPU ihany. Ny MeloTTS dia natao ho an'ny fampiasana amin'ny famokarana ary manohana ny CPU sy ny GPU.

                                
                                    
                                        Mpamorona::

                                        MyShell.ai
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, es, fr, zh, ja, ko
                                    
                                    
                                        VRAM:

                                        0.5GB (GPU optional)
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Miaraka amin'ny CPU tsara indrindra
                                        
                                        Teny maro
                                        
                                        Fiteny maro
                                        
                                        Vonona ny famokarana
                                        
                                        Latency ambany
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa famokarana mila TTS haingana, maro fiteny
                                
                            
                            
                                
                                    Andramo MeloTTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Bark
                                Standard
                            
                            
                                Ny Bark avy amin'ny Suno dia modely fanovana lahatsoratra ho feo mifototra amin'ny mpanova izay afaka mamorona teny marobe tena marina sy feo hafa toy ny mozika, ny feo ambadiky ny feo, ary ny vokatry ny feo. Afaka mamorona fifandraisana tsy amin'ny teny toy ny hihomehezana, ny fikorontanana, ary ny mitomany izy io. Manohana mpiteny efa voafaritra mialoha mihoatra ny 100 sy fiteny mihoatra ny 13 ny Bark.

                                
                                    
                                        Mpamorona::

                                        Suno
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    
                                    
                                        VRAM:

                                        5GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Efekty feo
                                        
                                        Mihomehy/mirenireny
                                        
                                        Famoronana mozika
                                        
                                        Mpiteny 100+
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                votoaty feo mamorona, boky feo misy fihetseham-po, vokatry ny feo
                                
                            
                            
                                
                                    Andramo Bark
                                
                            
                        
                    
                    
                    
                        
                            
                                Bark Small
                                Standard
                            
                            
                                Ny Bark Small dia endrika namboarina tamin'ny maodelin'ny Bark izay mivarotra ny kalitaon'ny feo ho an'ny hafainganam-pandehan'ny fiheverana haingana kokoa sy ny filàna arika ambany kokoa. Mitahiry ny fahaizan'ny Bark hamorona resaka miaraka amin'ny fihetseham-po, ny hihomehezana, ary ny fiteny maro izy.

                                
                                    
                                        Mpamorona::

                                        Suno
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    
                                    
                                        VRAM:

                                        2GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Maivana
                                        
                                        Haingana kokoa noho ny Bark feno
                                        
                                        Fiteny mampihetsi-po
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Feo mamorona haingana rehefa mavesatra loatra ny feo feno
                                
                            
                            
                                
                                    Andramo Bark Small
                                
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice 2
                                Standard
                            
                            
                                Ny CosyVoice 2 avy amin'ny Tongyi Lab ao Alibaba dia manana kalitaon'ny feo mitovy amin'ny an'ny olombelona nefa manana fotoana fiatoana ambany indrindra, ka mahatonga azy io ho tsara indrindra ho an'ny fampiharana amin'ny fotoana tena izy. mampiasa fomba fiasa finite scalar quantumization izy io ho an'ny fampifangaroana mivantana ary manohana ny famoronana feo tsy misy fipoahana, fampifangaroana teny maro, ary ny fifehezana ny fihetseham-po amin'ny fomba tsara. mahatratra ny fahaizany ny rafitra TTS marobe amin'ny tsena amin'ny fanadihadiana ny tena.

                                
                                    
                                        Mpamorona::

                                        Alibaba (Tongyi Lab)
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, fr, de, it, es
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Mivezivezy
                                        
                                        Zero-shot clone
                                        
                                        Fiteny marobe
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Human-parity
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa amin'ny fotoana tena izy, streaming TTS, mpanampy amin'ny feo
                                
                            
                            
                                
                                    Andramo CosyVoice 2
                                
                            
                        
                    
                    
                    
                        
                            
                                Dia TTS
                                Standard
                            
                            
                                Ny Dia avy amin'ny Nari Labs dia modely 1.6B soratra-ho-teny natao manokana ho an'ny famoronana adihevitra maro mpiteny. Afaka mamorona resaka miafina eo amin'ny mpiteny roa miaraka amin'ny fihodinan'ny fotoana, ny fiteny, ary ny fiteny ara-pihetseham-po izy. Ny Dia dia mety tsara amin'ny famoronana votoaty tahaka ny podcast, adihevitra amin'ny boky audio, ary AI mifampiresaka.

                                
                                    
                                        Mpamorona::

                                        Nari Labs
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Mpiteny maro
                                        
                                        Famoronana takila
                                        
                                        Fihodinan-dàlana voajanahary
                                        
                                        Fiteny maneho fihetseham-po
                                        
                                        Mpizahaky ny fanatanterahana
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Podcasts, fifanakalozan-kevitra amin'ny boky am-peo, votoaty resaka
                                
                            
                            
                                
                                    Andramo Dia TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Parler TTS
                                Standard
                            
                            
                                Ny Parler TTS dia modely fandikana lahabolana ho teny izay mampiasa ny famaritana feo avy amin'ny teny natoraly mba hifehezana ny kabary azo. Raha tsy misafidy avy amin'ireo feo efa voafaritra mialoha ianao, dia mamaritra ny feo tianao (ohatra, "feo vehivavy mafana manana feo Britanika kely, miteny milamina sy mazava") ary ny Parler dia mamorona ny kabary mifanaraka amin'io famaritana io. Izany no mahatonga azy ho sarotra ampiasaina amin'ny rindranasa famoronana.

                                
                                    
                                        Mpamorona::

                                        Hugging Face
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fanoritsoritana ny feo
                                        
                                        Fifehezana ny fiteny voajanahary
                                        
                                        Famoronana feo azo ovaina
                                        
                                        Tsy mila feo voafaritra mialoha
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa famoronana izay mila safidy manokana momba ny feo ianao
                                
                            
                            
                                
                                    Andramo Parler TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                GLM-TTS
                                Standard
                            
                            
                                Ny GLM-TTS avy amin'ny Zhipu AI dia rafitra fandikana teny ho teny mivantana, natsangana tamin'ny fomba fanamboarana Llama miaraka amin'ny fifandanjana miverimberina. Manana ny tahan'ny hadisoana amin'ny marika ambany indrindra amin'ireo maodely TTS misokatra izy, izay midika fa manome ny fehezanteny marina indrindra. Ny GLM-TTS dia manohana ny teny Anglisy sy ny teny Sinoa miaraka amin'ny fandikana feo avy amin'ny santionan-teny 3-10 segondra.

                                
                                    
                                        Mpamorona::

                                        Zhipu AI
                                    
                                    
                                        Lisansa::

                                        GLM-4 License
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Isan'ny tsy fetezana ambany indrindra
                                        
                                        Fandraisana feo
                                        
                                        Fitoviana amin'ny fivoahana
                                        
                                        Fiteny natoraly
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindranasa mitaky ny fahafenoan'ny fehezanteny
                                
                            
                            
                                
                                    Andramo GLM-TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                IndexTTS-2
                                Standard
                            
                            
                                IndexTTS-2 dia rafitra fanovana lahatsoratra ho teny mivantana izay miavaka amin'ny famoronana feo tsy misy fipoahana miaraka amin'ny fifehezana ny fihetseham-po tsara. Afaka mamorona teny amin'ny feo misy fihetseham-po manokana toy ny faly, malahelo, tezitra, na matahotra izy io, tsy mila angon-drakitra fanazarantena manokana momba ny fihetseham-po. Mampiasa ny vector fihetseham-po ny modely mba hifehezana amin'ny fomba mazava ny fisehoan'ny fihetseham-po amin'ny teny novokarina.

                                
                                    
                                        Mpamorona::

                                        Index Team
                                    
                                    
                                        Lisansa::

                                        Bilibili Model License
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Zero-shot
                                        
                                        Vektorin'ny fihetseham-po
                                        
                                        Fitenenana maneho hevitra
                                        
                                        Fifehezana madinika
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Vohikala maneho fihetseham-po, boky am-peo, mpanampy virtoaly
                                
                            
                            
                                
                                    Andramo IndexTTS-2
                                
                            
                        
                    
                    
                    
                        
                            
                                Spark TTS
                                Standard
                            
                            
                                Ny Spark TTS avy amin'ny SparkAudio dia maodelin'ny soratra mankany amin'ny fitenenana izay mampifangaro ny fandikana feo miaraka amin'ny fihetseham-po azo fehezina sy ny fomba fitenenana. Amin'ny fampiasana feon-kira 5 segondra monja, afaka manitatra feo iray izy ary avy eo mamorona fitenenana miaraka amin'ny fihetseham-po, hafainganam-pandeha ary fomba fiteny samihafa raha mbola mitazona ny maha-izy azy ny feon'ny fandikana. Mampiasa rafitra fifehezana mifototra amin'ny fanontaniana ny Spark TTS.

                                
                                    
                                        Mpamorona::

                                        SparkAudio
                                    
                                    
                                        Lisansa::

                                        CC BY-NC-SA 4.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana feo
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fitantanana ny endri-tsoratra
                                        
                                        Mifototra amin'ny fanontaniana
                                        
                                        Fandraisana 5 segondra
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Famoronana votoaty amin'ny alalan'ny feo namboarina sy ny fifehezana ny fihetseham-po
                                
                            
                            
                                
                                    Andramo Spark TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                GPT-SoVITS
                                Standard
                            
                            
                                Mitambatra amin'ny modelin'ny teny GPT sy ny SoVITS (Singing Voice Inference via Translation and Synthesis) ny GPT-SoVITS mba hahazoana fanangonana feo mahomby. Amin'ny feon-kira 5 segondra monja, afaka mamorona feo sy mamorona kabary vaovao izy ary mitahiry ny toetra tokana an'ilay mpiteny. Tena tsara amin'ny fanangonana feo amin'ny fitenenana sy ny fihira izy.

                                
                                    
                                        Mpamorona::

                                        RVC-Boss
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko
                                    
                                    
                                        VRAM:

                                        6GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana 5 segondra
                                        
                                        Feon'ny hira
                                        
                                        Fianarana amin'ny alalan'ny sary vitsy
                                        
                                        High fidelity
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana feo, famoronana hira, famoronana feo ho an'ny mpamokatra votoaty
                                
                            
                            
                                
                                    Andramo GPT-SoVITS
                                
                            
                        
                    
                    
                    
                        
                            
                                Orpheus
                                Standard
                            
                            
                                Ny Orpheus dia maodelin'ny soratra mankany amin'ny fitenenana amin'ny ambaratonga lehibe izay mahatratra ny fanehoana fihetseham-po amin'ny ambaratongan'ny olombelona. Nahazo fiofanana tamin'ny angon-drakitra fitenenana isan-karazany maherin'ny 100.000 ora izy, ary misongadina amin'ny famoronana fitenenana miaraka amin'ny fihetseham-po voajanahary, ny fanamafisana, ary ny fomba fiteny. Afaka mamorona fitenenana izay tsy azo lazaina ho hafa noho ny fandraketana nataon'ny olona ny Orpheus.

                                
                                    
                                        Mpamorona::

                                        Canopy Labs
                                    
                                    
                                        Lisansa::

                                        Llama 3.2 Community
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fihetseham-po amin'ny ambaratonga olombelona
                                        
                                        100K ora fiofanana
                                        
                                        Fanasongadinana rarin-teny
                                        
                                        Fitenenana maneho hevitra
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fitenenana feno fihetseham-po avo lenta, boky am-peo, fitenenana amin'ny feo
                                
                            
                            
                                
                                    Andramo Orpheus
                                
                            
                        
                    
                    
                    
                        
                            
                                Chatterbox
                                Premium
                            
                            
                                Ny Chatterbox avy amin'ny Resemble AI dia fitaovana fanandramana fanandramana tsy misy fipoahana. Afaka mamorona feo avy amin'ny santionan-kira iray izy io, ary tsy ny feo ihany no azony, fa ny fomba fiteny sy ny fihetseham-po ihany koa. Manana ny fahaizana mifehy ny fihetseham-po tsara indrindra ihany koa ny Chatterbox, izay ahafahanao manova ny feo miteraka fihetseham-po tsy miankina amin'ny maha-izy ny feo.

                                
                                    
                                        Mpamorona::

                                        Resemble AI
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana sary tsy misy fipoahana
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        High fidelity
                                        
                                        Fandefasana endrika
                                        
                                        Fandraisana santionany tokana
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana feo amin'ny fomba matihanina miaraka amin'ny fifehezana ny fihetseham-po, famoronana votoaty
                                
                            
                            
                                
                                    Andramo Chatterbox
                                
                            
                        
                    
                    
                    
                        
                            
                                Tortoise TTS
                                Premium
                            
                            
                                Ny Tortoise TTS dia rafitra fandikana teny ho feo marobe miverina amin'ny laoniny izay manome lanja ny kalitaon'ny feo fa tsy ny hafainganan'ny feo. Mampiasà rafitra nalaina avy amin'ny DALL-E izy mba hamoronana teny tena natioraly miaraka amin'ny fiteny tsara sy ny fitoviana amin'ny mpiteny. Raha mihazakazaka kokoa noho ny safidy maro hafa ny Tortoise, dia mamorona ny sasany amin'ireo teny nalaina avy amin'ny teny tena izy indrindra izay hita ao amin'ny tontolon'ny loharano misokatra.

                                
                                    
                                        Mpamorona::

                                        James Betker
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        8GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Haavo ambony indrindra
                                        
                                        Feo maro
                                        
                                        Famolavolana DALL-E
                                        
                                        Fandraisana feo
                                        
                                        Miverina hoazy
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Boky am-peo, votoaty premium, rindrambaiko tsara kalitao
                                
                            
                            
                                
                                    Andramo Tortoise TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                StyleTTS 2
                                Premium
                            
                            
                                Ny StyleTTS 2 dia mahavita ny fitambarana TTS amin'ny ambaratongan'ny olombelona amin'ny alàlan'ny fampifangaroana ny fiparitahan'ny endrika amin'ny fanazarantena mifanohitra amin'ny fampiasana ny maodelin'ny fiteny be fiteny. Mamorona ny fitenenana izay miteny toy ny tena izy indrindra izy eo amin'ny maodelin'ny mpiteny iray, mifaninana amin'ny fandraketana ny olona. Mampiasa ny maodelin'ny endrika mifototra amin'ny fiparitahana ny StyleTTS 2 mba haka ny fiovan'ny fiteny rehetra.

                                
                                    
                                        Mpamorona::

                                        Columbia University
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        _Habe:
                                        
                                        Endrika fampielezana
                                        
                                        Fanazaran-tena miady
                                        
                                        Fiovana voajanahary
                                        
                                        High fidelity
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Famaritana ny feo amin'ny mpiteny tokana, fitantarana matihanina
                                
                            
                            
                                
                                    Andramo StyleTTS 2
                                
                            
                        
                    
                    
                    
                        
                            
                                OpenVoice
                                Premium
                            
                            
                                Ny OpenVoice avy amin'ny MyShell.ai dia mamela ny fandikana feo avy hatrany miaraka amin'ny fifehezana ny fomba fiteny, ny fihetseham-po, ny fiteny, ny fiteny, ny fiatoana, ary ny fiteny. Afaka manitatra feo avy amin'ny horonantsary fohy izy ary mamorona kabary amin'ny teny maro nefa tsy manala ny maha-izy ny mpiteny. Miasa toy ny mpanova feo ihany koa ny OpenVoice, izay mamela ny fanovana feo amin'ny fotoana tena izy.

                                
                                    
                                        Mpamorona::

                                        MyShell.ai / MIT
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, fr, de, es, it
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Famoronana dika mitovy avy hatrany
                                        
                                        Fanovana feo
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fifehezana ny fanasongadinana rarinteny
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana an-tsoratra feo miaraka amin'ny fifehezana ny endri-tsoratra, fanovàna feo
                                
                            
                            
                                
                                    Andramo OpenVoice
                                
                            
                        
                    
                    
                    
                        
                            
                                Qwen3 TTS
                                Standard
                            
                            
                                Qwen3-TTS dia maodely 1.7 miliara parameters text-to-speech avy amin'ny ekipa Qwen ao amin'ny Alibaba. Manaiky fomba telo izy: feo efa voafaritra mialoha miaraka amin'ny fifehezana ny fihetseham-po (mpiteny 9), fandikana feo avy amin'ny 3 segondra monja amin'ny feo, ary fomba iray manokana amin'ny famolavolana feo izay ahafahanao mamaritra ny feo tianao amin'ny teny natoraly.

                                
                                    
                                        Mpamorona::

                                        Alibaba (Qwen)
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, de, fr, ru, pt, es, it
                                    
                                    
                                        VRAM:

                                        7GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana feo
                                        
                                        Feo 9 efa voafaritra
                                        
                                        Famolavolana feo avy amin'ny lahabolana
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Teny 10
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Mpiaty maro teny miaraka amin'ny fandikana feo na famolavolana feo safidy
                                
                            
                            
                                
                                    Andramo Qwen3 TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Sesame CSM
                                Premium
                            
                            
                                Ny Sesame CSM (Conversational Speech Model) dia maodely misy singa 1 miliara namboarina manokana ho an'ny famoronana resadresaka. Izy io dia mamolavola ny endrika natioran'ny resadresaka ataon'ny olombelona, anisan'izany ny fotoana fandraisana anjara, ny valin'ny backchannel, ny fihetseham-po, ary ny fivoahan'ny resadresaka. Ny CSM dia mamorona feo mitovy amin'ny resadresaka natioran'ny olombelona fa tsy ny resadresaka artifisialy.

                                
                                    
                                        Mpamorona::

                                        Sesame
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        8GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Fifampiresaka
                                        
                                        Fotoana voajanahary
                                        
                                        Miova toerana
                                        
                                        Backchannel
                                        
                                        Mpizahaky ny macro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                AI assistants, chatbots, rindrambaiko AI resaka
                                
                            
                            
                                
                                    Andramo Sesame CSM
                                
                            
                        
                    
                    
                    
                        
                            
                                Chatterbox Turbo
                                Standard
                            
                            
                                Ny Chatterbox Turbo avy amin'ny Resemble AI dia fanatsarana ny Chatterbox amin'ny alalan'ny fanatsarana ny paramita 350M, izay manome hafainganam-pandeha 6x amin'ny fotoana tena izy miaraka amin'ny fotoana fiatoana latsaky ny 200ms. Manaiky ireo tag paralinguistic toy ny [riaka], [kohaka], ary [mihomehy] mivantana ao anatin'ny lahatsoratra izy io. Ahitana ny marika rano Perth amin'ny feo rehetra navoaka mba hanaraha-maso ny fiaviany.

                                
                                    
                                        Mpamorona::

                                        Resemble AI
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        2GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Latency ambany noho ny 200ms
                                        
                                        Tag Paralinguistic
                                        
                                        Fotoana tena izy 6x
                                        
                                        Fandraisana feo
                                        
                                        Famantarana ranomainty
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Mpikirakira feo amin'ny fotoana tena izy, fitenenana maneho hevitra miaraka amin'ny feo voajanahary
                                
                            
                            
                                
                                    Andramo Chatterbox Turbo
                                
                            
                        
                    
                    
                    
                        
                            
                                Zonos
                                Standard
                            
                            
                                Zonos v0.1 avy amin'i Zyphra dia modely 1.6B manana famaritana izay mampiseho ny fifehezana ny fihetseham-po amin'ny alalan'ny sliders ho an'ny fahasambarana, hatezerana, alahelo, tahotra, ary ny fahatsapana mahagaga. Manolotra ny Transformer sy ny SSM (modely toetrandro-toerana) vaovao izy. Nahazo fiofanana tamin'ny 200K+ ora fitenenana amin'ny fiteny marobe miaraka amin'ny fanodinana feo tsy misy fipoahana avy amin'ny 10-30 segondra amin'ny feo iantsorohana.

                                
                                    
                                        Mpamorona::

                                        Zyphra
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, ja, zh, fr, de
                                    
                                    
                                        VRAM:

                                        6GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fandikana feo
                                        
                                        Arkitektura SSM
                                        
                                        Teny maro
                                        
                                        Fifehezana ny haavo/fahavitrihana
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fiteny maneho hevitra miaraka amin'ny fifehezana ny fihetseham-po, studio famolavolana feo
                                
                            
                            
                                
                                    Andramo Zonos
                                
                            
                        
                    
                    
                    
                        
                            
                                Dia 2
                                Standard
                            
                            
                                Ny Dia2 avy amin'ny Nari Labs dia fanavaozana ny Dia amin'ny alalan'ny streaming-first, misy amin'ny endrika 1B sy 2B. Manomboka mamorona feo avy amin'ireo marika vitsy voalohany izy, ka mahatonga azy ho mety indrindra ho an'ny mpikirakira feo amin'ny fotoana tena izy sy ny fantsona fiteny-amin-teny. Mandray an-tànana ny fifanakalozan-kevitra amin'ny mpiteny maro miaraka amin'ny tag [S1]/[S2] sy ny teny fanalahidy toy ny (mihomehy), (mifoha).

                                
                                    
                                        Mpamorona::

                                        Nari Labs
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Famoahana miverimberina
                                        
                                        Mpiteny maro
                                        
                                        Latency ambany
                                        
                                        Famantarana ara-piteny
                                        
                                        Hatramin'ny 2 min
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Mpanao feo amin'ny fotoana tena izy, famoronana adihevitra, rindran'asa streaming
                                
                            
                            
                                
                                    Andramo Dia 2
                                
                            
                        
                    
                    
                    
                        
                            
                                VoxCPM
                                Standard
                            
                            
                                VoxCPM 1.5 avy amin'ny OpenBMB dia maodely TTS vaovao tsy misy tokenizer izay miasa amin'ny toerana mitohy fa tsy amin'ny tokens miavaka. Mamorona feo 44.1kHz tena marina izy, mandray an-tànana ny fandikana feo tsy misy fipoahana mandritra ny 3-10 segondra, ary mitazona ny fitoviana amin'ny andininy. Ny fandikana teny mifamatotra dia mamela anao hampiasa feo Anglisy amin'ny fitenenana Shinoa ary ny mifamatotra amin'izany.

                                
                                    
                                        Mpamorona::

                                        OpenBMB
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Audio 44.1kHz
                                        
                                        Tokenizer-free
                                        
                                        Fandraisana an-tsokosoko ny fiteny maro
                                        
                                        Fanaraha-maso ny seho
                                        
                                        Fanatsarana ny LoRA
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Feo avo lenta, boky am-peo, votoaty lavabe miaraka amin'ny feo mitovy
                                
                            
                            
                                
                                    Andramo VoxCPM
                                
                            
                        
                    
                    
                    
                        
                            
                                OuteTTS
                                Free
                            
                            
                                Manatsara ny modelin'ny teny lehibe miaraka amin'ny fahaizana manova lahatsoratra ho feo ny OuteTTS, nefa mitahiry ny endrika voalohany. Manaiky backend maro izy, anisan'izany ny llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ary na ny fidirana amin'ny alalan'ny mpitety tranonkala amin'ny alalan'ny Transformers.js aza. Manana ny fahaizana manaisotra feo tsy misy fipoahana amin'ny alalan'ny profil'ny mpiteny voatahiry amin'ny JSON.

                                
                                    
                                        Mpamorona::

                                        OuteAI
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        2GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Fivoahan'ny CPU
                                        
                                        Fivoahan'ny mpitety
                                        
                                        Fandraisana feo
                                        
                                        Backend maro
                                        
                                        Profiln'ny mpandahateny
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fampidirana ny sisiny, TTS mifototra amin'ny mpitety tranonkala, tontolo tsy dia be loharano
                                
                            
                            
                                
                                    Andramo OuteTTS
                                
                            
                        
                    
                    
                    
                        
                            
                                TADA
                                Standard
                            
                            
                                TADA (Text-Acoustic Dual Alignment) avy amin'ny Hume AI dia maodely TTS vaovao izay manafoana ny fihetseham-po tsy mety amin'ny alalan'ny rafitra vaovao fihetseham-po tsy mety natsangana tamin'ny Llama 3.2. Azo ampiasaina amin'ny 1B (Anglisy) sy 3B (teny maro), TADA dia mahazo RTF 0.09 — 5x haingana kokoa noho ny maodely TTS mitovy amin'ny LLM. Manohana hatramin'ny 700 segondra amin'ny tontolon'ny feo izy ary mamorona kabary maneho fihetseham-po tsy misy fihetseham-po tsy mety amin'ny fenitra mahazatra.

                                
                                    
                                        Mpamorona::

                                        Hume AI
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        5GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Tsy misy hallucinations
                                        
                                        5x haingana kokoa noho ny LLM TTS
                                        
                                        Fiteny maneho fihetseham-po
                                        
                                        Seha-peo 700s
                                        
                                        Fampifanitsiana roa
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fiteny avo lenta tsy misy hatsikana, fanehoana fihetseham-po, fiheverana haingana
                                
                            
                            
                                
                                    Andramo TADA
                                
                            
                        
                    
                    
                    
                        
                            
                                VibeVoice
                                Standard
                            
                            
                                Ny VibeVoice avy amin'ny Microsoft dia misy karazana roa: ny 1.5B ho an'ny votoaty lava (hatramin'ny 90 minitra, mpiteny 4) ary ny Realtime 0.5B ho an'ny streaming miaraka amin'ny fotoana fiatoana amin'ny feo voalohany ~200ms. Ny 1.5B dia tsara amin'ny podcasts sy ny boky amin'ny feo miaraka amin'ny fitoniana amin'ny mpiteny mandritra ny fehezanteny lava. Fanamarihana: Naesorin'ny Microsoft ny kaody TTS avy ao amin'ny tahiry ary ny feo navoaka dia ahitana ny fanehoan-kevitra avy amin'ny AI.

                                
                                    
                                        Mpamorona::

                                        Microsoft
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Mpitondra feo maro
                                        
                                        90 minitra
                                        
                                        Famoronana podcast
                                        
                                        Fifanarahana amin'ny mpandahateny
                                        
                                        200ms stream
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Podcasts, boky am-peo, votoaty lavabe maro mpiteny
                                
                            
                            
                                
                                    Andramo VibeVoice
                                
                            
                        
                    
                    
                    
                        
                            
                                Pocket TTS
                                Free
                            
                            
                                Ny Pocket TTS avy amin'i Kyutai (mpamorona ny Moshi) dia maodely soratra-ho-teny 100M manana paramètre kely izay mahatratra mihoatra ny lanjany. Miasa tsara amin'ny CPU izy, manohana ny fanitarana feo tsy misy fipoahana avy amin'ny santionan-teny tokana, ary mamorona feo voajanahary. Ny haben'ny maodely kely dia mahatonga azy ho mety amin'ny fampidirana eny amin'ny sisiny sy ny tontolo iainana tsy dia manana loharanom-pahalalana be loatra.

                                
                                    
                                        Mpamorona::

                                        Kyutai
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, fr
                                    
                                    
                                        VRAM:

                                        1GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Mpizahaky ny macro
                                        
                                        Fivoahan'ny CPU
                                        
                                        Fandraisana feo
                                        
                                        Fandraisana santionany tokana
                                        
                                        Vonona ny zoro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fampidirana mora, tontolo CPU fotsiny, fandikana feo haingana
                                
                            
                            
                                
                                    Andramo Pocket TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Kitten TTS
                                Free
                            
                            
                                Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

                                
                                    
                                        Mpamorona::

                                        KittenML
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        0GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        CPU-only inference
                                        
                                        Under 80MB model size
                                        
                                        8 built-in voices
                                        
                                        Speed control
                                        
                                        ONNX-based
                                        
                                        24kHz output
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fast lightweight TTS, edge deployment, low-latency applications
                                
                            
                            
                                
                                    Andramo Kitten TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice3
                                Standard
                            
                            
                                CosyVoice3 is the latest evolution from Alibaba's FunAudioLLM team. It features bi-streaming inference with ~150ms latency, instruction-based control for emotion/speed/volume, and improved speaker similarity for zero-shot cloning. Supports 9 languages plus 18 Chinese dialects. RL-tuned variant delivers state-of-the-art prosody.

                                
                                    
                                        Mpamorona::

                                        Alibaba (FunAudioLLM)
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, de, es, fr, it, ru
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Bi-streaming
                                        
                                        Emotion control
                                        
                                        Voice cloning
                                        
                                        Speed/volume control
                                        
                                        Instruction following
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Multilingual production TTS, real-time applications, voice cloning
                                
                            
                            
                                
                                    Andramo CosyVoice3
                                
                            
                        
                    
                    
                    
                        
                            
                                MOSS-TTS
                                Premium
                            
                            
                                MOSS-TTS from OpenMOSS supports generation of up to 1 hour of continuous speech across 20 languages. Features token-level duration control, phoneme-level pronunciation control via IPA/Pinyin, and code-switching between languages. The 8B production model delivers state-of-the-art quality with zero-shot voice cloning from reference audio.

                                
                                    
                                        Mpamorona::

                                        OpenMOSS
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
                                    
                                    
                                        VRAM:

                                        16GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Ultra-long generation
                                        
                                        20 languages
                                        
                                        Voice cloning
                                        
                                        Duration control
                                        
                                        Pronunciation control
                                        
                                        Code-switching
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Audiobooks, long-form content, multilingual production
                                
                            
                            
                                
                                    Andramo MOSS-TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                MegaTTS3
                                Premium
                            
                            
                                MegaTTS3 from ByteDance uses a novel sparse alignment mechanism combined with a latent diffusion transformer. Features adjustable trade-off between speech intelligibility and speaker similarity for zero-shot voice cloning.

                                
                                    
                                        Mpamorona::

                                        ByteDance
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        _Hafainganana::

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        8GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Voice cloning
                                        
                                        Adjustable similarity
                                        
                                        Cross-lingual
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                High-fidelity voice cloning
                                
                            
                            
                                
                                    Andramo MegaTTS3
                                
                            
                        
                    
                    
                
            

            
            
                
                    
                    
                        
                            
                                Kokoro
                                Free
                            
                            
                                Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
                                
                                    Mpamorona::
Hexgrad
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en, ja, zh, ko, fr, de, it, pt, es, hi, ru
                                
                                Tsara indrindra ho an'ny:: High-quality TTS with minimal latency, streaming applications
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Piper
                                Free
                            
                            
                                Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
                                
                                    Mpamorona::
Rhasspy
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, ar, cs, da, fi, el, hu, is, ka, kk, ne, no, ro, sk, sr, sv, sw, tr, uk, vi
                                
                                Tsara indrindra ho an'ny:: Quick previews, accessibility, and embedded applications
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                VITS
                                Free
                            
                            
                                VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
                                
                                    Mpamorona::
Jaehyeon Kim et al.
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en, zh, ja, ko
                                
                                Tsara indrindra ho an'ny:: General-purpose text-to-speech with natural prosody
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                MeloTTS
                                Free
                            
                            
                                MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
                                
                                    Mpamorona::
MyShell.ai
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en, es, fr, zh, ja, ko
                                
                                Tsara indrindra ho an'ny:: Production applications needing fast, multilingual TTS
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                OuteTTS
                                Free
                            
                            
                                OuteTTS extends large language models with text-to-speech capabilities while preserving the original architecture. It supports multiple backends including llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, and even browser inference via Transformers.js. Features zero-shot voice cloning through speaker profiles saved as JSON.
                                
                                    Mpamorona::
OuteAI
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en
                                
                                Tsara indrindra ho an'ny:: Edge deployment, browser-based TTS, low-resource environments
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Pocket TTS
                                Free
                            
                            
                                Pocket TTS by Kyutai (creators of Moshi) is a compact 100M parameter text-to-speech model that punches well above its weight. It runs efficiently on CPU, supports zero-shot voice cloning from a single audio sample, and produces natural-sounding speech. The small model size makes it ideal for edge deployment and low-resource environments.
                                
                                    Mpamorona::
Kyutai
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en, fr
                                
                                Tsara indrindra ho an'ny:: Lightweight deployment, CPU-only environments, quick voice cloning
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Kitten TTS
                                Free
                            
                            
                                Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
                                
                                    Mpamorona::
KittenML
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny: en
                                
                                Tsara indrindra ho an'ny:: Fast lightweight TTS, edge deployment, low-latency applications
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                
            

            
            
                
                    
                    
                        
                            
                                Bark
                                Stock label
                            
                            
                                Bark by Suno is a transformer-based text-to-audio model that can generate highly realistic, multilingual speech as well as other audio like music, background noise, and sound effects. It can produce nonverbal communications like laughing, sighing, and crying. Bark supports over 100 speaker presets and 13+ languages.
                                
                                    Mpamorona::
Suno
                                    Lisansa::
MIT
                                    _Hafainganana::
Slow
                                    Kalitao::

                                    Teny:
en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Sound effectsLaughing/sighingMusic generation100+ speakersMultilingual
                                Tsara indrindra ho an'ny:: Creative audio content, audiobooks with emotion, sound effects
                            
                            
                                Andramo Bark
                            
                        
                    
                    
                    
                        
                            
                                Bark Small
                                Stock label
                            
                            
                                Bark Small is a distilled version of the Bark model that trades some audio quality for significantly faster inference speeds and lower memory requirements. It retains Bark's ability to generate speech with emotions, laughter, and multiple languages.
                                
                                    Mpamorona::
Suno
                                    Lisansa::
MIT
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                LightweightFaster than full BarkEmotional speechMultilingual
                                Tsara indrindra ho an'ny:: Quick creative audio when full Bark is too slow
                            
                            
                                Andramo Bark Small
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice 2
                                Stock label
                            
                            
                                CosyVoice 2 by Alibaba's Tongyi Lab achieves human-comparable speech quality with extremely low latency, making it ideal for real-time applications. It uses a finite scalar quantization approach for streaming synthesis and supports zero-shot voice cloning, cross-lingual synthesis, and fine-grained emotion control. It outperforms many commercial TTS systems in subjective evaluations.
                                
                                    Mpamorona::
Alibaba (Tongyi Lab)
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, fr, de, it, es
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                StreamingZero-shot cloningCross-lingualEmotion controlHuman-parity
                                Tsara indrindra ho an'ny:: Real-time applications, streaming TTS, voice assistants
                            
                            
                                Andramo CosyVoice 2
                            
                        
                    
                    
                    
                        
                            
                                Dia TTS
                                Stock label
                            
                            
                                Dia by Nari Labs is a 1.6B parameter text-to-speech model designed specifically for generating multi-speaker dialogue. It can produce natural-sounding conversations between two speakers with appropriate turn-taking, prosody, and emotional expression. Dia is perfect for creating podcast-style content, audiobook dialogues, and interactive conversational AI.
                                
                                    Mpamorona::
Nari Labs
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Multi-speakerDialog generationNatural turn-takingEmotional expression1.6B parameters
                                Tsara indrindra ho an'ny:: Podcasts, audiobook dialogues, conversational content
                            
                            
                                Andramo Dia TTS
                            
                        
                    
                    
                    
                        
                            
                                Parler TTS
                                Stock label
                            
                            
                                Parler TTS is a text-to-speech model that uses natural language voice descriptions to control the generated speech. Instead of selecting from preset voices, you describe the voice you want (e.g., "a warm female voice with a slight British accent, speaking slowly and clearly") and Parler generates speech matching that description. This makes it uniquely flexible for creative applications.
                                
                                    Mpamorona::
Hugging Face
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Voice descriptionNatural language controlFlexible voice creationNo preset voices needed
                                Tsara indrindra ho an'ny:: Creative applications where you need custom voice characteristics
                            
                            
                                Andramo Parler TTS
                            
                        
                    
                    
                    
                        
                            
                                GLM-TTS
                                Stock label
                            
                            
                                GLM-TTS by Zhipu AI is a text-to-speech system built on the Llama architecture with flow matching. It achieves the lowest character error rate among open-source TTS models, meaning it produces the most accurate pronunciation. GLM-TTS supports English and Chinese with voice cloning from 3-10 second audio samples.
                                
                                    Mpamorona::
Zhipu AI
                                    Lisansa::
GLM-4 License
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Lowest error rateVoice cloningFlow matchingNatural prosody
                                Tsara indrindra ho an'ny:: Applications requiring maximum pronunciation accuracy
                            
                            
                                Andramo GLM-TTS
                            
                        
                    
                    
                    
                        
                            
                                IndexTTS-2
                                Stock label
                            
                            
                                IndexTTS-2 is an advanced text-to-speech system that excels at zero-shot voice synthesis with fine-grained emotion control. It can generate speech with specific emotional tones like happy, sad, angry, or fearful without requiring emotion-specific training data. The model uses emotion vectors to precisely control the emotional expression of generated speech.
                                
                                    Mpamorona::
Index Team
                                    Lisansa::
Bilibili Model License
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Emotion controlZero-shotEmotion vectorsExpressive speechFine-grained control
                                Tsara indrindra ho an'ny:: Emotionally expressive content, audiobooks, virtual assistants
                            
                            
                                Andramo IndexTTS-2
                            
                        
                    
                    
                    
                        
                            
                                Spark TTS
                                Stock label
                            
                            
                                Spark TTS by SparkAudio is a text-to-speech model that combines voice cloning with controllable emotion and speaking style. Using just 5 seconds of reference audio, it can clone a voice and then generate speech with different emotions, speeds, and styles while maintaining the cloned voice identity. Spark TTS uses a prompt-based control system.
                                
                                    Mpamorona::
SparkAudio
                                    Lisansa::
CC BY-NC-SA 4.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Voice cloningEmotion controlStyle controlPrompt-based5-second cloning
                                Tsara indrindra ho an'ny:: Content creation with cloned voices and emotional control
                            
                            
                                Andramo Spark TTS
                            
                        
                    
                    
                    
                        
                            
                                GPT-SoVITS
                                Stock label
                            
                            
                                GPT-SoVITS combines GPT-style language modeling with SoVITS (Singing Voice Inference via Translation and Synthesis) for powerful few-shot voice cloning. With as little as 5 seconds of reference audio, it can accurately clone a voice and generate new speech while preserving the speaker's unique characteristics. It excels at both speaking and singing voice synthesis.
                                
                                    Mpamorona::
RVC-Boss
                                    Lisansa::
MIT
                                    _Hafainganana::
Slow
                                    Kalitao::

                                    Teny:
en, zh, ja, ko
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                5-second cloningSinging voiceFew-shot learningHigh fidelityCross-lingual
                                Tsara indrindra ho an'ny:: Voice cloning, singing synthesis, content creator voice replication
                            
                            
                                Andramo GPT-SoVITS
                            
                        
                    
                    
                    
                        
                            
                                Orpheus
                                Stock label
                            
                            
                                Orpheus is a large-scale text-to-speech model that achieves human-level emotional expression. Trained on over 100,000 hours of diverse speech data, it excels at generating speech with natural emotions, emphasis, and speaking styles. Orpheus can produce speech that is virtually indistinguishable from human recordings.
                                
                                    Mpamorona::
Canopy Labs
                                    Lisansa::
Llama 3.2 Community
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Human-level emotion100K hours trainingNatural emphasisExpressive speech
                                Tsara indrindra ho an'ny:: High-quality emotional speech, audiobooks, voice acting
                            
                            
                                Andramo Orpheus
                            
                        
                    
                    
                    
                        
                            
                                Qwen3 TTS
                                Stock label
                            
                            
                                Qwen3-TTS is a 1.7 billion parameter text-to-speech model from Alibaba's Qwen team. It supports three modes: preset voices with emotion control (9 speakers), voice cloning from just 3 seconds of audio, and a unique voice design mode where you describe the voice you want in natural language. It covers 10 languages with high expressiveness and natural prosody.
                                
                                    Mpamorona::
Alibaba (Qwen)
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, de, fr, ru, pt, es, it
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Voice cloning9 preset voicesVoice design from textEmotion control10 languages
                                Tsara indrindra ho an'ny:: Multilingual content with voice cloning or custom voice design
                            
                            
                                Andramo Qwen3 TTS
                            
                        
                    
                    
                    
                        
                            
                                Chatterbox Turbo
                                Stock label
                            
                            
                                Chatterbox Turbo by Resemble AI is a 350M parameter upgrade to Chatterbox, delivering up to 6x real-time speed with sub-200ms latency. It supports paralinguistic tags like [laugh], [cough], and [chuckle] directly in text. Includes Perth watermarking on all generated audio for provenance tracking.
                                
                                    Mpamorona::
Resemble AI
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Sub-200ms latencyParalinguistic tags6x real-timeVoice cloningWatermarking
                                Tsara indrindra ho an'ny:: Real-time voice agents, expressive speech with natural sounds
                            
                            
                                Andramo Chatterbox Turbo
                            
                        
                    
                    
                    
                        
                            
                                Zonos
                                Stock label
                            
                            
                                Zonos v0.1 by Zyphra is a 1.6B parameter model featuring fine-grained emotion control with sliders for happiness, anger, sadness, fear, and surprise. It offers both a Transformer and a novel SSM (state-space model) variant. Trained on 200K+ hours of multilingual speech with zero-shot voice cloning from 10-30 seconds of reference audio.
                                
                                    Mpamorona::
Zyphra
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, ja, zh, fr, de
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Emotion controlVoice cloningSSM architectureMultilingualPitch/rate control
                                Tsara indrindra ho an'ny:: Expressive speech with emotion control, voice design studio
                            
                            
                                Andramo Zonos
                            
                        
                    
                    
                    
                        
                            
                                Dia 2
                                Stock label
                            
                            
                                Dia2 by Nari Labs is a streaming-first upgrade to Dia, available in 1B and 2B parameter variants. It begins synthesizing audio from the first few tokens, making it ideal for real-time voice agents and speech-to-speech pipelines. Supports multi-speaker dialogue with [S1]/[S2] tags and paralinguistic cues like (laughs), (coughs).
                                
                                    Mpamorona::
Nari Labs
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Streaming outputMulti-speakerLow latencyParalinguistic cuesUp to 2 min output
                                Tsara indrindra ho an'ny:: Real-time voice agents, dialogue generation, streaming applications
                            
                            
                                Andramo Dia 2
                            
                        
                    
                    
                    
                        
                            
                                VoxCPM
                                Stock label
                            
                            
                                VoxCPM 1.5 by OpenBMB is a novel tokenizer-free TTS model that operates in continuous space rather than discrete tokens. It produces high-fidelity 44.1kHz audio, supports zero-shot voice cloning from 3-10 seconds, and maintains consistency across paragraphs. Cross-language cloning lets you apply an English voice to Chinese speech and vice versa.
                                
                                    Mpamorona::
OpenBMB
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                44.1kHz audioTokenizer-freeCross-lingual cloningContext-awareLoRA fine-tuning
                                Tsara indrindra ho an'ny:: High-fidelity audio, audiobooks, long-form content with voice consistency
                            
                            
                                Andramo VoxCPM
                            
                        
                    
                    
                    
                        
                            
                                TADA
                                Stock label
                            
                            
                                TADA (Text-Acoustic Dual Alignment) by Hume AI is a groundbreaking TTS model that eliminates hallucinations through a novel dual alignment architecture built on Llama 3.2. Available in 1B (English) and 3B (multilingual) variants, TADA achieves an RTF of 0.09 — 5x faster than comparable LLM-based TTS models. It supports up to 700 seconds of audio context and produces emotionally expressive speech with zero hallucinations on standard benchmarks.
                                
                                    Mpamorona::
Hume AI
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Zero hallucinations5x faster than LLM TTSEmotional expression700s audio contextDual alignment
                                Tsara indrindra ho an'ny:: High-quality hallucination-free speech, emotional expression, fast inference
                            
                            
                                Andramo TADA
                            
                        
                    
                    
                    
                        
                            
                                VibeVoice
                                Stock label
                            
                            
                                VibeVoice from Microsoft generates long-form speech up to 90 minutes with support for 4 simultaneous speakers, making it ideal for podcasts and dialogues. The Realtime 0.5B variant achieves ~300ms latency for interactive use. Supports speaker tags for multi-turn dialogue generation.
                                
                                    Mpamorona::
Microsoft
                                    Lisansa::
MIT
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Multi-speakerLong-form (90 min)Podcast generationDialogueLow latency
                                Tsara indrindra ho an'ny:: Podcasts, dialogues, long-form narration, multi-speaker content
                            
                            
                                Andramo VibeVoice
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice3
                                Stock label
                            
                            
                                CosyVoice3 is the latest evolution from Alibaba's FunAudioLLM team. It features bi-streaming inference with ~150ms latency, instruction-based control for emotion/speed/volume, and improved speaker similarity for zero-shot cloning. Supports 9 languages plus 18 Chinese dialects. RL-tuned variant delivers state-of-the-art prosody.
                                
                                    Mpamorona::
Alibaba (FunAudioLLM)
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Fast
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, de, es, fr, it, ru
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Bi-streamingEmotion controlVoice cloningSpeed/volume controlInstruction following
                                Tsara indrindra ho an'ny:: Multilingual production TTS, real-time applications, voice cloning
                            
                            
                                Andramo CosyVoice3
                            
                        
                    
                    
                
            

            
            
                
                    
                    
                        
                            
                                Chatterbox
                                Premium
                            
                            
                                Chatterbox by Resemble AI is a cutting-edge zero-shot voice cloning model. It can replicate any voice from a single audio sample with remarkable accuracy, capturing not just the timbre but also the speaking style and emotional nuances. Chatterbox also features fine-grained emotion control, allowing you to adjust the emotional tone of the generated speech independently from the voice identity.
                                
                                    Mpamorona::
Resemble AI
                                    Lisansa::
MIT
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
4GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Zero-shot cloningEmotion controlHigh fidelityStyle transferSingle sample cloning
                                Tsara indrindra ho an'ny:: Professional voice cloning with emotional control, content creation
                            
                            
                                Andramo Chatterbox
                            
                        
                    
                    
                    
                        
                            
                                Tortoise TTS
                                Premium
                            
                            
                                Tortoise TTS is an autoregressive multi-voice text-to-speech system that prioritizes audio quality over speed. It uses DALL-E-inspired architecture to generate highly natural speech with excellent prosody and speaker similarity. While slower than many alternatives, Tortoise produces some of the most realistic synthetic speech available in the open-source ecosystem.
                                
                                    Mpamorona::
James Betker
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Slow
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
8GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Highest qualityMulti-voiceDALL-E architectureVoice cloningAutoregressive
                                Tsara indrindra ho an'ny:: Audiobooks, premium content, quality-first applications
                            
                            
                                Andramo Tortoise TTS
                            
                        
                    
                    
                    
                        
                            
                                StyleTTS 2
                                Premium
                            
                            
                                StyleTTS 2 achieves human-level TTS synthesis by combining style diffusion with adversarial training using large speech language models. It generates the most natural sounding speech among single-speaker models, rivaling human recordings. StyleTTS 2 uses diffusion-based style modeling to capture the full range of human speech variation.
                                
                                    Mpamorona::
Columbia University
                                    Lisansa::
MIT
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                    VRAM:
4GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Human-levelStyle diffusionAdversarial trainingNatural variationHigh fidelity
                                Tsara indrindra ho an'ny:: Studio-quality single-speaker synthesis, professional narration
                            
                            
                                Andramo StyleTTS 2
                            
                        
                    
                    
                    
                        
                            
                                OpenVoice
                                Premium
                            
                            
                                OpenVoice by MyShell.ai enables instant voice cloning with granular control over voice style, emotion, accent, rhythm, pauses, and intonation. It can clone a voice from a short audio clip and generate speech in multiple languages while maintaining the speaker identity. OpenVoice also functions as a voice converter, allowing real-time voice transformation.
                                
                                    Mpamorona::
MyShell.ai / MIT
                                    Lisansa::
MIT
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, fr, de, es, it
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
4GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Instant cloningVoice conversionEmotion controlAccent controlMultilingual
                                Tsara indrindra ho an'ny:: Voice cloning with fine-grained style control, voice conversion
                            
                            
                                Andramo OpenVoice
                            
                        
                    
                    
                    
                        
                            
                                Sesame CSM
                                Premium
                            
                            
                                Sesame CSM (Conversational Speech Model) is a 1 billion parameter model designed specifically for generating conversational speech. It models the natural patterns of human conversation including turn-taking timing, backchannel responses, emotional reactions, and conversational flow. CSM generates audio that sounds like a natural human conversation rather than synthetic speech.
                                
                                    Mpamorona::
Sesame
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Slow
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                    VRAM:
8GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                ConversationalNatural timingTurn-takingBackchannel1B parameters
                                Tsara indrindra ho an'ny:: AI assistants, chatbots, conversational AI applications
                            
                            
                                Andramo Sesame CSM
                            
                        
                    
                    
                    
                        
                            
                                MOSS-TTS
                                Premium
                            
                            
                                MOSS-TTS from OpenMOSS supports generation of up to 1 hour of continuous speech across 20 languages. Features token-level duration control, phoneme-level pronunciation control via IPA/Pinyin, and code-switching between languages. The 8B production model delivers state-of-the-art quality with zero-shot voice cloning from reference audio.
                                
                                    Mpamorona::
OpenMOSS
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Medium
                                    Kalitao::

                                    Teny:
en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
16GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Ultra-long generation20 languagesVoice cloningDuration controlPronunciation controlCode-switching
                                Tsara indrindra ho an'ny:: Audiobooks, long-form content, multilingual production
                            
                            
                                Andramo MOSS-TTS
                            
                        
                    
                    
                    
                        
                            
                                MegaTTS3
                                Premium
                            
                            
                                MegaTTS3 from ByteDance uses a novel sparse alignment mechanism combined with a latent diffusion transformer. Features adjustable trade-off between speech intelligibility and speaker similarity for zero-shot voice cloning.
                                
                                    Mpamorona::
ByteDance
                                    Lisansa::
Apache 2.0
                                    _Hafainganana::
Slow
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
8GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Voice cloningAdjustable similarityCross-lingual
                                Tsara indrindra ho an'ny:: High-fidelity voice cloning
                            
                            
                                Andramo MegaTTS3
                            
                        
                    
                    
                
            
        

        
        
            Tabilao fampitahana modely
            
                
                    
                        
                            Modely
                            Mpamorona:
                            Taona
                            Kalitao:
                            _Hafainganana:
                            Teny
                            Fandraisana an-tsoratra feo
                            VRAM
                            Lisansa:
                            Ny vidin'ny
                            
                        
                    
                    
                        
                        
                            Kokoro
                            Hexgrad
                            Free
                            
                            Fast
                            11
                            
                            1.5GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            Piper
                            Rhasspy
                            Free
                            
                            Fast
                            31
                            
                            0 (CPU only)
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            VITS
                            Jaehyeon Kim et al.
                            Free
                            
                            Fast
                            4
                            
                            1GB
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            MeloTTS
                            MyShell.ai
                            Free
                            
                            Fast
                            6
                            
                            0.5GB (GPU optional)
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            Bark
                            Suno
                            Standard
                            
                            Slow
                            13
                            
                            5GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Bark Small
                            Suno
                            Standard
                            
                            Medium
                            13
                            
                            2GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            CosyVoice 2
                            Alibaba (Tongyi Lab)
                            Standard
                            
                            Medium
                            8
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Dia TTS
                            Nari Labs
                            Standard
                            
                            Medium
                            1
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Parler TTS
                            Hugging Face
                            Standard
                            
                            Medium
                            1
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            GLM-TTS
                            Zhipu AI
                            Standard
                            
                            Medium
                            2
                            
                            4GB
                            GLM-4 License
                            2
                            Ampiasao
                        
                        
                        
                            IndexTTS-2
                            Index Team
                            Standard
                            
                            Medium
                            2
                            
                            4GB
                            Bilibili Model License
                            2
                            Ampiasao
                        
                        
                        
                            Spark TTS
                            SparkAudio
                            Standard
                            
                            Medium
                            2
                            
                            4GB
                            CC BY-NC-SA 4.0
                            2
                            Ampiasao
                        
                        
                        
                            GPT-SoVITS
                            RVC-Boss
                            Standard
                            
                            Slow
                            4
                            
                            6GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Orpheus
                            Canopy Labs
                            Standard
                            
                            Medium
                            1
                            
                            4GB
                            Llama 3.2 Community
                            2
                            Ampiasao
                        
                        
                        
                            Chatterbox
                            Resemble AI
                            Premium
                            
                            Medium
                            1
                            
                            4GB
                            MIT
                            4
                            Ampiasao
                        
                        
                        
                            Tortoise TTS
                            James Betker
                            Premium
                            
                            Slow
                            1
                            
                            8GB
                            Apache 2.0
                            4
                            Ampiasao
                        
                        
                        
                            StyleTTS 2
                            Columbia University
                            Premium
                            
                            Medium
                            1
                            
                            4GB
                            MIT
                            4
                            Ampiasao
                        
                        
                        
                            OpenVoice
                            MyShell.ai / MIT
                            Premium
                            
                            Medium
                            8
                            
                            4GB
                            MIT
                            4
                            Ampiasao
                        
                        
                        
                            Qwen3 TTS
                            Alibaba (Qwen)
                            Standard
                            
                            Medium
                            10
                            
                            7GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Sesame CSM
                            Sesame
                            Premium
                            
                            Slow
                            1
                            
                            8GB
                            Apache 2.0
                            4
                            Ampiasao
                        
                        
                        
                            Chatterbox Turbo
                            Resemble AI
                            Standard
                            
                            Fast
                            1
                            
                            2GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Zonos
                            Zyphra
                            Standard
                            
                            Medium
                            5
                            
                            6GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Dia 2
                            Nari Labs
                            Standard
                            
                            Fast
                            1
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            VoxCPM
                            OpenBMB
                            Standard
                            
                            Fast
                            2
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            OuteTTS
                            OuteAI
                            Free
                            
                            Fast
                            1
                            
                            2GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            TADA
                            Hume AI
                            Standard
                            
                            Fast
                            1
                            
                            5GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            VibeVoice
                            Microsoft
                            Standard
                            
                            Fast
                            2
                            
                            4GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Pocket TTS
                            Kyutai
                            Free
                            
                            Fast
                            2
                            
                            1GB
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            Kitten TTS
                            KittenML
                            Free
                            
                            Fast
                            1
                            
                            0GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            CosyVoice3
                            Alibaba (FunAudioLLM)
                            Standard
                            
                            Fast
                            9
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            MOSS-TTS
                            OpenMOSS
                            Premium
                            
                            Medium
                            19
                            
                            16GB
                            Apache 2.0
                            4
                            Ampiasao
                        
                        
                        
                            MegaTTS3
                            ByteDance
                            Premium
                            
                            Slow
                            2
                            
                            8GB
                            Apache 2.0
                            4
                            Ampiasao
                        
                        
                    
                
            
        
    




    
        
            
                Ny sehatra AI Text to Speech feno indrindra

                
                    
                        Nahoana no Safidy ny TTS.ai ho an'ny Soratra ho Fitenenana?
                        Mitambatra ao anatin'ny sehatra iray, mora ampiasaina, ny maodely tsara indrindra manerantany amin'ny fanehoana lahatsoratra ho amin'ny resaka, ny TTS.ai. tsy toy ny tolotra manokana izay manakana anao amin'ny milina feo tokana, manome anao fidirana amin'ny maodely mihoatra ny 20 avy amin'ireo laboratoara fikarohana lehibe, anisan'izany ny Coqui, MyShell, Amphion, NVIDIA, Suno, HuggingFace, ny Anjerimanontolon'i Tsinghua, ary maro hafa.
                        Ny modely tsirairay dia loharano misokatra eo ambanin'ny MIT, Apache 2.0, na lisansa mitovy amin'izany, izay manome antoka fa manana zo ara-barotra feno ianao hampiasa ny feo navoaka ao amin'ny tetikasao. Na mila famoronana haingana sy maivana ho an'ny rindran'asa amin'ny fotoana tena izy ianao na vokatra avo lenta ho an'ny boky audio sy podcast, manana ny modely mety amin'ny tranga rehetra ny TTS.ai.

                        Modely maimaimpoana, tsy mila kaonty
                        Manomboka avy hatrany amin'ny maodely telo maimaimpoana TTS: Piper (tena haingana, maivana), VITS (fanamboarana neural avo lenta), ary MeloTTS (fanampiana fiteny marobe). Tsy mila misoratra anarana, tsy mila karatra fandoavam-bola, tsy misy fetra amin'ny taranaka. Manohana ny teny Anglisy sy ny fiteny hafa marobe miaraka amin'ny feo voajanahary mifanaraka amin'ny ankamaroan'ny rindrambaiko ny maodely maimaimpoana.
                    
                    
                        Fandraisana an-tànana alefa amin'ny GPU
                        Ireo modely TTS rehetra dia mandeha amin'ny GPU NVIDIA manokana mba hahazoana fotoana famoronana haingana sy tsy miova. Ny modely maimaimpoana dia matetika mamorona feo ao anatin'ny 2 segondra. Ny modely mahazatra toy ny Kokoro, CosyVoice 2, ary Bark dia eo amin'ny 3-5 segondra eo ho eo. Ny modely premium manana kalitao avo indrindra, toy ny Tortoise sy Chatterbox, dia miasa ao anatin'ny 5-15 segondra arakaraka ny halavan'ny lahabolana.

                        Teny 30+ raisina an-tànana
                        Mamorona kabary amin'ny teny maherin'ny 30, anisan'izany ny teny Anglisy, Espaniola, Frantsay, Alemàna, Italiana, Portiogey, Sinoa, Japoney, Koreana, Arabo, Hindi, Rosiana, ary maro hafa. Maro ny modely manohana ny famoronana kabary amin'ny teny maro, izay midika fa afaka mamorona kabary amin'ny teny iray izay tsy mbola notrehin'ny feo voalohany ianao. Ny CosyVoice 2 sy ny GPT-SoVITS dia tena tsara amin'ny famoronana kabary amin'ny teny maro.

                        API vonona ho an'ny mpamorona
                        Ampidiro ao anatin'ny rindranasanao ny TTS.ai miaraka amin'ny API REST mifanaraka amin'ny OpenAI. Endpoint iray ho an'ny maodely 20+ rehetra. Python, JavaScript, cURL, ary Go SDKs. Fanohanana ny streaming ho an'ny rindranasa amin'ny fotoana tena izy. Fandraisana anjara amin'ny famoronana votoaty marobe. Webhooks ho an'ny fampahafantarana async. Azo ampiasaina amin'ny drafitra Pro sy Enterprise.
                    
                
            
        
    









    



    
        
        
        Fantaro bebe kokoa →
        
    










    
        Fanontaniana mipetraka matetika
        
            
                
                    
                    
                        
                            
                        
                        
                            
                                Ny Text to Speech (TTS) dia teknolojian'ny AI izay manova ny soratra voasoratra ho feo voatendry avy amin'ny natiora. mampiasa ny fianarana lalina ny modelin'ny TTS neural maoderina toy ny Kokoro, Chatterbox, ary ny CosyVoice 2 mba hamoahana ny feo maha-olona ny resaka, miaraka amin'ny fiteny, fihetseham-po, ary ny fitondràna.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Araka ny zavatra ilainao izany. Raha mila fijerena mialoha haingana, dia mampiasa ny Piper na ny MeloTTS (poana, haingana). Raha mila kalitao avo lenta, dia andramo ny Kokoro na ny CosyVoice 2 (ara-dalàna). Raha mila misintona feo, dia mampiasa ny Chatterbox na ny GPT-SoVITS (mividy). Raha mila votoaty resaka/podcast, dia andramo ny Dia TTS. Manana ny maha-izy azy ny tsirairay — andramo mba hahitana izay mety indrindra.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny! Ny TTS.ai dia manome tsipelina maimaim-poana miaraka amin'ny modely Kokoro, Piper, VITS, ary MeloTTS. Tsy mila kaonty ianao ho an'ny karazan-tsoratra hatramin'ny 500 ary taranaka 3 isan'ora. Misoratra anarana amin'ny kaonty maimaimpoana mba hahazoana karatra 15 ary hidirana amin'ireo modely rehetra.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Ny modely TTS-nay dia manohana fiteny mihoatra ny 30, anisan'izany ny teny Anglisy, Espaniola, Frantsay, Alemàna, Italiana, Portiogey, Sinoa, Japoney, Koreana, Arabo, Rosiana, Hindi, ary maro hafa.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny, azo ampiasaina amin'ny varotra ny feo namboarina tamin'ny alalan'ny TTS.ai. Mampiasà fahazoan-dàlana misokatra (MIT, Apache 2.0) ny modely rehetra. Jereo ny fahazoan-dàlana ho an'ny modely tsirairay raha mila fanazavana manokana. Mampirisika anao izahay hijery ny fahazoan-dàlana ho an'ny modely manokana ampiasainao amin'ny tetikasao.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Manaiky ny MP3, WAV, OGG, ary FLAC ny TTS.ai. Ny MP3 no lasitra ampiasaina amin'ny famakiana amin'ny tranonkala. Ny WAV no tokony ampiasaina raha te-hanaovana ny feo. Azonao ovaina ireo lamina ireo amin'ny alalan'ny fitaovana fanovàna feo.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Mampiasa ny AI ny fandikana feo mba hamoronana feo voafaritra avy amin'ny santionan'ny feo fohy (5-30 segondra amin'ny ankapobeny). Ampidiro ny fandraiketana mazava ny feon'ny tanjona, ary ny modely toy ny Chatterbox, GPT-SoVITS, na OpenVoice dia hamorona fitenenana vaovao amin'io feon'ilay feo io. Mihamafy ny kalitao amin'ny alalan'ny feon'ny rohy madio sy lava kokoa.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Afaka mamorona hatramin'ny marika 500 isaky ny fangatahana ny mpampiasa maimaimpoana. Mahazo marika 5000 isaky ny fangatahana ny mpampiasa voasoratra anarana. Raha misy lahatsoratra lava kokoa, dia aseho amin'ny ampahany ny feo ary ampifandraisina hoazy. Afaka manamboatra marika 10000 isaky ny fangatahana ny mpampiasa API.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Ny fandraisana an-tànana ny SSML (Speech Synthesis Markup Language) dia miovaova arakaraka ny modely. Ny Piper sy ny modely sasany dia mandray an-tànana ny tag SSML fototra ho an'ny fiatoana, ny fanasongadinana, ary ny fifehezana ny fehezanteny. Ho an'ny modely tsy fandraisana an-tànana ny SSML, dia azonao ampiasaina ny fanononana natoraly sy ny fiatoan-tsoratra mba hifehezana ny fiteny.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny, ny ankamaroan'ny modely dia mandray an-tànana ny fanovana ny hafainganan'ny feo eo anelanelan'ny 0.5x ka hatramin'ny 2.0x. Ny modely sasany, toy ny Bark sy ny Parler, dia mandray an-tànana ihany koa ny fifehezana ny haavo sy ny endrika. Azonao atao ny mamaritra ny famaritana ny hafainganan'ny feo ao amin'ny tontonana fandrindrana avo lenta na amin'ny alalan'ny famaritana ny hafainganan'ny API.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny, azo atao amin'ny alalan'ny API-ntsika ny fiasan'ny batch. Azonao atao ny mandefa andian-tsoratra maro amin'ny alalan'ny antso API na baiko soratra tokana, ary hovoarina sy haverina ho rakitra feo miavaka ny tsirairay. Tsara indrindra ho an'ny fizarana boky misy feo, singa fototra e-learning, na baiko soratra amin'ny takelaka kelin'ny lalao izany.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Mamorona famaha API avy amin'ny dashboard-n'ny kaontinao, avy eo mandefa fangatahana POST amin'ny endpoint-n'ny API REST miaraka amin'ny soratrao, ny modely, ary ny famaritana ny feonao. Manolotra ohatra amin'ny rindran'asa amin'ny Python, JavaScript, ary cURL izahay. Mifanaraka amin'ny OpenAI ny API, noho izany dia miasa miaraka amin'ny fanovana kely indrindra ireo fampidirana efa misy.
                            
                        
                    
                    
                
            
        
    








    
        
            
                
                
                
                
                
                
                
                
                
                
                
                
                
            
            5.0/5 (3)
        
        
            Inona no azonay atao mba hanatsarana? Manampy anay hamahana ny olana ny fihetseham-ponao.
            
                
                
                
                
            
            
                
                
            
        
    







    
        Manomboka mamadika lahabolana ho feo izao
        Miara-miasa amin'ireo mpamorona an'arivony mampiasa ny TTS.ai. Mahazo marika 15000 maimaimpoana amin'ny alalan'ny kaonty vaovao. Misy ireo modely maimaimpoana azo ampiasaina tsy mila misoratra anarana.
        
            
            Misoratra anarana maimaimpoana
            Jereo ny vidiny

Mpamorona:	Nari Labs
Lisansa:	Apache 2.0
_Hafainganana:	Medium
Kalitao:
Teny	1 fiteny
VRAM	4GB
Fandraisana an-tsoratra feo	Tsy raisina an-tànana

Modely	Mpamorona:	Taona	_Hafainganana:	Teny	VRAM	Lisansa:	Ny vidin'ny
Kokoro	Hexgrad	Free	Fast	11	1.5GB	Apache 2.0	Free	Ampiasao
Piper	Rhasspy	Free	Fast	31	0 (CPU only)	MIT	Free	Ampiasao
VITS	Jaehyeon Kim et al.	Free	Fast	4	1GB	MIT	Free	Ampiasao
MeloTTS	MyShell.ai	Free	Fast	6	0.5GB (GPU optional)	MIT	Free	Ampiasao
Bark	Suno	Standard	Slow	13	5GB	MIT	2	Ampiasao
Bark Small	Suno	Standard	Medium	13	2GB	MIT	2	Ampiasao
CosyVoice 2	Alibaba (Tongyi Lab)	Standard	Medium	8	4GB	Apache 2.0	2	Ampiasao
Dia TTS	Nari Labs	Standard	Medium	1	4GB	Apache 2.0	2	Ampiasao
Parler TTS	Hugging Face	Standard	Medium	1	4GB	Apache 2.0	2	Ampiasao
GLM-TTS	Zhipu AI	Standard	Medium	2	4GB	GLM-4 License	2	Ampiasao
IndexTTS-2	Index Team	Standard	Medium	2	4GB	Bilibili Model License	2	Ampiasao
Spark TTS	SparkAudio	Standard	Medium	2	4GB	CC BY-NC-SA 4.0	2	Ampiasao
GPT-SoVITS	RVC-Boss	Standard	Slow	4	6GB	MIT	2	Ampiasao
Orpheus	Canopy Labs	Standard	Medium	1	4GB	Llama 3.2 Community	2	Ampiasao
Chatterbox	Resemble AI	Premium	Medium	1	4GB	MIT	4	Ampiasao
Tortoise TTS	James Betker	Premium	Slow	1	8GB	Apache 2.0	4	Ampiasao
StyleTTS 2	Columbia University	Premium	Medium	1	4GB	MIT	4	Ampiasao
OpenVoice	MyShell.ai / MIT	Premium	Medium	8	4GB	MIT	4	Ampiasao
Qwen3 TTS	Alibaba (Qwen)	Standard	Medium	10	7GB	Apache 2.0	2	Ampiasao
Sesame CSM	Sesame	Premium	Slow	1	8GB	Apache 2.0	4	Ampiasao
Chatterbox Turbo	Resemble AI	Standard	Fast	1	2GB	MIT	2	Ampiasao
Zonos	Zyphra	Standard	Medium	5	6GB	Apache 2.0	2	Ampiasao
Dia 2	Nari Labs	Standard	Fast	1	4GB	Apache 2.0	2	Ampiasao
VoxCPM	OpenBMB	Standard	Fast	2	4GB	Apache 2.0	2	Ampiasao
OuteTTS	OuteAI	Free	Fast	1	2GB	Apache 2.0	Free	Ampiasao
TADA	Hume AI	Standard	Fast	1	5GB	MIT	2	Ampiasao
VibeVoice	Microsoft	Standard	Fast	2	4GB	MIT	2	Ampiasao
Pocket TTS	Kyutai	Free	Fast	2	1GB	MIT	Free	Ampiasao
Kitten TTS	KittenML	Free	Fast	1	0GB	Apache 2.0	Free	Ampiasao
CosyVoice3	Alibaba (FunAudioLLM)	Standard	Fast	9	4GB	Apache 2.0	2	Ampiasao
MOSS-TTS	OpenMOSS	Premium	Medium	19	16GB	Apache 2.0	4	Ampiasao
MegaTTS3	ByteDance	Premium	Slow	2	8GB	Apache 2.0	4	Ampiasao