Tatero kilema / fangatahana endri-javatra

Soratra mankany amin'ny feo

Manova ny lahabolana ho teny mivoaka toy ny tena izy amin'ny alalan'ny modely AI loharano misokatra. Afaka ampiasaina maimaimpoana, tsy mila kaonty.

Misoratra anarana maimaimpoana

Tsy mbola manana feo TTS amin'ny teny malagasy izahay. Ataovy izay hampidirina ny anareo! Mivarotra ny Feonao

Text
Rakitra

0/500 marika · Misoratra anarana ho an'ny 5.000 isan-taranaka →

Misoratra anarana fetra 5000 marika

Fomba SSML (Teny fanoritsoritana ny fiteny ho an'ny fifehezana tsara)

Ampidiro anatin'ny tag SSML ny lahabolana mba hahazoana fifehezana mazava tsara:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Tag Emotion / Style

Ampidiro ireo marika fihetseham-po mba hitondra fiantraikany amin'ny fandefasana (miovaova ny modely fanohanana):

Rakibolan'ny fiteny

Mamaritra ny fanononana safidy (teny = fanononana):

Haavo 0

-12 +12

Lamin'ny takila Dia: Ampiasao ny tag [S1] sy [S2] mba hamantarana mpiteny samihafa. Ohatra:

[S1] Misaotra! [S2] Misaotra, ahoana ny toe-draharaha?



                

                
                
                    
                    
                        Modelin'ny AI
                        
                    

                    
                    
                        
                            Feo
                            
                        
                        
                            
                            
                                
                                
                                
                            
                            
                        
                    
                
                

                
                
                    
                    
                        Teny
                        
                    

                    
                    
                        Lamin'ny famoahana
                        
                    

                    
                    
                        
                            Hafainganan'ny fanovana
                            1.0x
                        
                        
                        
                            0.5x
                            2.0x
                        
                    
                

                
                
                    
                    
                        
                        Malalaka miaraka amin'ny Piper, VITS, MeloTTS



        
        
            
                Hiseho eto ny feo namoronanao. Misafidiana modely iray, soraty ny lahabolana, dia tsindrio ny Mamorona.
            
            
            
                
                
                    Tsy nety ny famoronana
                    
                
            
        

            
                
                    
                        Namorona feo tsara
                        
                    
                    
                        


    
        
            
            
                
                    
                
                
            
        
    


                        
                            
                                Handefa feo
                            
                            
                                Hidina.srt
                            
                            
                            
                            Tapitra ao anatin'ny 24 ora ity rohy ity
                            
                                
                                    
                                    
                                    
                                    
                                    
                                
                            
                        
                    
                
            
        

        

    
        
            
                
                    Tianao ve ny TTS.ai? Lazao amin'ny namanao!



    
    
        
        
            
                Antsipirian'ilay modely
            
            
                
                
                    
                    Kitten TTS
                
                Free
                Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
                
                    
                        
                            Mpamorona:
                            KittenML
                        
                        
                            Lisansa:
                            Apache 2.0
                        
                        
                            Hafainganan'ny fanovana
                            
                                Fast
                            
                        
                        
                            Kalitao:
                            
                                
                            
                        
                        
                            Teny
                            1 fiteny
                        
                        
                            VRAM
                            0GB
                        
                        
                            Fandraisana an-tsoratra feo
                             Tsy raisina an-tànana
                        
                    
                
                
                
                    Toetoetra:
                    
                        
                        CPU-only inference
                        
                        Under 80MB model size
                        
                        8 built-in voices
                        
                        Speed control
                        
                        ONNX-based
                        
                        24kHz output
                        
                    
                
                
                
                Tsara indrindra ho an'ny:: 
                Fast lightweight TTS, edge deployment, low-latency applications
                
                
            
        

        
        
            
                Torohevitra ho an'ny vokatra tsara kokoa
            
            
                
                    Ampiasao ny fanononana mety amin'ny fiatoana sy ny fiteny
                    Soraty ny isa sy ny fanononana mba ho mazava kokoa ny fehezanteny
                    Hampiditra virtoaly mba hamoronana fiatoana fohy eo anelanelan'ny fehezanteny
                    Ampiasao ny ellipsis (...) raha mila fiatoana lava kokoa
                    Andramo ny Kokoro na ny CosyVoice 2 ho an'ny vokatra tena voajanahary indrindra
                    Ny Dia no ampiasaina amin'ny takila misy mpiteny maro sy ny votoaty podcast
                
            
        

        
        
            
                Fampiasàna marika
            
            
                
                    
                        
                            Taona
                            Ny vidin'ny marika 1K
                        
                    
                    
                        
                            Free
                            1:1 (tsy voafetra)
                        
                        
                            Stock label
                            Marika 2x
                        
                        
                            Premium
                            Marika 4x
                        
                    
                
            
            
                Maka marika fanampiny

Taona	Ny vidin'ny marika 1K
Free	1:1 (tsy voafetra)
Stock label	Marika 2x
Premium	Marika 4x






    
        
            
                
                
                    Mividy marika fanampiny
                    
    Tsy misy dokambarotra
    Tsy misy fetra ny fampiasana
    Fandraisana an-tànana ny laharam-pahamehana
    Fahazoana mialoha ireo endri-javatra vaovao


                
                

                
                    
                        Maka marika fanampiny






    
        Ahoana ny fomba fiasan'ny AI Text to Speech
        Mamorona feo avo lenta amin'ny dingana telo tsotra. Tsy mila fahalalana ara-teknika.
        
            
                
                    
                        
                            
                        
                        Andalana 1
                        Soraty ny lahabolana
                        Manorata, apetaho na alefa ny lahabolana tianao ovaina ho teny mivaky. Mandray an-tànana hatramin'ny marika 5000 isan-karazany ho an'ireo mpampiasa efa niditra. Ampiasao ny lahabolana tsotra na ampio tag SSML mba hifehezana ny fehezanteny, ny fiatoana, ary ny fanasongadinana.
                    
                
            
            
                
                    
                        
                            
                        
                        Andalana 2
                        Safidio ny modely sy ny feo
                        Misafidiana modely AI mihoatra ny 20 amin'ny ambaratonga telo. Misafidiana feo mifanaraka amin'ny votoatiny, misafidiana ny teny tianao ampiasaina, manova ny hafainganan'ny famakiana eo anelanelan'ny 0.5x ka hatramin'ny 2.0x, ary misafidy ny endrika famoahana tianao (MP3, WAV, OGG, na FLAC).
                    
                
            
            
                
                    
                        
                            
                        
                        Andalana 3
                        Hamorona sy hisintona
                        Tsindrio ny "Mamorona" dia ho vonona ao anatin'ny segondra vitsy ny feonao. Jereo aloha amin'ny alalan'ny mpilalao mipetaka ao anatiny, vakio amin'ny lamina safidinao, na adikao amin'ny alalan'ny rohy azo zaraina. Ampiasao ny API ho an'ny fiasan'ny batch sy ny fampidirana amin'ny fizotranao.
                    
                
            
        
    






    
        Soratra mankany amin'ny fiteny
        Manova ny fomba famoronan'ny olona, fanjifana, ary fifandraisan'izy ireo amin'ny votoaty am-peo manerana ny indostria am-polony ny lahatsoratra-ho-teny mifototra amin'ny AI.
        
            
                
                    
                        
                        Boky am-peo
                        Manova boky iray manontolo ho toy ny boky audio manana feo natoraly miaraka amin'ny fitantarana tsara kalitao. Mandray an-tànana ny mpiteny maro miaraka amin'ny Dia ho an'ny takila momba ny mpilalao.
                    
                
            
            
                
                    
                        
                        Fampidirana horonantsary
                        Mamorona feo ho an'ny YouTube, TikTok, Instagram Reels, ary ny lahatsary fohy. Feo mihoatra ny 100 na adikao ny anao manokana.
                    
                
            
            
                
                    
                        
                        Podcasts
                        Mamorona fizarana podcast avy amin'ny baiko soratra miaraka amin'ny feo AI marobe. Ampiasao ny Dia ho an'ny resadresaka amin'ny mpiteny roa.
                    
                
            
            
                
                    
                        
                        Lalao
                        Feon'ny AI ho an'ny lalao indie, tantara an-tsary, ary tantara an-tsary mifampiresaka. Dikan-teny NPC, feon'ny cutscene, fiteny mihoatra ny 30.
                    
                
            
            
                
                    
                        
                        E-Fianarana
                        Manova ireo fitaovana fianarana, lahateny, ary votoaty fanazarantena ho feo. Fandraisana an-tànana fiteny maro ho an'ny sehatra manerantany.
                    
                
            
            
                
                    
                        
                        Fahafahana miditra
                        Ataovy azo idirana ireo tranonkala, tahirin-kevitra, ary rindran'asa. Fampidirana ny API'ny mpamaky efijery ary fanovàna lahatsoratra ho feo.
                    
                
            
            
                
                    
                        
                        Rafi-pifandraisana
                        Ampitomboy ny herin'ny rafitra IVR, ny tolotra an-telefaonina, ary ny tolotra ho an'ny mpanjifa amin'ny alalan'ny feo voajanahary avy amin'ny AI.
                    
                
            
            
                
                    
                        
                        Media sosialy
                        Fitantarana ao amin'ny TikTok, Instagram Reels, fanehoan-kevitra ao amin'ny Twitter/X, lahatsary fohy YouTube.
                    
                
            
            
                
                    
                        
                        Mivezivezy
                        Fampandrenesana Twitch TTS, resadresaka amin'ny feo, AI mpiara-mikarakara, ary robot Discord. Tsy misy fiatoana, feo mihoatra ny 100, mifanaraka amin'ny StreamElements.
                    
                
            
            
                
                    
                        
                        Fivarotana
                        Fanehoan-kevitra amin'ny dokambarotra, lahatsary fanazavana, fampisehoana ny vokatra, ary fampisehoana ny varotra.
                    
                
            
            
                
                    
                        
                        Fandraiketana & Fiteny
                        Dikan-teny sy fandikana lahatsary amin'ny teny mihoatra ny 30 miaraka amin'ny AI mifanaraka amin'ny feo.
                    
                
            
            
                
                    
                        
                        Fieritreretana & Fahasalamana
                        Fieritreretana mitarika, tantaran'ny torimaso, fanazaran-tena amin'ny fiasan'ny rivotra, ary fanamarinana amin'ny feo AI milamina sy mandrehitra fo.
                    
                
            
        
        
            Jereo daholo ireo tranga sy fitaovana ampiasana
        
    






    
        Ireo modelin'ny fandikana lahabolana rehetra
        Famaritana amin'ny antsipiriany ho an'ny modely AI rehetra hita ao amin'ny TTS.ai. Ampitahao ny kalitao, ny hafainganam-pandeha, ny fanohanana ny teny, ary ny endri-javatra mba hahitana ny modely mety indrindra ho an'ny tetikasao.

        
        
            Ny rehetra (32)
            Free (9)
            Stock label (18)
            Premium (5)
        

        
            
            
                
                    
                    
                        
                            
                                Kokoro
                                Free
                            
                            
                                Kokoro dia modely 82 tapitrisa amin'ny famaritana ny soratra ho teny izay misongadina tsara noho ny lanjany. Na dia kely aza ny habeny, dia mamorona teny tena natiora sy maneho hevitra izy. Manohana fiteny marobe ny Kokoro, anisan'izany ny teny Anglisy, Japoney, Shinoa, ary Koreana miaraka amin'ny feo marobe maneho hevitra. Mandroso haingana dia haingana izy — mamorona feo haingana 100 heny noho ny fotoana tena izy amin'ny GPU.

                                
                                    
                                        Mpamorona::

                                        Hexgrad
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, ja, zh, fr, it, pt, es, hi
                                    
                                    
                                        VRAM:

                                        1.5GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Mpizahaky ny macro
                                        
                                        Tena haingana
                                        
                                        Feon'ny fitenenana
                                        
                                        Teny maro
                                        
                                        Fandraisana an-tànana streaming
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa streaming TTS avo lenta miaraka amin'ny fotoana fiatoana kely indrindra
                                
                            
                            
                                
                                    Andramo Kokoro
                                
                            
                        
                    
                    
                    
                        
                            
                                Piper
                                Free
                            
                            
                                Ny Piper dia milina madinika iray hanova ny soratra ho teny namboarin'ny Rhasspy izay mampiasa ny VITS sy ny larynx architecture. Miasa tanteraka amin'ny CPU izy, ka mahatonga azy ho tsara indrindra ho an'ny fitaovana eny amin'ny sisiny, ny fanaraha-maso ny trano, ary ny rindran'asa mila TTS tsy misy fifandraisana. Miaraka amin'ny feo maherin'ny 100 amin'ny teny 30+ ny Piper, manome feo voajanahary amin'ny fiteny amin'ny hafainganam-pandeha tena izy na dia amin'ny Raspberry Pi 4 aza.

                                
                                    
                                        Mpamorona::

                                        Rhasspy
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, de, fr, es, it, pt, nl, pl, ru, zh, ar, cs, da, fi, el, hu, is, ka, kk, ne, no, ro, sk, sr, sv, sw, tr, uk, vi
                                    
                                    
                                        VRAM:

                                        0 (CPU only)
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        CPU-friendly
                                        
                                        Azo ampiasaina tsy misy fifandraisana
                                        
                                        Feo mihoatra ny 100
                                        
                                        Teny mihoatra ny 30
                                        
                                        Fandraisana an-tànana SSML
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Topy maso haingana, fidirana mora, ary rindran'asa tafiditra
                                
                            
                            
                                
                                    Andramo Piper
                                
                            
                        
                    
                    
                    
                        
                            
                                VITS
                                Free
                            
                            
                                Ny VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) dia fomba TTS mifamatotra miainga avy amin'ny farany ka hatrany amin'ny farany izay mamorona feo miafina miavaka kokoa noho ny modely roa dingana ankehitriny. Mandray ny fiheverana miovaova ampitomboina amin'ny fikorianan'ny normalization sy ny fizotry ny fanazaran-tena mifanohitra izy, ary mahazo fanatsarana goavana amin'ny natiora.

                                
                                    
                                        Mpamorona::

                                        Jaehyeon Kim et al.
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, de, es, fr, pt, nl, fi, hu, bg, uk, pl
                                    
                                    
                                        VRAM:

                                        1GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Famaritana feno
                                        
                                        Fiteny natoraly
                                        
                                        Famaritana haingana
                                        
                                        Mpiteny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Soratra mankany amin'ny fitenenana amin'ny fomba tsotra
                                
                            
                            
                                
                                    Andramo VITS
                                
                            
                        
                    
                    
                    
                        
                            
                                MeloTTS
                                Free
                            
                            
                                Ny MeloTTS avy amin'ny MyShell.ai dia tranomboky TTS maro teny izay manohana ny teny Anglisy (Amerikana, Britanika, Indiana, Aostraliana), Espaniola, Frantsay, Shinoa, Japoney, ary Koreana. Tena haingana dia haingana izy io, mandray andraikitra amin'ny teny amin'ny hafainganam-pandeha mitovy amin'ny fotoana tena izy amin'ny CPU ihany. Ny MeloTTS dia natao ho an'ny fampiasana amin'ny famokarana ary manohana ny CPU sy ny GPU.

                                
                                    
                                        Mpamorona::

                                        MyShell.ai
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, es, fr, zh, ja, ko
                                    
                                    
                                        VRAM:

                                        0.5GB (GPU optional)
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Miaraka amin'ny CPU tsara indrindra
                                        
                                        Teny maro
                                        
                                        Fiteny maro
                                        
                                        Vonona ny famokarana
                                        
                                        Latency ambany
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa famokarana mila TTS haingana, maro fiteny
                                
                            
                            
                                
                                    Andramo MeloTTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Bark
                                Standard
                            
                            
                                Ny Bark avy amin'ny Suno dia modely fanovana lahatsoratra ho feo mifototra amin'ny mpanova izay afaka mamorona teny marobe tena marina sy feo hafa toy ny mozika, ny feo ambadiky ny feo, ary ny vokatry ny feo. Afaka mamorona fifandraisana tsy amin'ny teny toy ny hihomehezana, ny fikorontanana, ary ny mitomany izy io. Manohana mpiteny efa voafaritra mialoha mihoatra ny 100 sy fiteny mihoatra ny 13 ny Bark.

                                
                                    
                                        Mpamorona::

                                        Suno
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    
                                    
                                        VRAM:

                                        5GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Efekty feo
                                        
                                        Mihomehy/mirenireny
                                        
                                        Famoronana mozika
                                        
                                        Mpiteny 100+
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                votoaty feo mamorona, boky feo misy fihetseham-po, vokatry ny feo
                                
                            
                            
                                
                                    Andramo Bark
                                
                            
                        
                    
                    
                    
                        
                            
                                Bark Small
                                Standard
                            
                            
                                Ny Bark Small dia endrika namboarina tamin'ny maodelin'ny Bark izay mivarotra ny kalitaon'ny feo ho an'ny hafainganam-pandehan'ny fiheverana haingana kokoa sy ny filàna arika ambany kokoa. Mitahiry ny fahaizan'ny Bark hamorona resaka miaraka amin'ny fihetseham-po, ny hihomehezana, ary ny fiteny maro izy.

                                
                                    
                                        Mpamorona::

                                        Suno
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    
                                    
                                        VRAM:

                                        2GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Maivana
                                        
                                        Haingana kokoa noho ny Bark feno
                                        
                                        Fiteny mampihetsi-po
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Feo mamorona haingana rehefa mavesatra loatra ny feo feno
                                
                            
                            
                                
                                    Andramo Bark Small
                                
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice 2
                                Standard
                            
                            
                                Ny CosyVoice 2 avy amin'ny Tongyi Lab ao Alibaba dia manana kalitaon'ny feo mitovy amin'ny an'ny olombelona nefa manana fotoana fiatoana ambany indrindra, ka mahatonga azy io ho tsara indrindra ho an'ny fampiharana amin'ny fotoana tena izy. mampiasa fomba fiasa finite scalar quantumization izy io ho an'ny fampifangaroana mivantana ary manohana ny famoronana feo tsy misy fipoahana, fampifangaroana teny maro, ary ny fifehezana ny fihetseham-po amin'ny fomba tsara. mahatratra ny fahaizany ny rafitra TTS marobe amin'ny tsena amin'ny fanadihadiana ny tena.

                                
                                    
                                        Mpamorona::

                                        Alibaba (Tongyi Lab)
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, fr, de, it, es
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Mivezivezy
                                        
                                        Zero-shot clone
                                        
                                        Fiteny marobe
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Human-parity
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa amin'ny fotoana tena izy, streaming TTS, mpanampy amin'ny feo
                                
                            
                            
                                
                                    Andramo CosyVoice 2
                                
                            
                        
                    
                    
                    
                        
                            
                                Dia TTS
                                Standard
                            
                            
                                Ny Dia avy amin'ny Nari Labs dia modely 1.6B soratra-ho-teny natao manokana ho an'ny famoronana adihevitra maro mpiteny. Afaka mamorona resaka miafina eo amin'ny mpiteny roa miaraka amin'ny fihodinan'ny fotoana, ny fiteny, ary ny fiteny ara-pihetseham-po izy. Ny Dia dia mety tsara amin'ny famoronana votoaty tahaka ny podcast, adihevitra amin'ny boky audio, ary AI mifampiresaka.

                                
                                    
                                        Mpamorona::

                                        Nari Labs
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Mpiteny maro
                                        
                                        Famoronana takila
                                        
                                        Fihodinan-dàlana voajanahary
                                        
                                        Fiteny maneho fihetseham-po
                                        
                                        Mpizahaky ny fanatanterahana
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Podcasts, fifanakalozan-kevitra amin'ny boky am-peo, votoaty resaka
                                
                            
                            
                                
                                    Andramo Dia TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Parler TTS
                                Standard
                            
                            
                                Ny Parler TTS dia modely fandikana lahabolana ho teny izay mampiasa ny famaritana feo avy amin'ny teny natoraly mba hifehezana ny kabary azo. Raha tsy misafidy avy amin'ireo feo efa voafaritra mialoha ianao, dia mamaritra ny feo tianao (ohatra, "feo vehivavy mafana manana feo Britanika kely, miteny milamina sy mazava") ary ny Parler dia mamorona ny kabary mifanaraka amin'io famaritana io. Izany no mahatonga azy ho sarotra ampiasaina amin'ny rindranasa famoronana.

                                
                                    
                                        Mpamorona::

                                        Hugging Face
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fanoritsoritana ny feo
                                        
                                        Fifehezana ny fiteny voajanahary
                                        
                                        Famoronana feo azo ovaina
                                        
                                        Tsy mila feo voafaritra mialoha
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindran'asa famoronana izay mila safidy manokana momba ny feo ianao
                                
                            
                            
                                
                                    Andramo Parler TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                GLM-TTS
                                Standard
                            
                            
                                Ny GLM-TTS avy amin'ny Zhipu AI dia rafitra fandikana teny ho teny mivantana, natsangana tamin'ny fomba fanamboarana Llama miaraka amin'ny fifandanjana miverimberina. Manana ny tahan'ny hadisoana amin'ny marika ambany indrindra amin'ireo maodely TTS misokatra izy, izay midika fa manome ny fehezanteny marina indrindra. Ny GLM-TTS dia manohana ny teny Anglisy sy ny teny Sinoa miaraka amin'ny fandikana feo avy amin'ny santionan-teny 3-10 segondra.

                                
                                    
                                        Mpamorona::

                                        Zhipu AI
                                    
                                    
                                        Lisansa::

                                        GLM-4 License
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Isan'ny tsy fetezana ambany indrindra
                                        
                                        Fandraisana feo
                                        
                                        Fitoviana amin'ny fivoahana
                                        
                                        Fiteny natoraly
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Rindranasa mitaky ny fahafenoan'ny fehezanteny
                                
                            
                            
                                
                                    Andramo GLM-TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                IndexTTS-2
                                Standard
                            
                            
                                IndexTTS-2 dia rafitra fanovana lahatsoratra ho teny mivantana izay miavaka amin'ny famoronana feo tsy misy fipoahana miaraka amin'ny fifehezana ny fihetseham-po tsara. Afaka mamorona teny amin'ny feo misy fihetseham-po manokana toy ny faly, malahelo, tezitra, na matahotra izy io, tsy mila angon-drakitra fanazarantena manokana momba ny fihetseham-po. Mampiasa ny vector fihetseham-po ny modely mba hifehezana amin'ny fomba mazava ny fisehoan'ny fihetseham-po amin'ny teny novokarina.

                                
                                    
                                        Mpamorona::

                                        Index Team
                                    
                                    
                                        Lisansa::

                                        Bilibili Model License
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Zero-shot
                                        
                                        Vektorin'ny fihetseham-po
                                        
                                        Fitenenana maneho hevitra
                                        
                                        Fifehezana madinika
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Vohikala maneho fihetseham-po, boky am-peo, mpanampy virtoaly
                                
                            
                            
                                
                                    Andramo IndexTTS-2
                                
                            
                        
                    
                    
                    
                        
                            
                                Spark TTS
                                Standard
                            
                            
                                Ny Spark TTS avy amin'ny SparkAudio dia maodelin'ny soratra mankany amin'ny fitenenana izay mampifangaro ny fandikana feo miaraka amin'ny fihetseham-po azo fehezina sy ny fomba fitenenana. Amin'ny fampiasana feon-kira 5 segondra monja, afaka manitatra feo iray izy ary avy eo mamorona fitenenana miaraka amin'ny fihetseham-po, hafainganam-pandeha ary fomba fiteny samihafa raha mbola mitazona ny maha-izy azy ny feon'ny fandikana. Mampiasa rafitra fifehezana mifototra amin'ny fanontaniana ny Spark TTS.

                                
                                    
                                        Mpamorona::

                                        SparkAudio
                                    
                                    
                                        Lisansa::

                                        CC BY-NC-SA 4.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana feo
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fitantanana ny endri-tsoratra
                                        
                                        Mifototra amin'ny fanontaniana
                                        
                                        Fandraisana 5 segondra
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Famoronana votoaty amin'ny alalan'ny feo namboarina sy ny fifehezana ny fihetseham-po
                                
                            
                            
                                
                                    Andramo Spark TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                GPT-SoVITS
                                Standard
                            
                            
                                Mitambatra amin'ny modelin'ny teny GPT sy ny SoVITS (Singing Voice Inference via Translation and Synthesis) ny GPT-SoVITS mba hahazoana fanangonana feo mahomby. Amin'ny feon-kira 5 segondra monja, afaka mamorona feo sy mamorona kabary vaovao izy ary mitahiry ny toetra tokana an'ilay mpiteny. Tena tsara amin'ny fanangonana feo amin'ny fitenenana sy ny fihira izy.

                                
                                    
                                        Mpamorona::

                                        RVC-Boss
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko
                                    
                                    
                                        VRAM:

                                        6GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana 5 segondra
                                        
                                        Feon'ny hira
                                        
                                        Fianarana amin'ny alalan'ny sary vitsy
                                        
                                        High fidelity
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana feo, famoronana hira, famoronana feo ho an'ny mpamokatra votoaty
                                
                            
                            
                                
                                    Andramo GPT-SoVITS
                                
                            
                        
                    
                    
                    
                        
                            
                                Orpheus
                                Standard
                            
                            
                                Ny Orpheus dia maodelin'ny soratra mankany amin'ny fitenenana amin'ny ambaratonga lehibe izay mahatratra ny fanehoana fihetseham-po amin'ny ambaratongan'ny olombelona. Nahazo fiofanana tamin'ny angon-drakitra fitenenana isan-karazany maherin'ny 100.000 ora izy, ary misongadina amin'ny famoronana fitenenana miaraka amin'ny fihetseham-po voajanahary, ny fanamafisana, ary ny fomba fiteny. Afaka mamorona fitenenana izay tsy azo lazaina ho hafa noho ny fandraketana nataon'ny olona ny Orpheus.

                                
                                    
                                        Mpamorona::

                                        Canopy Labs
                                    
                                    
                                        Lisansa::

                                        Llama 3.2 Community
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fihetseham-po amin'ny ambaratonga olombelona
                                        
                                        100K ora fiofanana
                                        
                                        Fanasongadinana rarin-teny
                                        
                                        Fitenenana maneho hevitra
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fitenenana feno fihetseham-po avo lenta, boky am-peo, fitenenana amin'ny feo
                                
                            
                            
                                
                                    Andramo Orpheus
                                
                            
                        
                    
                    
                    
                        
                            
                                Chatterbox
                                Premium
                            
                            
                                Ny Chatterbox avy amin'ny Resemble AI dia fitaovana fanandramana fanandramana tsy misy fipoahana. Afaka mamorona feo avy amin'ny santionan-kira iray izy io, ary tsy ny feo ihany no azony, fa ny fomba fiteny sy ny fihetseham-po ihany koa. Manana ny fahaizana mifehy ny fihetseham-po tsara indrindra ihany koa ny Chatterbox, izay ahafahanao manova ny feo miteraka fihetseham-po tsy miankina amin'ny maha-izy ny feo.

                                
                                    
                                        Mpamorona::

                                        Resemble AI
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana sary tsy misy fipoahana
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        High fidelity
                                        
                                        Fandefasana endrika
                                        
                                        Fandraisana santionany tokana
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana feo amin'ny fomba matihanina miaraka amin'ny fifehezana ny fihetseham-po, famoronana votoaty
                                
                            
                            
                                
                                    Andramo Chatterbox
                                
                            
                        
                    
                    
                    
                        
                            
                                Tortoise TTS
                                Premium
                            
                            
                                Ny Tortoise TTS dia rafitra fandikana teny ho feo marobe miverina amin'ny laoniny izay manome lanja ny kalitaon'ny feo fa tsy ny hafainganan'ny feo. Mampiasà rafitra nalaina avy amin'ny DALL-E izy mba hamoronana teny tena natioraly miaraka amin'ny fiteny tsara sy ny fitoviana amin'ny mpiteny. Raha mihazakazaka kokoa noho ny safidy maro hafa ny Tortoise, dia mamorona ny sasany amin'ireo teny nalaina avy amin'ny teny tena izy indrindra izay hita ao amin'ny tontolon'ny loharano misokatra.

                                
                                    
                                        Mpamorona::

                                        James Betker
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        8GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Haavo ambony indrindra
                                        
                                        Feo maro
                                        
                                        Famolavolana DALL-E
                                        
                                        Fandraisana feo
                                        
                                        Miverina hoazy
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Boky am-peo, votoaty premium, rindrambaiko tsara kalitao
                                
                            
                            
                                
                                    Andramo Tortoise TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                StyleTTS 2
                                Premium
                            
                            
                                Ny StyleTTS 2 dia mahavita ny fitambarana TTS amin'ny ambaratongan'ny olombelona amin'ny alàlan'ny fampifangaroana ny fiparitahan'ny endrika amin'ny fanazarantena mifanohitra amin'ny fampiasana ny maodelin'ny fiteny be fiteny. Mamorona ny fitenenana izay miteny toy ny tena izy indrindra izy eo amin'ny maodelin'ny mpiteny iray, mifaninana amin'ny fandraketana ny olona. Mampiasa ny maodelin'ny endrika mifototra amin'ny fiparitahana ny StyleTTS 2 mba haka ny fiovan'ny fiteny rehetra.

                                
                                    
                                        Mpamorona::

                                        Columbia University
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Human-level
                                        
                                        Endrika fampielezana
                                        
                                        Fanazaran-tena miady
                                        
                                        Fiovana voajanahary
                                        
                                        High fidelity
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Famaritana ny feo amin'ny mpiteny tokana, fitantarana matihanina
                                
                            
                            
                                
                                    Andramo StyleTTS 2
                                
                            
                        
                    
                    
                    
                        
                            
                                OpenVoice
                                Premium
                            
                            
                                Ny OpenVoice avy amin'ny MyShell.ai dia mamela ny fandikana feo avy hatrany miaraka amin'ny fifehezana ny fomba fiteny, ny fihetseham-po, ny fiteny, ny fiteny, ny fiatoana, ary ny fiteny. Afaka manitatra feo avy amin'ny horonantsary fohy izy ary mamorona kabary amin'ny teny maro nefa tsy manala ny maha-izy ny mpiteny. Miasa toy ny mpanova feo ihany koa ny OpenVoice, izay mamela ny fanovana feo amin'ny fotoana tena izy.

                                
                                    
                                        Mpamorona::

                                        MyShell.ai / MIT
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, fr, es
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Famoronana dika mitovy avy hatrany
                                        
                                        Fanovana feo
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fifehezana ny fanasongadinana rarinteny
                                        
                                        Teny maro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana an-tsoratra feo miaraka amin'ny fifehezana ny endri-tsoratra, fanovàna feo
                                
                            
                            
                                
                                    Andramo OpenVoice
                                
                            
                        
                    
                    
                    
                        
                            
                                Qwen3 TTS
                                Standard
                            
                            
                                Qwen3-TTS dia maodely 1.7 miliara parameters text-to-speech avy amin'ny ekipa Qwen ao amin'ny Alibaba. Manaiky fomba telo izy: feo efa voafaritra mialoha miaraka amin'ny fifehezana ny fihetseham-po (mpiteny 9), fandikana feo avy amin'ny 3 segondra monja amin'ny feo, ary fomba iray manokana amin'ny famolavolana feo izay ahafahanao mamaritra ny feo tianao amin'ny teny natoraly.

                                
                                    
                                        Mpamorona::

                                        Alibaba (Qwen)
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, de, fr, ru, pt, es, it
                                    
                                    
                                        VRAM:

                                        7GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana feo
                                        
                                        Feo 9 efa voafaritra
                                        
                                        Famolavolana feo avy amin'ny lahabolana
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Teny 10
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Mpiaty maro teny miaraka amin'ny fandikana feo na famolavolana feo safidy
                                
                            
                            
                                
                                    Andramo Qwen3 TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Sesame CSM
                                Premium
                            
                            
                                Ny Sesame CSM (Conversational Speech Model) dia maodely misy singa 1 miliara namboarina manokana ho an'ny famoronana resadresaka. Izy io dia mamolavola ny endrika natioran'ny resadresaka ataon'ny olombelona, anisan'izany ny fotoana fandraisana anjara, ny valin'ny backchannel, ny fihetseham-po, ary ny fivoahan'ny resadresaka. Ny CSM dia mamorona feo mitovy amin'ny resadresaka natioran'ny olombelona fa tsy ny resadresaka artifisialy.

                                
                                    
                                        Mpamorona::

                                        Sesame
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Slow
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        8GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        4x
                                    
                                

                                
                                
                                    
                                        
                                        Fifampiresaka
                                        
                                        Fotoana voajanahary
                                        
                                        Miova toerana
                                        
                                        Backchannel
                                        
                                        Mpizahaky ny macro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                AI assistants, chatbots, rindrambaiko AI resaka
                                
                            
                            
                                
                                    Andramo Sesame CSM
                                
                            
                        
                    
                    
                    
                        
                            
                                Chatterbox Turbo
                                Standard
                            
                            
                                Ny Chatterbox Turbo avy amin'ny Resemble AI dia fanatsarana ny Chatterbox amin'ny alalan'ny fanatsarana ny paramita 350M, izay manome hafainganam-pandeha 6x amin'ny fotoana tena izy miaraka amin'ny fotoana fiatoana latsaky ny 200ms. Manaiky ireo tag paralinguistic toy ny [riaka], [kohaka], ary [mihomehy] mivantana ao anatin'ny lahatsoratra izy io. Ahitana ny marika rano Perth amin'ny feo rehetra navoaka mba hanaraha-maso ny fiaviany.

                                
                                    
                                        Mpamorona::

                                        Resemble AI
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        2GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Latency ambany noho ny 200ms
                                        
                                        Tag Paralinguistic
                                        
                                        Fotoana tena izy 6x
                                        
                                        Fandraisana feo
                                        
                                        Famantarana ranomainty
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Mpikirakira feo amin'ny fotoana tena izy, fitenenana maneho hevitra miaraka amin'ny feo voajanahary
                                
                            
                            
                                
                                    Andramo Chatterbox Turbo
                                
                            
                        
                    
                    
                    
                        
                            
                                VoxCPM
                                Standard
                            
                            
                                VoxCPM 1.5 avy amin'ny OpenBMB dia maodely TTS vaovao tsy misy tokenizer izay miasa amin'ny toerana mitohy fa tsy amin'ny tokens miavaka. Mamorona feo 44.1kHz tena marina izy, mandray an-tànana ny fandikana feo tsy misy fipoahana mandritra ny 3-10 segondra, ary mitazona ny fitoviana amin'ny andininy. Ny fandikana teny mifamatotra dia mamela anao hampiasa feo Anglisy amin'ny fitenenana Shinoa ary ny mifamatotra amin'izany.

                                
                                    
                                        Mpamorona::

                                        OpenBMB
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Audio 44.1kHz
                                        
                                        Tokenizer-free
                                        
                                        Fandraisana an-tsokosoko ny fiteny maro
                                        
                                        Fanaraha-maso ny seho
                                        
                                        Fanatsarana ny LoRA
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Feo avo lenta, boky am-peo, votoaty lavabe miaraka amin'ny feo mitovy
                                
                            
                            
                                
                                    Andramo VoxCPM
                                
                            
                        
                    
                    
                    
                        
                            
                                Kani TTS 2
                                Free
                            
                            
                                Kani-TTS-2 avy amin'i NineNineSix dia modely ultra-lehibe 400M namboarina tamin'ny Liquid AI LFM2 backbone miaraka amin'ny NVIDIA NanoCodec. Miasa amin'ny 3GB VRAM fotsiny izy ary mamorona ~10 segondra amin'ny fitenenana ao anatin'ny ~2 segondra amin'ny A100 (RTF 0.2). Ny famoahana ho an'ny daholobe ankehitriny dia mitondra ny `kani-tts-2-en` amin'ny teny Anglisy ihany ary tsy mampiseho ny hook-embedding-speaker ilaina amin'ny fandikana feo — mampiasa ny Chatterbox / IndexTTS2 / F5-TTS ho an'ny fandikana, na ny Kokoro / MeloTTS ho an'ny tsy Anglisy.

                                
                                    
                                        Mpamorona::

                                        NineNineSix
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        3GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        3GB VRAM
                                        
                                        Tena haingana
                                        
                                        Maivana
                                        
                                        NanoCodec
                                        
                                        Free
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Famoronana teny anglisy haingana amin'ny fitaovana VRAM ambany, fijerena mialoha haingana
                                
                            
                            
                                
                                    Andramo Kani TTS 2
                                
                            
                        
                    
                    
                    
                        
                            
                                OuteTTS
                                Free
                            
                            
                                Manatsara ny modelin'ny teny lehibe miaraka amin'ny fahaizana manova lahatsoratra ho feo ny OuteTTS, nefa mitahiry ny endrika voalohany. Manaiky backend maro izy, anisan'izany ny llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ary na ny fidirana amin'ny alalan'ny mpitety tranonkala amin'ny alalan'ny Transformers.js aza. Manana ny fahaizana manaisotra feo tsy misy fipoahana amin'ny alalan'ny profil'ny mpiteny voatahiry amin'ny JSON.

                                
                                    
                                        Mpamorona::

                                        OuteAI
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        2GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Fivoahan'ny CPU
                                        
                                        Fivoahan'ny mpitety
                                        
                                        Fandraisana feo
                                        
                                        Backend maro
                                        
                                        Profiln'ny mpandahateny
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fampidirana ny sisiny, TTS mifototra amin'ny mpitety tranonkala, tontolo tsy dia be loharano
                                
                            
                            
                                
                                    Andramo OuteTTS
                                
                            
                        
                    
                    
                    
                        
                            
                                VibeVoice
                                Standard
                            
                            
                                Ny VibeVoice avy amin'ny Microsoft dia misy karazana roa: ny 1.5B ho an'ny votoaty lava (hatramin'ny 90 minitra, mpiteny 4) ary ny Realtime 0.5B ho an'ny streaming miaraka amin'ny fotoana fiatoana amin'ny feo voalohany ~200ms. Ny 1.5B dia tsara amin'ny podcasts sy ny boky amin'ny feo miaraka amin'ny fitoniana amin'ny mpiteny mandritra ny fehezanteny lava. Fanamarihana: Naesorin'ny Microsoft ny kaody TTS avy ao amin'ny tahiry ary ny feo navoaka dia ahitana ny fanehoan-kevitra avy amin'ny AI.

                                
                                    
                                        Mpamorona::

                                        Microsoft
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Mpitondra feo maro
                                        
                                        90 minitra
                                        
                                        Famoronana podcast
                                        
                                        Fifanarahana amin'ny mpandahateny
                                        
                                        200ms stream
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Podcasts, boky am-peo, votoaty lavabe maro mpiteny
                                
                            
                            
                                
                                    Andramo VibeVoice
                                
                            
                        
                    
                    
                    
                        
                            
                                Pocket TTS
                                Free
                            
                            
                                Ny Pocket TTS avy amin'i Kyutai (mpamorona ny Moshi) dia maodely soratra-ho-teny 100M manana paramètre kely izay mahatratra mihoatra ny lanjany. Miasa tsara amin'ny CPU izy, manohana ny fanitarana feo tsy misy fipoahana avy amin'ny santionan-teny tokana, ary mamorona feo voajanahary. Ny haben'ny maodely kely dia mahatonga azy ho mety amin'ny fampidirana eny amin'ny sisiny sy ny tontolo iainana tsy dia manana loharanom-pahalalana be loatra.

                                
                                    
                                        Mpamorona::

                                        Kyutai
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, fr
                                    
                                    
                                        VRAM:

                                        1GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Mpizahaky ny macro
                                        
                                        Fivoahan'ny CPU
                                        
                                        Fandraisana feo
                                        
                                        Fandraisana santionany tokana
                                        
                                        Vonona ny zoro
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fampidirana mora, tontolo CPU fotsiny, fandikana feo haingana
                                
                            
                            
                                
                                    Andramo Pocket TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Kitten TTS
                                Free
                            
                            
                                Kitten TTS avy amin'ny KittenML dia modely tsotra indrindra amin'ny fandikana teny ho teny, namboarina tamin'ny ONNX. Miaraka amin'ny safidy 15M ka hatramin'ny 80M (25-80 MB amin'ny kapila), manome fanehoana feo avo lenta amin'ny CPU izy io, tsy mila GPU. Manana feo 8 mipetaka ao anatiny, hafainganan'ny fitenenana azo ovaina, ary fanoratana mialoha ny teny ho an'ny isa, vola, ary ny isa. Tsara indrindra ho an'ny fampidirana eny amin'ny sisiny sy ny rindran'asa tsy dia misy fotoana ela.

                                
                                    
                                        Mpamorona::

                                        KittenML
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en
                                    
                                    
                                        VRAM:

                                        0GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Tsia
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        CPU-only inference
                                        
                                        Haben'ny modely ambanin'ny 80MB
                                        
                                        Feo 8 mipetaka
                                        
                                        Fifehezana ny hafainganan'ny
                                        
                                        Mifototra amin'ny ONNX
                                        
                                        Famoahana 24kHz
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                TTS haingana sy maivana, fampidirana eny amin'ny sisiny, rindranasa tsy misy fiatoana
                                
                            
                            
                                
                                    Andramo Kitten TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice3
                                Standard
                            
                            
                                Ny CosyVoice3 no fivoaran'ny ekipa FunAudioLLM ao amin'ny Alibaba. Manana ny fidirana amin'ny fidirana roa miaraka amin'ny fotoana fiatoana ~150ms, ny fifehezana ny fihetseham-po/fahavitrihana/fahabetsahana mifototra amin'ny baiko, ary ny fitoviana amin'ny mpiteny tsaratsara kokoa ho an'ny fanodinana tsy misy fipoahana izy. Manaiky teny 9 ary fiteny sinoa 18. Ny RL-tuned dia manome ny fomba fiteny farany indrindra.

                                
                                    
                                        Mpamorona::

                                        Alibaba (FunAudioLLM)
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Fast
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh, ja, ko, de, es, fr, it, ru
                                    
                                    
                                        VRAM:

                                        4GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fidirana roa
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fandraisana feo
                                        
                                        Fifehezana ny hafainganan'ny/fiteny
                                        
                                        Fampianarana manaraka
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Famokarana TTS amin'ny fiteny maro, rindran'asa amin'ny fotoana tena izy, fandikana feo
                                
                            
                            
                                
                                    Andramo CosyVoice3
                                
                            
                        
                    
                    
                    
                        
                            
                                NAMAA Saudi TTS
                                Standard
                            
                            
                                NAMAA Saudi TTS is a Saudi Arabic fine-tune of Resemble AI's ChatterboxMultilingual. Trained by NAMAA Space on authentic Saudi-dialect speech, it produces natural Modern Standard Arabic and Saudi colloquial pronunciation that generic multilingual models cannot match. Inherits Chatterbox's zero-shot voice cloning and emotion control via reference audio prompts. The first open-weights Arabic TTS deployed on TTS.ai.

                                
                                    
                                        Mpamorona::

                                        NAMAA Space
                                    
                                    
                                        Lisansa::

                                        MIT
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        ar
                                    
                                    
                                        VRAM:

                                        6GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Teny Arabo Saodiana
                                        
                                        Arabo tsotra maoderina
                                        
                                        Fandraisana feo tsy misy fipoahana
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fiteny malagasy
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Votoaty Arabo ho an'ny mpihaino Saodiana, fitantarana MSA, mpitondra feo amin'ny fiteny Khaleeji, boky amin'ny feo Arabo
                                
                            
                            
                                
                                    Andramo NAMAA Saudi TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                Darwin TTS
                                Standard
                            
                            
                                Ny Darwin-TTS-1.7B-Cross avy amin'ny FINAL-Bench dia karazana fikarohana iray amin'ny Qwen3-TTS-1.7B izay misy tensors 84 talker-FFN (8.6%) mifamatotra amin'ny α=3% amin'ireo tensors mifanaraka amin'ny Qwen3-1.7B-Base. Ny fitambarana dia natsangana tsy misy fanazarantena indray ary miteraka fiteny marobe mifampitohy amin'ny fiteny Koreana, Anglisy, Japoney ary Shinoa. Miasa amin'ny fomba fiteny tsy misy fipoahana (3 segondra amin'ny feo fototra).

                                
                                    
                                        Mpamorona::

                                        FINAL-Bench
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, ko, ja, zh
                                    
                                    
                                        VRAM:

                                        7GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fandraisana feo
                                        
                                        Teny maro
                                        
                                        FFN-mitambatra
                                        
                                        Teny 4 fototra
                                        
                                        Qwen3 backbone
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fandraisana an-tsokosoko ny feo amin'ny teny marobe amin'ny teny Anglisy / Koreana / Japoney / Sinoa amin'ny alalan'ny feo tokana
                                
                            
                            
                                
                                    Andramo Darwin TTS
                                
                            
                        
                    
                    
                    
                        
                            
                                MOSS-TTSD
                                Standard
                            
                            
                                MOSS-TTSD v1.0 avy amin'ny OpenMOSS dia modely 7B an'ny fifanakalozan-kevitra soratra ho teny izay manohy ny resaka avy amin'ny fanontaniana fohy amin'ny feo. Manaiky mpiteny 5 mifampiresaka amin'ny alalan'ny [S1]/[S2] tags, ny fandikana feo tsy misy fipoahana avy amin'ny feo 3-10s, ary ny fifanakalozan-kevitra mifampitohy miovaova hatramin'ny 60 minitra amin'ny teny 20. Tsy mitovy amin'ny MOSS-TTS — ny TTSD dia manokana amin'ny podcast/boky feo/fifampizarana feo.

                                
                                    
                                        Mpamorona::

                                        OpenMOSS
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        12GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        2x
                                    
                                

                                
                                
                                    
                                        
                                        Fifampiresaka maro mpiteny
                                        
                                        Mpandefa hatramin'ny 5
                                        
                                        Audio 60min coherent
                                        
                                        Fandraisana feo
                                        
                                        Fanatsarana ny podcast
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Podcasts, boky am-peo, adihevitra nalaina tamin'ny teny anglisy, votoaty resaka amin'ny feo maro
                                
                            
                            
                                
                                    Andramo MOSS-TTSD
                                
                            
                        
                    
                    
                    
                        
                            
                                Ming-Omni TTS
                                Free
                            
                            
                                Ming-omni-tts-0.5B avy amin'ny inclusionAI dia maodely fiteny omni-modal kely namboarina tamin'ny BailingMM, miaraka amin'ny decoder audio Patch-by-Patch mifanaraka amin'ny fikorianan'ny rano. Manolotra 44.1kHz (eo akaikin'ny kalitaon'ny CD), manohana ny famoronana feo tsy misy fipoahana avy amin'ny 3 + segondra, ary ahitana ny fifehezana ny fihetseham-po / fiteny / BGM amin'ny alàlan'ny toro-lalana JSON. Milamina tsara — 0.83% WER amin'ny fitsipika Shinoa.

                                
                                    
                                        Mpamorona::

                                        inclusionAI
                                    
                                    
                                        Lisansa::

                                        Apache 2.0
                                    
                                    
                                        Hafainganan'ny fanovana:

                                        Medium
                                    
                                    
                                        Kalitao::

                                        
                                    
                                    
                                        Teny:

                                        en, zh
                                    
                                    
                                        VRAM:

                                        3GB
                                    
                                    
                                        Fandraisana an-tsoratra feo:

                                         Eny
                                    
                                    
                                        Ny vidin'ny marika 1K:

                                        Free
                                    
                                

                                
                                
                                    
                                        
                                        Famoahana 44.1kHz
                                        
                                        Fandraisana feo
                                        
                                        Fifehezana ny fihetseham-po
                                        
                                        Fifehezana ny fiteny
                                        
                                        Fiforonan'ny BGM
                                        
                                        Compact 0.5B
                                        
                                    
                                
                                

                                
                                Tsara indrindra ho an'ny:: 
                                Fitantarana amin'ny teny roa tena marina, feo mifehy ny fihetseham-po, votoatin'ny boky amin'ny feo Shinoa
                                
                            
                            
                                
                                    Andramo Ming-Omni TTS
                                
                            
                        
                    
                    
                
            

            
            
                
                    
                    
                        
                            
                                Kokoro
                                Free
                            
                            
                                Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
                                
                                    Mpamorona::
Hexgrad
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en, ja, zh, fr, it, pt, es, hi
                                
                                Tsara indrindra ho an'ny:: High-quality TTS with minimal latency, streaming applications
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Piper
                                Free
                            
                            
                                Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
                                
                                    Mpamorona::
Rhasspy
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en, de, fr, es, it, pt, nl, pl, ru, zh, ar, cs, da, fi, el, hu, is, ka, kk, ne, no, ro, sk, sr, sv, sw, tr, uk, vi
                                
                                Tsara indrindra ho an'ny:: Quick previews, accessibility, and embedded applications
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                VITS
                                Free
                            
                            
                                VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
                                
                                    Mpamorona::
Jaehyeon Kim et al.
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en, de, es, fr, pt, nl, fi, hu, bg, uk, pl
                                
                                Tsara indrindra ho an'ny:: General-purpose text-to-speech with natural prosody
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                MeloTTS
                                Free
                            
                            
                                MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
                                
                                    Mpamorona::
MyShell.ai
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en, es, fr, zh, ja, ko
                                
                                Tsara indrindra ho an'ny:: Production applications needing fast, multilingual TTS
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Kani TTS 2
                                Free
                            
                            
                                Kani-TTS-2 by NineNineSix is an ultra-lightweight 400M parameter model built on a Liquid AI LFM2 backbone with NVIDIA NanoCodec. It runs in just 3GB VRAM and produces ~10 seconds of speech in ~2 seconds on an A100 (RTF 0.2). The current public release ships an English-only `kani-tts-2-en` checkpoint and does not expose the speaker-embedding hook needed for voice cloning — use Chatterbox / IndexTTS2 / F5-TTS for cloning, or Kokoro / MeloTTS for non-English.
                                
                                    Mpamorona::
NineNineSix
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en
                                
                                Tsara indrindra ho an'ny:: Fast English generation on low-VRAM hardware, quick previews
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                OuteTTS
                                Free
                            
                            
                                OuteTTS extends large language models with text-to-speech capabilities while preserving the original architecture. It supports multiple backends including llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, and even browser inference via Transformers.js. Features zero-shot voice cloning through speaker profiles saved as JSON.
                                
                                    Mpamorona::
OuteAI
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en
                                
                                Tsara indrindra ho an'ny:: Edge deployment, browser-based TTS, low-resource environments
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Pocket TTS
                                Free
                            
                            
                                Pocket TTS by Kyutai (creators of Moshi) is a compact 100M parameter text-to-speech model that punches well above its weight. It runs efficiently on CPU, supports zero-shot voice cloning from a single audio sample, and produces natural-sounding speech. The small model size makes it ideal for edge deployment and low-resource environments.
                                
                                    Mpamorona::
Kyutai
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en, fr
                                
                                Tsara indrindra ho an'ny:: Lightweight deployment, CPU-only environments, quick voice cloning
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Kitten TTS
                                Free
                            
                            
                                Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
                                
                                    Mpamorona::
KittenML
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny: en
                                
                                Tsara indrindra ho an'ny:: Fast lightweight TTS, edge deployment, low-latency applications
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                    
                        
                            
                                Ming-Omni TTS
                                Free
                            
                            
                                Ming-omni-tts-0.5B by inclusionAI is a compact omni-modal speech model built on the BailingMM dense backbone with a Patch-by-Patch flow-matching audio decoder. Delivers 44.1kHz output (near CD quality), supports zero-shot voice cloning from a 3+ second reference, and includes built-in emotion / dialect / BGM control via JSON instructions. Excellent stability — 0.83% WER on Chinese benchmarks.
                                
                                    Mpamorona::
inclusionAI
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny: en, zh
                                
                                Tsara indrindra ho an'ny:: High-fidelity bilingual narration, emotion-controlled voice acting, Chinese audiobook content
                            
                            
                                Andramo maimaimpoana
                            
                        
                    
                    
                
            

            
            
                
                    
                    
                        
                            
                                Bark
                                Stock label
                            
                            
                                Bark by Suno is a transformer-based text-to-audio model that can generate highly realistic, multilingual speech as well as other audio like music, background noise, and sound effects. It can produce nonverbal communications like laughing, sighing, and crying. Bark supports over 100 speaker presets and 13+ languages.
                                
                                    Mpamorona::
Suno
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Slow
                                    Kalitao::

                                    Teny:
en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Sound effectsLaughing/sighingMusic generation100+ speakersMultilingual
                                Tsara indrindra ho an'ny:: Creative audio content, audiobooks with emotion, sound effects
                            
                            
                                Andramo Bark
                            
                        
                    
                    
                    
                        
                            
                                Bark Small
                                Stock label
                            
                            
                                Bark Small is a distilled version of the Bark model that trades some audio quality for significantly faster inference speeds and lower memory requirements. It retains Bark's ability to generate speech with emotions, laughter, and multiple languages.
                                
                                    Mpamorona::
Suno
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh, fr, de, hi, it, ja, ko, pl, pt, ru, es, tr
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                LightweightFaster than full BarkEmotional speechMultilingual
                                Tsara indrindra ho an'ny:: Quick creative audio when full Bark is too slow
                            
                            
                                Andramo Bark Small
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice 2
                                Stock label
                            
                            
                                CosyVoice 2 by Alibaba's Tongyi Lab achieves human-comparable speech quality with extremely low latency, making it ideal for real-time applications. It uses a finite scalar quantization approach for streaming synthesis and supports zero-shot voice cloning, cross-lingual synthesis, and fine-grained emotion control. It outperforms many commercial TTS systems in subjective evaluations.
                                
                                    Mpamorona::
Alibaba (Tongyi Lab)
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, fr, de, it, es
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                StreamingZero-shot cloningCross-lingualEmotion controlHuman-parity
                                Tsara indrindra ho an'ny:: Real-time applications, streaming TTS, voice assistants
                            
                            
                                Andramo CosyVoice 2
                            
                        
                    
                    
                    
                        
                            
                                Dia TTS
                                Stock label
                            
                            
                                Dia by Nari Labs is a 1.6B parameter text-to-speech model designed specifically for generating multi-speaker dialogue. It can produce natural-sounding conversations between two speakers with appropriate turn-taking, prosody, and emotional expression. Dia is perfect for creating podcast-style content, audiobook dialogues, and interactive conversational AI.
                                
                                    Mpamorona::
Nari Labs
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Multi-speakerDialog generationNatural turn-takingEmotional expression1.6B parameters
                                Tsara indrindra ho an'ny:: Podcasts, audiobook dialogues, conversational content
                            
                            
                                Andramo Dia TTS
                            
                        
                    
                    
                    
                        
                            
                                Parler TTS
                                Stock label
                            
                            
                                Parler TTS is a text-to-speech model that uses natural language voice descriptions to control the generated speech. Instead of selecting from preset voices, you describe the voice you want (e.g., "a warm female voice with a slight British accent, speaking slowly and clearly") and Parler generates speech matching that description. This makes it uniquely flexible for creative applications.
                                
                                    Mpamorona::
Hugging Face
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Voice descriptionNatural language controlFlexible voice creationNo preset voices needed
                                Tsara indrindra ho an'ny:: Creative applications where you need custom voice characteristics
                            
                            
                                Andramo Parler TTS
                            
                        
                    
                    
                    
                        
                            
                                GLM-TTS
                                Stock label
                            
                            
                                GLM-TTS by Zhipu AI is a text-to-speech system built on the Llama architecture with flow matching. It achieves the lowest character error rate among open-source TTS models, meaning it produces the most accurate pronunciation. GLM-TTS supports English and Chinese with voice cloning from 3-10 second audio samples.
                                
                                    Mpamorona::
Zhipu AI
                                    Lisansa::
GLM-4 License
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Lowest error rateVoice cloningFlow matchingNatural prosody
                                Tsara indrindra ho an'ny:: Applications requiring maximum pronunciation accuracy
                            
                            
                                Andramo GLM-TTS
                            
                        
                    
                    
                    
                        
                            
                                IndexTTS-2
                                Stock label
                            
                            
                                IndexTTS-2 is an advanced text-to-speech system that excels at zero-shot voice synthesis with fine-grained emotion control. It can generate speech with specific emotional tones like happy, sad, angry, or fearful without requiring emotion-specific training data. The model uses emotion vectors to precisely control the emotional expression of generated speech.
                                
                                    Mpamorona::
Index Team
                                    Lisansa::
Bilibili Model License
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Emotion controlZero-shotEmotion vectorsExpressive speechFine-grained control
                                Tsara indrindra ho an'ny:: Emotionally expressive content, audiobooks, virtual assistants
                            
                            
                                Andramo IndexTTS-2
                            
                        
                    
                    
                    
                        
                            
                                Spark TTS
                                Stock label
                            
                            
                                Spark TTS by SparkAudio is a text-to-speech model that combines voice cloning with controllable emotion and speaking style. Using just 5 seconds of reference audio, it can clone a voice and then generate speech with different emotions, speeds, and styles while maintaining the cloned voice identity. Spark TTS uses a prompt-based control system.
                                
                                    Mpamorona::
SparkAudio
                                    Lisansa::
CC BY-NC-SA 4.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Voice cloningEmotion controlStyle controlPrompt-based5-second cloning
                                Tsara indrindra ho an'ny:: Content creation with cloned voices and emotional control
                            
                            
                                Andramo Spark TTS
                            
                        
                    
                    
                    
                        
                            
                                GPT-SoVITS
                                Stock label
                            
                            
                                GPT-SoVITS combines GPT-style language modeling with SoVITS (Singing Voice Inference via Translation and Synthesis) for powerful few-shot voice cloning. With as little as 5 seconds of reference audio, it can accurately clone a voice and generate new speech while preserving the speaker's unique characteristics. It excels at both speaking and singing voice synthesis.
                                
                                    Mpamorona::
RVC-Boss
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Slow
                                    Kalitao::

                                    Teny:
en, zh, ja, ko
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                5-second cloningSinging voiceFew-shot learningHigh fidelityCross-lingual
                                Tsara indrindra ho an'ny:: Voice cloning, singing synthesis, content creator voice replication
                            
                            
                                Andramo GPT-SoVITS
                            
                        
                    
                    
                    
                        
                            
                                Orpheus
                                Stock label
                            
                            
                                Orpheus is a large-scale text-to-speech model that achieves human-level emotional expression. Trained on over 100,000 hours of diverse speech data, it excels at generating speech with natural emotions, emphasis, and speaking styles. Orpheus can produce speech that is virtually indistinguishable from human recordings.
                                
                                    Mpamorona::
Canopy Labs
                                    Lisansa::
Llama 3.2 Community
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Human-level emotion100K hours trainingNatural emphasisExpressive speech
                                Tsara indrindra ho an'ny:: High-quality emotional speech, audiobooks, voice acting
                            
                            
                                Andramo Orpheus
                            
                        
                    
                    
                    
                        
                            
                                Qwen3 TTS
                                Stock label
                            
                            
                                Qwen3-TTS is a 1.7 billion parameter text-to-speech model from Alibaba's Qwen team. It supports three modes: preset voices with emotion control (9 speakers), voice cloning from just 3 seconds of audio, and a unique voice design mode where you describe the voice you want in natural language. It covers 10 languages with high expressiveness and natural prosody.
                                
                                    Mpamorona::
Alibaba (Qwen)
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, de, fr, ru, pt, es, it
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Voice cloning9 preset voicesVoice design from textEmotion control10 languages
                                Tsara indrindra ho an'ny:: Multilingual content with voice cloning or custom voice design
                            
                            
                                Andramo Qwen3 TTS
                            
                        
                    
                    
                    
                        
                            
                                Chatterbox Turbo
                                Stock label
                            
                            
                                Chatterbox Turbo by Resemble AI is a 350M parameter upgrade to Chatterbox, delivering up to 6x real-time speed with sub-200ms latency. It supports paralinguistic tags like [laugh], [cough], and [chuckle] directly in text. Includes Perth watermarking on all generated audio for provenance tracking.
                                
                                    Mpamorona::
Resemble AI
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Sub-200ms latencyParalinguistic tags6x real-timeVoice cloningWatermarking
                                Tsara indrindra ho an'ny:: Real-time voice agents, expressive speech with natural sounds
                            
                            
                                Andramo Chatterbox Turbo
                            
                        
                    
                    
                    
                        
                            
                                VoxCPM
                                Stock label
                            
                            
                                VoxCPM 1.5 by OpenBMB is a novel tokenizer-free TTS model that operates in continuous space rather than discrete tokens. It produces high-fidelity 44.1kHz audio, supports zero-shot voice cloning from 3-10 seconds, and maintains consistency across paragraphs. Cross-language cloning lets you apply an English voice to Chinese speech and vice versa.
                                
                                    Mpamorona::
OpenBMB
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                44.1kHz audioTokenizer-freeCross-lingual cloningContext-awareLoRA fine-tuning
                                Tsara indrindra ho an'ny:: High-fidelity audio, audiobooks, long-form content with voice consistency
                            
                            
                                Andramo VoxCPM
                            
                        
                    
                    
                    
                        
                            
                                VibeVoice
                                Stock label
                            
                            
                                VibeVoice from Microsoft generates long-form speech up to 90 minutes with support for 4 simultaneous speakers, making it ideal for podcasts and dialogues. The Realtime 0.5B variant achieves ~300ms latency for interactive use. Supports speaker tags for multi-turn dialogue generation.
                                
                                    Mpamorona::
Microsoft
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Tsia
                                
                                Multi-speakerLong-form (90 min)Podcast generationDialogueLow latency
                                Tsara indrindra ho an'ny:: Podcasts, dialogues, long-form narration, multi-speaker content
                            
                            
                                Andramo VibeVoice
                            
                        
                    
                    
                    
                        
                            
                                CosyVoice3
                                Stock label
                            
                            
                                CosyVoice3 is the latest evolution from Alibaba's FunAudioLLM team. It features bi-streaming inference with ~150ms latency, instruction-based control for emotion/speed/volume, and improved speaker similarity for zero-shot cloning. Supports 9 languages plus 18 Chinese dialects. RL-tuned variant delivers state-of-the-art prosody.
                                
                                    Mpamorona::
Alibaba (FunAudioLLM)
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Fast
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, de, es, fr, it, ru
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Bi-streamingEmotion controlVoice cloningSpeed/volume controlInstruction following
                                Tsara indrindra ho an'ny:: Multilingual production TTS, real-time applications, voice cloning
                            
                            
                                Andramo CosyVoice3
                            
                        
                    
                    
                    
                        
                            
                                NAMAA Saudi TTS
                                Stock label
                            
                            
                                NAMAA Saudi TTS is a Saudi Arabic fine-tune of Resemble AI's ChatterboxMultilingual. Trained by NAMAA Space on authentic Saudi-dialect speech, it produces natural Modern Standard Arabic and Saudi colloquial pronunciation that generic multilingual models cannot match. Inherits Chatterbox's zero-shot voice cloning and emotion control via reference audio prompts. The first open-weights Arabic TTS deployed on TTS.ai.
                                
                                    Mpamorona::
NAMAA Space
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
ar
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Saudi Arabic dialectModern Standard ArabicZero-shot voice cloningEmotion controlNative pronunciation
                                Tsara indrindra ho an'ny:: Arabic content for Saudi audiences, MSA narration, Khaleeji-dialect voice agents, Arabic audiobooks
                            
                            
                                Andramo NAMAA Saudi TTS
                            
                        
                    
                    
                    
                        
                            
                                Darwin TTS
                                Stock label
                            
                            
                                Darwin-TTS-1.7B-Cross by FINAL-Bench is a research variant of Qwen3-TTS-1.7B where 84 talker-FFN tensors (8.6%) are blended at α=3% with the matching tensors from Qwen3-1.7B-Base. The blend is built without retraining and produces noticeably crisper cross-lingual voice cloning across Korean, English, Japanese, and Chinese. Operates in zero-shot voice-clone mode (3 seconds reference audio).
                                
                                    Mpamorona::
FINAL-Bench
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, ko, ja, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Voice cloningCross-lingualFFN-blended4 core languagesQwen3 backbone
                                Tsara indrindra ho an'ny:: Cross-lingual voice cloning between English / Korean / Japanese / Chinese with a single reference voice
                            
                            
                                Andramo Darwin TTS
                            
                        
                    
                    
                    
                        
                            
                                MOSS-TTSD
                                Stock label
                            
                            
                                MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.
                                
                                    Mpamorona::
OpenMOSS
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh
                                    Fandraisana an-tsoratra feo:
 Eny
                                
                                Multi-speaker dialogueUp to 5 speakers60min coherent audioVoice cloningPodcast-optimised
                                Tsara indrindra ho an'ny:: Podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices
                            
                            
                                Andramo MOSS-TTSD
                            
                        
                    
                    
                
            

            
            
                
                    
                    
                        
                            
                                Chatterbox
                                Premium
                            
                            
                                Chatterbox by Resemble AI is a cutting-edge zero-shot voice cloning model. It can replicate any voice from a single audio sample with remarkable accuracy, capturing not just the timbre but also the speaking style and emotional nuances. Chatterbox also features fine-grained emotion control, allowing you to adjust the emotional tone of the generated speech independently from the voice identity.
                                
                                    Mpamorona::
Resemble AI
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
4GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Zero-shot cloningEmotion controlHigh fidelityStyle transferSingle sample cloning
                                Tsara indrindra ho an'ny:: Professional voice cloning with emotional control, content creation
                            
                            
                                Andramo Chatterbox
                            
                        
                    
                    
                    
                        
                            
                                Tortoise TTS
                                Premium
                            
                            
                                Tortoise TTS is an autoregressive multi-voice text-to-speech system that prioritizes audio quality over speed. It uses DALL-E-inspired architecture to generate highly natural speech with excellent prosody and speaker similarity. While slower than many alternatives, Tortoise produces some of the most realistic synthetic speech available in the open-source ecosystem.
                                
                                    Mpamorona::
James Betker
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Slow
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
8GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Highest qualityMulti-voiceDALL-E architectureVoice cloningAutoregressive
                                Tsara indrindra ho an'ny:: Audiobooks, premium content, quality-first applications
                            
                            
                                Andramo Tortoise TTS
                            
                        
                    
                    
                    
                        
                            
                                StyleTTS 2
                                Premium
                            
                            
                                StyleTTS 2 achieves human-level TTS synthesis by combining style diffusion with adversarial training using large speech language models. It generates the most natural sounding speech among single-speaker models, rivaling human recordings. StyleTTS 2 uses diffusion-based style modeling to capture the full range of human speech variation.
                                
                                    Mpamorona::
Columbia University
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                    VRAM:
4GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Human-levelStyle diffusionAdversarial trainingNatural variationHigh fidelity
                                Tsara indrindra ho an'ny:: Studio-quality single-speaker synthesis, professional narration
                            
                            
                                Andramo StyleTTS 2
                            
                        
                    
                    
                    
                        
                            
                                OpenVoice
                                Premium
                            
                            
                                OpenVoice by MyShell.ai enables instant voice cloning with granular control over voice style, emotion, accent, rhythm, pauses, and intonation. It can clone a voice from a short audio clip and generate speech in multiple languages while maintaining the speaker identity. OpenVoice also functions as a voice converter, allowing real-time voice transformation.
                                
                                    Mpamorona::
MyShell.ai / MIT
                                    Lisansa::
MIT
                                    Hafainganan'ny fanovana:
Medium
                                    Kalitao::

                                    Teny:
en, zh, ja, ko, fr, es
                                    Fandraisana an-tsoratra feo:
 Eny
                                    VRAM:
4GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                Instant cloningVoice conversionEmotion controlAccent controlMultilingual
                                Tsara indrindra ho an'ny:: Voice cloning with fine-grained style control, voice conversion
                            
                            
                                Andramo OpenVoice
                            
                        
                    
                    
                    
                        
                            
                                Sesame CSM
                                Premium
                            
                            
                                Sesame CSM (Conversational Speech Model) is a 1 billion parameter model designed specifically for generating conversational speech. It models the natural patterns of human conversation including turn-taking timing, backchannel responses, emotional reactions, and conversational flow. CSM generates audio that sounds like a natural human conversation rather than synthetic speech.
                                
                                    Mpamorona::
Sesame
                                    Lisansa::
Apache 2.0
                                    Hafainganan'ny fanovana:
Slow
                                    Kalitao::

                                    Teny:
en
                                    Fandraisana an-tsoratra feo:
 Tsia
                                    VRAM:
8GB
                                    Ny vidin'ny marika 1K:
4x
                                
                                ConversationalNatural timingTurn-takingBackchannel1B parameters
                                Tsara indrindra ho an'ny:: AI assistants, chatbots, conversational AI applications
                            
                            
                                Andramo Sesame CSM
                            
                        
                    
                    
                
            
        

        
        
            Tabilao fampitahana modely
            
                
                    
                        
                            Modely
                            Mpamorona:
                            Taona
                            Kalitao:
                            Hafainganan'ny fanovana
                            Teny
                            Fandraisana an-tsoratra feo
                            VRAM
                            Lisansa:
                            Ny vidin'ny
                            
                        
                    
                    
                        
                        
                            Kokoro
                            Hexgrad
                            Free
                            
                            Fast
                            8
                            
                            1.5GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            Piper
                            Rhasspy
                            Free
                            
                            Fast
                            29
                            
                            0 (CPU only)
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            VITS
                            Jaehyeon Kim et al.
                            Free
                            
                            Fast
                            11
                            
                            1GB
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            MeloTTS
                            MyShell.ai
                            Free
                            
                            Fast
                            6
                            
                            0.5GB (GPU optional)
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            Bark
                            Suno
                            Standard
                            
                            Slow
                            13
                            
                            5GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Bark Small
                            Suno
                            Standard
                            
                            Medium
                            13
                            
                            2GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            CosyVoice 2
                            Alibaba (Tongyi Lab)
                            Standard
                            
                            Medium
                            8
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Dia TTS
                            Nari Labs
                            Standard
                            
                            Medium
                            1
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Parler TTS
                            Hugging Face
                            Standard
                            
                            Medium
                            1
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            GLM-TTS
                            Zhipu AI
                            Standard
                            
                            Medium
                            2
                            
                            4GB
                            GLM-4 License
                            2
                            Ampiasao
                        
                        
                        
                            IndexTTS-2
                            Index Team
                            Standard
                            
                            Medium
                            2
                            
                            4GB
                            Bilibili Model License
                            2
                            Ampiasao
                        
                        
                        
                            Spark TTS
                            SparkAudio
                            Standard
                            
                            Medium
                            2
                            
                            4GB
                            CC BY-NC-SA 4.0
                            2
                            Ampiasao
                        
                        
                        
                            GPT-SoVITS
                            RVC-Boss
                            Standard
                            
                            Slow
                            4
                            
                            6GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Orpheus
                            Canopy Labs
                            Standard
                            
                            Medium
                            1
                            
                            4GB
                            Llama 3.2 Community
                            2
                            Ampiasao
                        
                        
                        
                            Chatterbox
                            Resemble AI
                            Premium
                            
                            Medium
                            1
                            
                            4GB
                            MIT
                            4
                            Ampiasao
                        
                        
                        
                            Tortoise TTS
                            James Betker
                            Premium
                            
                            Slow
                            1
                            
                            8GB
                            Apache 2.0
                            4
                            Ampiasao
                        
                        
                        
                            StyleTTS 2
                            Columbia University
                            Premium
                            
                            Medium
                            1
                            
                            4GB
                            MIT
                            4
                            Ampiasao
                        
                        
                        
                            OpenVoice
                            MyShell.ai / MIT
                            Premium
                            
                            Medium
                            6
                            
                            4GB
                            MIT
                            4
                            Ampiasao
                        
                        
                        
                            Qwen3 TTS
                            Alibaba (Qwen)
                            Standard
                            
                            Medium
                            10
                            
                            7GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Sesame CSM
                            Sesame
                            Premium
                            
                            Slow
                            1
                            
                            8GB
                            Apache 2.0
                            4
                            Ampiasao
                        
                        
                        
                            Chatterbox Turbo
                            Resemble AI
                            Standard
                            
                            Fast
                            1
                            
                            2GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            VoxCPM
                            OpenBMB
                            Standard
                            
                            Fast
                            2
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Kani TTS 2
                            NineNineSix
                            Free
                            
                            Fast
                            1
                            
                            3GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            OuteTTS
                            OuteAI
                            Free
                            
                            Fast
                            1
                            
                            2GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            VibeVoice
                            Microsoft
                            Standard
                            
                            Fast
                            2
                            
                            4GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Pocket TTS
                            Kyutai
                            Free
                            
                            Fast
                            2
                            
                            1GB
                            MIT
                            Free
                            Ampiasao
                        
                        
                        
                            Kitten TTS
                            KittenML
                            Free
                            
                            Fast
                            1
                            
                            0GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                        
                            CosyVoice3
                            Alibaba (FunAudioLLM)
                            Standard
                            
                            Fast
                            9
                            
                            4GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            NAMAA Saudi TTS
                            NAMAA Space
                            Standard
                            
                            Medium
                            1
                            
                            6GB
                            MIT
                            2
                            Ampiasao
                        
                        
                        
                            Darwin TTS
                            FINAL-Bench
                            Standard
                            
                            Medium
                            4
                            
                            7GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            MOSS-TTSD
                            OpenMOSS
                            Standard
                            
                            Medium
                            2
                            
                            12GB
                            Apache 2.0
                            2
                            Ampiasao
                        
                        
                        
                            Ming-Omni TTS
                            inclusionAI
                            Free
                            
                            Medium
                            2
                            
                            3GB
                            Apache 2.0
                            Free
                            Ampiasao
                        
                        
                    
                
            
        
    




    
        
            
                Ny sehatra AI Text to Speech feno indrindra

                
                    
                        Nahoana no Safidy ny TTS.ai ho an'ny Soratra ho Fitenenana?
                        Mitambatra ao anatin'ny sehatra iray, mora ampiasaina, ny maodely tsara indrindra manerantany amin'ny fanehoana lahatsoratra ho amin'ny resaka, ny TTS.ai. tsy toy ny tolotra manokana izay manakana anao amin'ny milina feo tokana, manome anao fidirana amin'ny maodely mihoatra ny 20 avy amin'ireo laboratoara fikarohana lehibe, anisan'izany ny Coqui, MyShell, Amphion, NVIDIA, Suno, HuggingFace, ny Anjerimanontolon'i Tsinghua, ary maro hafa.
                        Ny modely tsirairay dia loharano misokatra eo ambanin'ny MIT, Apache 2.0, na lisansa mitovy amin'izany, izay manome antoka fa manana zo ara-barotra feno ianao hampiasa ny feo navoaka ao amin'ny tetikasao. Na mila famoronana haingana sy maivana ho an'ny rindran'asa amin'ny fotoana tena izy ianao na vokatra avo lenta ho an'ny boky audio sy podcast, manana ny modely mety amin'ny tranga rehetra ny TTS.ai.

                        Modely maimaimpoana, tsy mila kaonty
                        Manomboka avy hatrany amin'ny maodely telo maimaimpoana TTS: Piper (tena haingana, maivana), VITS (fanamboarana neural avo lenta), ary MeloTTS (fanampiana fiteny marobe). Tsy mila misoratra anarana, tsy mila karatra fandoavam-bola, tsy misy fetra amin'ny taranaka. Manohana ny teny Anglisy sy ny fiteny hafa marobe miaraka amin'ny feo voajanahary mifanaraka amin'ny ankamaroan'ny rindrambaiko ny maodely maimaimpoana.
                    
                    
                        Fandraisana an-tànana alefa amin'ny GPU
                        Ireo modely TTS rehetra dia mandeha amin'ny GPU NVIDIA manokana mba hahazoana fotoana famoronana haingana sy tsy miova. Ny modely maimaimpoana dia matetika mamorona feo ao anatin'ny 2 segondra. Ny modely mahazatra toy ny Kokoro, CosyVoice 2, ary Bark dia eo amin'ny 3-5 segondra eo ho eo. Ny modely premium manana kalitao avo indrindra, toy ny Tortoise sy Chatterbox, dia miasa ao anatin'ny 5-15 segondra arakaraka ny halavan'ny lahabolana.

                        Teny 30+ raisina an-tànana
                        Mamorona kabary amin'ny teny maherin'ny 30, anisan'izany ny teny Anglisy, Espaniola, Frantsay, Alemàna, Italiana, Portiogey, Sinoa, Japoney, Koreana, Arabo, Hindi, Rosiana, ary maro hafa. Maro ny modely manohana ny famoronana kabary amin'ny teny maro, izay midika fa afaka mamorona kabary amin'ny teny iray izay tsy mbola notrehin'ny feo voalohany ianao. Ny CosyVoice 2 sy ny GPT-SoVITS dia tena tsara amin'ny famoronana kabary amin'ny teny maro.

                        API vonona ho an'ny mpamorona
                        Ampidiro ao anatin'ny rindrambaikoo ny TTS.ai miaraka amin'ny API REST mifanaraka amin'ny OpenAI. Endpoint iray ho an'ny maodely 20+ rehetra. Python, JavaScript, cURL, ary Go SDKs. Fanohanana ny streaming ho an'ny rindrambaiko amin'ny fotoana tena izy. Fandraisana anjara amin'ny famokarana votoaty goavana. Webhooks ho an'ny fampahafantarana async. Afaka mampiasa ny API ny tetikasa rehetra, anisan'izany ny maimaimpoana.
                    
                
            
        
    









    



    
        
        
        Fantaro bebe kokoa →
        
    










    
        Fanontaniana mipetraka matetika
        
            
                
                    
                    
                        
                            
                        
                        
                            
                                Ny Text to Speech (TTS) dia teknolojian'ny AI izay manova ny soratra voasoratra ho feo voatendry avy amin'ny natiora. mampiasa ny fianarana lalina ny modelin'ny TTS neural maoderina toy ny Kokoro, Chatterbox, ary ny CosyVoice 2 mba hamoahana ny feo maha-olona ny resaka, miaraka amin'ny fiteny, fihetseham-po, ary ny fitondràna.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Araka ny zavatra ilainao izany. Raha mila fijerena mialoha haingana, dia mampiasa ny Piper na ny MeloTTS (poana, haingana). Raha mila kalitao avo lenta, dia andramo ny Kokoro na ny CosyVoice 2 (ara-dalàna). Raha mila misintona feo, dia mampiasa ny Chatterbox na ny GPT-SoVITS (mividy). Raha mila votoaty resaka/podcast, dia andramo ny Dia TTS. Manana ny maha-izy azy ny tsirairay — andramo mba hahitana izay mety indrindra.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny! Ny TTS.ai dia manome tsipelina maimaim-poana miaraka amin'ny modely Kokoro, Piper, VITS, ary MeloTTS. Tsy mila kaonty ianao ho an'ny karazan-tsoratra hatramin'ny 500 ary taranaka 3 isan'ora. Misoratra anarana amin'ny kaonty maimaimpoana mba hahazoana karatra 15 ary hidirana amin'ireo modely rehetra.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Ny modely TTS-nay dia manohana fiteny mihoatra ny 30, anisan'izany ny teny Anglisy, Espaniola, Frantsay, Alemàna, Italiana, Portiogey, Sinoa, Japoney, Koreana, Arabo, Rosiana, Hindi, ary maro hafa.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny, azo ampiasaina amin'ny varotra ny feo namboarina tamin'ny alalan'ny TTS.ai. Mampiasà fahazoan-dàlana misokatra (MIT, Apache 2.0) ny modely rehetra. Jereo ny fahazoan-dàlana ho an'ny modely tsirairay raha mila fanazavana manokana. Mampirisika anao izahay hijery ny fahazoan-dàlana ho an'ny modely manokana ampiasainao amin'ny tetikasao.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Manaiky ny MP3, WAV, OGG, ary FLAC ny TTS.ai. Ny MP3 no lasitra ampiasaina amin'ny famakiana amin'ny tranonkala. Ny WAV no tokony ampiasaina raha te-hanaovana ny feo. Azonao ovaina ireo lamina ireo amin'ny alalan'ny fitaovana fanovàna feo.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Mampiasa ny AI ny fandikana feo mba hamoronana feo voafaritra avy amin'ny santionan'ny feo fohy (5-30 segondra amin'ny ankapobeny). Ampidiro ny fandraiketana mazava ny feon'ny tanjona, ary ny modely toy ny Chatterbox, GPT-SoVITS, na OpenVoice dia hamorona fitenenana vaovao amin'io feon'ilay feo io. Mihamafy ny kalitao amin'ny alalan'ny feon'ny rohy madio sy lava kokoa.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Afaka mamorona hatramin'ny marika 500 isaky ny fangatahana ny mpampiasa maimaimpoana. Mahazo marika 5000 isaky ny fangatahana ny mpampiasa voasoratra anarana. Raha misy lahatsoratra lava kokoa, dia aseho amin'ny ampahany ny feo ary ampifandraisina hoazy. Afaka manamboatra marika 10000 isaky ny fangatahana ny mpampiasa API.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Ny fandraisana an-tànana ny SSML (Speech Synthesis Markup Language) dia miovaova arakaraka ny modely. Ny Piper sy ny modely sasany dia mandray an-tànana ny tag SSML fototra ho an'ny fiatoana, ny fanasongadinana, ary ny fifehezana ny fehezanteny. Ho an'ny modely tsy fandraisana an-tànana ny SSML, dia azonao ampiasaina ny fanononana natoraly sy ny fiatoan-tsoratra mba hifehezana ny fiteny.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny, ny ankamaroan'ny modely dia mandray an-tànana ny fanovana ny hafainganan'ny feo eo anelanelan'ny 0.5x ka hatramin'ny 2.0x. Ny modely sasany, toy ny Bark sy ny Parler, dia mandray an-tànana ihany koa ny fifehezana ny haavo sy ny endrika. Azonao atao ny mamaritra ny famaritana ny hafainganan'ny feo ao amin'ny tontonana fandrindrana avo lenta na amin'ny alalan'ny famaritana ny hafainganan'ny API.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Eny, azo atao amin'ny alalan'ny API-ntsika ny fiasan'ny batch. Azonao atao ny mandefa andian-tsoratra maro amin'ny alalan'ny antso API na baiko soratra tokana, ary hovoarina sy haverina ho rakitra feo miavaka ny tsirairay. Tsara indrindra ho an'ny fizarana boky misy feo, singa fototra e-learning, na baiko soratra amin'ny takelaka kelin'ny lalao izany.
                            
                        
                    
                    
                    
                        
                            
                        
                        
                            
                                Mamorona famaha API avy amin'ny dashboard-n'ny kaontinao, avy eo mandefa fangatahana POST amin'ny endpoint-n'ny API REST miaraka amin'ny soratrao, ny modely, ary ny famaritana ny feonao. Manolotra ohatra amin'ny rindran'asa amin'ny Python, JavaScript, ary cURL izahay. Mifanaraka amin'ny OpenAI ny API, noho izany dia miasa miaraka amin'ny fanovana kely indrindra ireo fampidirana efa misy.
                            
                        
                    
                    
                
            
        
    








    
        
            
                
                
                
                
                
                
                
                
                
                
                
                
                
            
            5.0/5 (4)
        
        
            Inona no azonay atao mba hanatsarana? Manampy anay hamahana ny olana ny fihetseham-ponao.
            
                
                
                
                
            
            
                
                
            
        
    







    
        Manomboka mamadika lahabolana ho feo izao
        Miara-miasa amin'ireo mpamorona an'arivony mampiasa ny TTS.ai. Mahazo marika 15000 maimaimpoana amin'ny alalan'ny kaonty vaovao. Misy ireo modely maimaimpoana azo ampiasaina tsy mila misoratra anarana.
        
            
            Misoratra anarana maimaimpoana
            Jereo ny vidiny

Mpamorona:	KittenML
Lisansa:	Apache 2.0
Hafainganan'ny fanovana	Fast
Kalitao:
Teny	1 fiteny
VRAM	0GB
Fandraisana an-tsoratra feo	Tsy raisina an-tànana

Modely	Mpamorona:	Taona	Hafainganan'ny fanovana	Teny	VRAM	Lisansa:	Ny vidin'ny
Kokoro	Hexgrad	Free	Fast	8	1.5GB	Apache 2.0	Free	Ampiasao
Piper	Rhasspy	Free	Fast	29	0 (CPU only)	MIT	Free	Ampiasao
VITS	Jaehyeon Kim et al.	Free	Fast	11	1GB	MIT	Free	Ampiasao
MeloTTS	MyShell.ai	Free	Fast	6	0.5GB (GPU optional)	MIT	Free	Ampiasao
Bark	Suno	Standard	Slow	13	5GB	MIT	2	Ampiasao
Bark Small	Suno	Standard	Medium	13	2GB	MIT	2	Ampiasao
CosyVoice 2	Alibaba (Tongyi Lab)	Standard	Medium	8	4GB	Apache 2.0	2	Ampiasao
Dia TTS	Nari Labs	Standard	Medium	1	4GB	Apache 2.0	2	Ampiasao
Parler TTS	Hugging Face	Standard	Medium	1	4GB	Apache 2.0	2	Ampiasao
GLM-TTS	Zhipu AI	Standard	Medium	2	4GB	GLM-4 License	2	Ampiasao
IndexTTS-2	Index Team	Standard	Medium	2	4GB	Bilibili Model License	2	Ampiasao
Spark TTS	SparkAudio	Standard	Medium	2	4GB	CC BY-NC-SA 4.0	2	Ampiasao
GPT-SoVITS	RVC-Boss	Standard	Slow	4	6GB	MIT	2	Ampiasao
Orpheus	Canopy Labs	Standard	Medium	1	4GB	Llama 3.2 Community	2	Ampiasao
Chatterbox	Resemble AI	Premium	Medium	1	4GB	MIT	4	Ampiasao
Tortoise TTS	James Betker	Premium	Slow	1	8GB	Apache 2.0	4	Ampiasao
StyleTTS 2	Columbia University	Premium	Medium	1	4GB	MIT	4	Ampiasao
OpenVoice	MyShell.ai / MIT	Premium	Medium	6	4GB	MIT	4	Ampiasao
Qwen3 TTS	Alibaba (Qwen)	Standard	Medium	10	7GB	Apache 2.0	2	Ampiasao
Sesame CSM	Sesame	Premium	Slow	1	8GB	Apache 2.0	4	Ampiasao
Chatterbox Turbo	Resemble AI	Standard	Fast	1	2GB	MIT	2	Ampiasao
VoxCPM	OpenBMB	Standard	Fast	2	4GB	Apache 2.0	2	Ampiasao
Kani TTS 2	NineNineSix	Free	Fast	1	3GB	Apache 2.0	Free	Ampiasao
OuteTTS	OuteAI	Free	Fast	1	2GB	Apache 2.0	Free	Ampiasao
VibeVoice	Microsoft	Standard	Fast	2	4GB	MIT	2	Ampiasao
Pocket TTS	Kyutai	Free	Fast	2	1GB	MIT	Free	Ampiasao
Kitten TTS	KittenML	Free	Fast	1	0GB	Apache 2.0	Free	Ampiasao
CosyVoice3	Alibaba (FunAudioLLM)	Standard	Fast	9	4GB	Apache 2.0	2	Ampiasao
NAMAA Saudi TTS	NAMAA Space	Standard	Medium	1	6GB	MIT	2	Ampiasao
Darwin TTS	FINAL-Bench	Standard	Medium	4	7GB	Apache 2.0	2	Ampiasao
MOSS-TTSD	OpenMOSS	Standard	Medium	2	12GB	Apache 2.0	2	Ampiasao
Ming-Omni TTS	inclusionAI	Free	Medium	2	3GB	Apache 2.0	Free	Ampiasao