Huru AI Text to Speech
31+ Watukufu, wema. 231+ Na zikaeneza maeneo yote! 34+ Hakuna simulizi lililohitajiwa.
Kila Kitu Unachohitaji kwa Sauti
30+ Vifaa vinavyoendeshwa na wanamitindo wa AI
31+ Maumbo ya Sauti
Ukurasa wa makini zaidi wa wasifu wa TTS ulio wazi katika jukwaa moja
Kokoro Free
Kokoro ni mfano wa parameta milioni 82 ambao hupiga ngumi juu ya tabaka lake la uzani. Licha ya ukubwa wake mdogo, hiyo hutokeza sauti ya asili na ya ndani sana. Kokoro huunga mkono lugha mbalimbali ikiwa ni pamoja na Kiingereza, Kijapani, Kichina, na Kikorea kwa sauti za namna mbalimbali.
Faida kwa: ZENYE Umaarufu wa juu usio na matumizi mengi, na matumizi mengi
Jaribu Kuwa Huru
Piper Free
Piper ni injini nyepesi iliyoundwa na Rhaspy ambayo hutumia muundo wa herufi za VITS na kikoromeo. Inatumia sana CPU, na kuifanya ifae sana kwa vifaa vya kisasa, kuendesha magari ya nyumbani, na maombi yanayohitaji alama ya TTS. Kwa zaidi ya sauti 100 katika lugha 30+, Piper anatoa hotuba ya asili kwa mwendo halisi wa kasi sana hata katika Raspberry Pi. 4.
Faida kwa: Matangulizi ya haraka, uwezekano wa kupata habari, na matumizi yaliyokazwa
Jaribu Kuwa Huru
VITS Free
VITS (Viaritional Inference With adstarial o -to-end Text-to-Speech) ni njia inayofanana na hiyo inayotokeza sauti za kiasili zaidi kuliko violezo viwili vya sasa vya jukwaani. Inatumia mitiririko tofauti - tofauti iliyoongezwa kwa mitiririko ya kawaida na utaratibu wa uelimishaji, ikitimiza maendeleo makubwa katika hali ya asili.
Faida kwa: Maandishi ya msingi-to-speech yenye mambo ya asili
Jaribu Kuwa Huru
MeloTTS Free
KIKUNDI cha MySlah.i ni maktaba ya lugha nyingi inayounga mkono Kiingereza (Amerika, Kiingereza, Kihindi, Kiaustralia), Kihispania, Kichina, Kijapani, na Kikorea. Ni ya haraka sana, inashughulikia maandishi kwa mwendo wa karibu wakati wote katika CPU peke yake. MeloTS imebuniwa kwa ajili ya matumizi ya uzalishaji na utegemezo wa CPU na GPU inference.
Faida kwa: Matumizi ya Utayarishaji Wenye Kuhitaji TTS
Jaribu Kuwa Huru
OuteTTS Free
Shirika hilo linaunga mkono wasifu wa lugha wenye uwezo wa kutafsiri na kuhifadhi majengo ya awali. Inaunga mkono sehemu mbalimbali za nyuma ikiwa ni pamoja na lama.cpp (CPU/GPU), Hilling Facevace Transformers, ExLlaV2, VLM, na hata ovarificsion inference kupitia Transformer.js. Expots-shot fous foot kupitia wazungumzaji waliookolewa kama JSON.
Faida kwa: Usafiri wa kasi, mazingira ya TTS yenye kupitiwa - pitia, yaliyo chini ya ardhi
Jaribu Kuwa Huru
Pocket TTS Free
Proet TTS ya Kyutai (waratibu wa Mishi) ni kishikizo kikubwa cha 100M cha parameta -to-speech ambacho husugua sana juu ya uzito wake. Kinatenda kwa ustadi katika CPU, kinaunga mkono sauti ya sufuri -hot inayotokana na sampuli moja ya sauti ya sauti, na kutokeza usemi wa asili. Ukubwa mdogo wa kigezo huifanya ifae kwa ajili ya uratibu na mazingira ya chini.
Faida kwa: Vyombo vya kupunguza uzito, mazingira ya Tupu, sauti ya haraka inayoibuka
Jaribu Kuwa Huru
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Faida kwa: Fast lightweight TTS, edge deployment, low-latency applications
Jaribu Kuwa Huru
Bark Standard
Muundo wa maandishi -to-audio unaotokeza maneno, muziki, na sauti halisi.
Develer: Suno · License: MIT
Jaribu kufanya hivyo
Bark Small Standard
Aina ya nuru ya Bark ikiwa na kiasi cha haraka zaidi cha kumbukumbu na utumizi wa chini zaidi.
Develer: Suno · License: MIT
Jaribu kufanya hivyo
CosyVoice 2 Standard
Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.
Develer: Alibaba (Tongyi Lab) · License: Apache 2.0
Jaribu kufanya hivyo
Dia TTS Standard
Muundo wa viyombe vya kinenani unaotokeza mazungumzo ya kiasili kati ya wasemaji.
Develer: Nari Labs · License: Apache 2.0
Jaribu kufanya hivyo
Parler TTS Standard
Eleza sauti unayotaka katika lugha ya asili na Parler hutokeza usemi unaofanana.
Develer: Hugging Face · License: Apache 2.0
Jaribu kufanya hivyo
GLM-TTS Standard
Hutimiza kiwango cha chini zaidi cha makosa ya tabia miongoni mwa violezo vya TTS vilivyo wazi.
Develer: Zhipu AI · License: GLM-4 License
Jaribu kufanya hivyo
IndexTTS-2 Standard
Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.
Develer: Index Team · License: Bilibili Model License
Jaribu kufanya hivyo
Spark TTS Standard
TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.
Develer: SparkAudio · License: CC BY-NC-SA 4.0
Jaribu kufanya hivyo
GPT-SoVITS Standard
Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.
Develer: RVC-Boss · License: MIT
Jaribu kufanya hivyo
Orpheus Standard
KISA cha hisia - moyo kilichotayarishwa kwa muda wa saa 100 za data za usemi.
Develer: Canopy Labs · License: Llama 3.2 Community
Jaribu kufanya hivyo
Qwen3 TTS Standard
THAWABU za Aliba zenye lugha nyingi zikiwa na uwezo wa kutokeza sauti, sauti zilizotokezwa kimbele, na ubuni wa sauti kutoka kwenye maandishi.
Develer: Alibaba (Qwen) · License: Apache 2.0
Jaribu kufanya hivyo
Chatterbox Turbo Standard
Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.
Develer: Resemble AI · License: MIT
Jaribu kufanya hivyo
Dia 2 Standard
Majadiliano ya kwanza-TTS yenye mazungumzo ya namna mbalimbali na ishara za kiupuuzi.
Develer: Nari Labs · License: Apache 2.0
Jaribu kufanya hivyo
VoxCPM Standard
Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.
Develer: OpenBMB · License: Apache 2.0
Jaribu kufanya hivyo
TADA Standard
Magamba mawili yenye pande mbili za maandishi, 5ksi kwa kasi zaidi kuliko LLM TTS.
Develer: Hume AI · License: MIT
Jaribu kufanya hivyo
VibeVoice Standard
Picha ndogo kwa ajili ya maudhui ya muda mrefu ya lugha mbalimbali kama vile podikasti na rekodi za sauti.
Develer: Microsoft · License: MIT
Jaribu kufanya hivyo
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Develer: Alibaba (FunAudioLLM) · License: Apache 2.0
Jaribu kufanya hivyo
CosyVoice 2
Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.
Lugha: en, zh, ja, ko, fr, de, it, es
Sauti ya Clone
GLM-TTS
Hutimiza kiwango cha chini zaidi cha makosa ya tabia miongoni mwa violezo vya TTS vilivyo wazi.
Lugha: en, zh
Sauti ya Clone
IndexTTS-2
Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.
Lugha: en, zh
Sauti ya Clone
Spark TTS
TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.
Lugha: en, zh
Sauti ya Clone
GPT-SoVITS
Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.
Lugha: en, zh, ja, ko
Sauti ya Clone
Chatterbox
Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.
Lugha: en
Sauti ya Clone
Tortoise TTS
Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.
Lugha: en
Sauti ya Clone
OpenVoice
Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.
Lugha: en, zh, ja, ko, fr, de, es, it
Sauti ya Clone
Qwen3 TTS
THAWABU za Aliba zenye lugha nyingi zikiwa na uwezo wa kutokeza sauti, sauti zilizotokezwa kimbele, na ubuni wa sauti kutoka kwenye maandishi.
Lugha: en, zh, ja, ko, de, fr, ru, pt, es, it
Sauti ya Clone
Chatterbox Turbo
Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.
Lugha: en
Sauti ya Clone
VoxCPM
Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.
Lugha: en, zh
Sauti ya Clone
OuteTTS
TTS anayeishi huko CPU, GPU, au skii kupitia llama.cpp and Transformers.js.
Lugha: en
Sauti ya Clone
Pocket TTS
Kimo cha nuru cha 100M cha parameta kilichotungwa na Kyutai kikiwa na sauti inayofanyizwa kutokana na sampuli moja.
Lugha: en, fr
Sauti ya Clone
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Lugha: en, zh, ja, ko, de, es, fr, it, ru
Sauti ya Clone
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Lugha: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Sauti ya Clone
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Lugha: en, zh
Sauti ya CloneMzazi wa Kwanza API
Picha ya mwisho, mifano 22+. Inaunga mkono matumizi halisi ya wakati.
- Muundo wa wazi kabisa
- Matukio Yanayovutia kwa ajili ya programu za wakati halisi
- Kutayarisha Back kwa ajili ya kazi kubwa
- Vituo vya Internet vinavyoonyesha ndoa kati ya ndoa na mtu mwingine
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Njia Rahisi na Inayobadilika
Anzisha mizani unapokua.
Huru
15 sifa
- Kokoro, Piper, VITS, MeloTTS
- Mpaka 500 wa herufi
- 3 gen/hour (hakuna hesabu)
keyboard label
Namba 500 za mikopo/miezi
- Waigaji wote 22+
- Watoto 100,000 kwa kila kizazi
- Sauti Yaungana
Project
2,000 Sh. Sh.
- Kila Kitu Kinaanza
- Njia ya kuingia
- Matayarisho ya Kabla ya Ndoa
Biashara
10,000 sifa/miezi
- Kila Kitu cha Kutoa
- Bulk API
- Sehemu ya mbele ya foleni
Maswali Ambayo Watu Huuliza Mara Nyingi
Uwezo wako wa kutatua matatizo ni nini?
Anza Kutumia Sauti ya Mimi Leo
Jiunge na Wafanyizaji, wajenzi, na biashara kwa kutumia TTS.ai