Huru AI Text to Speech
33+ Watukufu, wema. 273+ Na zikaeneza maeneo yote! 33+ Hakuna simulizi lililohitajiwa.
Kila Kitu Unachohitaji kwa Sauti
30+ Vifaa vinavyoendeshwa na wanamitindo wa AI
33+ Maumbo ya Sauti
Ukurasa wa makini zaidi wa wasifu wa TTS ulio wazi katika jukwaa moja
Kokoro Huru
Kokoro ni mfano wa parameta milioni 82 ambao hupiga ngumi juu ya tabaka lake la uzani. Licha ya ukubwa wake mdogo, hiyo hutokeza sauti ya asili na ya ndani sana. Kokoro huunga mkono lugha mbalimbali ikiwa ni pamoja na Kiingereza, Kijapani, Kichina, na Kikorea kwa sauti za namna mbalimbali.
Faida kwa: ZENYE Umaarufu wa juu usio na matumizi mengi, na matumizi mengi
Jaribu Kuwa Huru
Piper Huru
Piper ni injini nyepesi iliyoundwa na Rhaspy ambayo hutumia muundo wa herufi za VITS na kikoromeo. Inatumia sana CPU, na kuifanya ifae sana kwa vifaa vya kisasa, kuendesha magari ya nyumbani, na maombi yanayohitaji alama ya TTS. Kwa zaidi ya sauti 100 katika lugha 30+, Piper anatoa hotuba ya asili kwa mwendo halisi wa kasi sana hata katika Raspberry Pi. 4.
Faida kwa: Matangulizi ya haraka, uwezekano wa kupata habari, na matumizi yaliyokazwa
Jaribu Kuwa Huru
VITS Huru
VITS (Viaritional Inference With adstarial o -to-end Text-to-Speech) ni njia inayofanana na hiyo inayotokeza sauti za kiasili zaidi kuliko violezo viwili vya sasa vya jukwaani. Inatumia mitiririko tofauti - tofauti iliyoongezwa kwa mitiririko ya kawaida na utaratibu wa uelimishaji, ikitimiza maendeleo makubwa katika hali ya asili.
Faida kwa: Maandishi ya msingi-to-speech yenye mambo ya asili
Jaribu Kuwa Huru
MeloTTS Huru
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Faida kwa: Matumizi ya Utayarishaji Wenye Kuhitaji TTS
Jaribu Kuwa Huru
Kani TTS 2 Huru
Kani-TTTS-2 na AXNIneSix ni kielelezo kidogo sana cha joto cha 400M cha parater kilichojengwa kwa iquid Ama LFM2 juu ya uti wa mgongo na NVIDIA NanoCodec. Inaendeshwa kwa sekunde 3GB VRAM na inatengeneza sekunde 10 za usemi katika faida ya A100 (RTF 0.2).
Faida kwa: Kizazi cha Kiingereza kilichofungwa kwa vifaa vya chini vya kudhibiti matumizi, picha fupi
Jaribu Kuwa Huru
OuteTTS Huru
Shirika hilo linaunga mkono wasifu wa lugha wenye uwezo wa kutafsiri na kuhifadhi majengo ya awali. Inaunga mkono sehemu mbalimbali za nyuma ikiwa ni pamoja na lama.cpp (CPU/GPU), Hilling Facevace Transformers, ExLlaV2, VLM, na hata ovarificsion inference kupitia Transformer.js. Expots-shot fous foot kupitia wazungumzaji waliookolewa kama JSON.
Faida kwa: Usafiri wa kasi, mazingira ya TTS yenye kupitiwa - pitia, yaliyo chini ya ardhi
Jaribu Kuwa Huru
Pocket TTS Huru
Proet TTS ya Kyutai (waratibu wa Mishi) ni kishikizo kikubwa cha 100M cha parameta -to-speech ambacho husugua sana juu ya uzito wake. Kinatenda kwa ustadi katika CPU, kinaunga mkono sauti ya sufuri -hot inayotokana na sampuli moja ya sauti ya sauti, na kutokeza usemi wa asili. Ukubwa mdogo wa kigezo huifanya ifae kwa ajili ya uratibu na mazingira ya chini.
Faida kwa: Vyombo vya kupunguza uzito, mazingira ya Tupu, sauti ya haraka inayoibuka
Jaribu Kuwa Huru
Kitten TTS Huru
Kitten TTS ya KittenML ni kifananishi cha uzito wa juu sana kilichojengwa kwenye ONNX. Kina sauti tofauti - tofauti kuanzia 15M hadi 80M (25-80 MB kwenye diski), huwasilisha sauti ya juu ya cynthesis juu ya CPU bila kuhitaji sauti ya GPU. Sauti zilizojengwa 8-in, mwendo wa sauti unaoweza kurekebishwa, na maandishi yaliyofanyizwa kwa ajili ya nambari, fedha, na vipengele.
Faida kwa: TTS nyepesi, programu za kisasa, programu za kupunguza uzito
Jaribu Kuwa Huru
Ming-Omni TTS Huru
Ming-omni-tts - 0.5B kwa kuijumuisha AI ni mfano wa sauti uliounganishwa na omni-modal uliojengwa juu ya BailingMM ulio na uti wa mgongo wa Patch-by-Patch spiple-matting ound decoder. Hues 44.1kHz (karibu na ubora wa CD), hutegemeza sauti ya sufuri kutoka kwa rejezeo la tatu+ la pili, na hutia ndani hisia - moyo / matamshi / USM kudhibiti sauti / JMSON.[8]
Faida kwa: Maelezo ya hali ya juu yenye lugha mbili, sauti inayoongozwa na hisia ikitenda, vitabu vya sauti vya Kichina
Jaribu Kuwa Huru
MOSS-TTS Nano Huru
MOS-TTS-Naano-100M ni kampuni ya OpenMOS iliyo na ukubwa wa 100M-parameta tofauti ya familia ya MOS-TTS, ikishiriki ujenzi wa majengo yaliyochelewa.
Faida kwa: Utokezaji wa bure wa TTS, matokeo ya juu ya mageuzi, matumizi yasiyo makali sana
Jaribu Kuwa Huru
Bark Kiwango
Muundo wa maandishi -to-audio unaotokeza maneno, muziki, na sauti halisi.
Develer: Suno · License: MIT
Jaribu kufanya hivyo
Bark Small Kiwango
Aina ya nuru ya Bark ikiwa na kiasi cha haraka zaidi cha kumbukumbu na utumizi wa chini zaidi.
Develer: Suno · License: MIT
Jaribu kufanya hivyo
CosyVoice 2 Kiwango
Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.
Develer: Alibaba (Tongyi Lab) · License: Apache 2.0
Jaribu kufanya hivyo
Dia TTS Kiwango
Muundo wa viyombe vya kinenani unaotokeza mazungumzo ya kiasili kati ya wasemaji.
Develer: Nari Labs · License: Apache 2.0
Jaribu kufanya hivyo
Parler TTS Kiwango
Eleza sauti unayotaka katika lugha ya asili na Parler hutokeza usemi unaofanana.
Develer: Hugging Face · License: Apache 2.0
Jaribu kufanya hivyo
IndexTTS-2 Kiwango
Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.
Develer: Index Team · License: Bilibili Model License
Jaribu kufanya hivyo
Spark TTS Kiwango
TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.
Develer: SparkAudio · License: CC BY-NC-SA 4.0
Jaribu kufanya hivyo
GPT-SoVITS Kiwango
Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.
Develer: RVC-Boss · License: MIT
Jaribu kufanya hivyo
Orpheus Kiwango
Human-level emotional TTS model trained on 100K hours of speech data.
Develer: Canopy Labs · License: Llama 3.2 Community
Jaribu kufanya hivyo
Qwen3 TTS Kiwango
THAWABU za Aliba zenye lugha nyingi zikiwa na sauti na muundo wa sauti kutoka kwenye maandishi.
Develer: Alibaba (Qwen) · License: Apache 2.0
Jaribu kufanya hivyo
VieNeu-TTS-v2 Kiwango
Kivietnam + English-kuanzisha alama za TTS kwa sauti 7 na sauti ya wazi inayoibuka. CPU-put, hakuna GPU iliyotaka.
Develer: Phạm Nguyễn Ngọc Bảo · License: Apache 2.0
Jaribu kufanya hivyo
Chatterbox Turbo Kiwango
Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.
Develer: Resemble AI · License: MIT
Jaribu kufanya hivyo
VoxCPM Kiwango
Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.
Develer: OpenBMB · License: Apache 2.0
Jaribu kufanya hivyo
VibeVoice Kiwango
Picha ndogo kwa ajili ya maudhui ya muda mrefu ya lugha mbalimbali kama vile podikasti na rekodi za sauti.
Develer: Microsoft · License: MIT
Jaribu kufanya hivyo
CosyVoice3 Kiwango
TEKNOHAMA ZA TEKNOHAMA ZA TEKANA kwa kutumia vishindo viwili, udhibiti wa hisia za moyoni, na sauti ya sufuri inayoibuka.
Develer: Alibaba (FunAudioLLM) · License: Apache 2.0
Jaribu kufanya hivyo
NAMAA Saudi TTS Kiwango
Mara ya kwanza ya kufungua lugha ya Saudi-Arabu. lahaja ya wenyeji wa Saudi Arabia yenye sauti ya Chatterbox-sawa na ya ki-Slaya.
Develer: NAMAA Space · License: MIT
Jaribu kufanya hivyo
Darwin TTS Kiwango
Lugha ya Cross-modal Qwen3-TTTS inatofautiana na FFN zilizochanganywa na muundo wa lugha ya Qwen3- 1.7B kwa ajili ya ufanyizaji wa lugha kwa lugha zilizo tata zaidi.
Develer: FINAL-Bench · License: Apache 2.0
Jaribu kufanya hivyo
MOSS-TTSD Kiwango
Majadiliano ya namna hiyo ya kuendeleza mazungumzo ya namna mbalimbali ya ki-Multi-Peter huamsha mazungumzo ya kimitindo pamoja na wazungumzaji wapatao 5 na dakika 60 za sauti zenye upatano.
Develer: OpenMOSS · License: Apache 2.0
Jaribu kufanya hivyo
CosyVoice 2
Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.
Lugha: en, zh, ja, ko, fr, de, it, es
Sauti ya Clone
IndexTTS-2
Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.
Lugha: en, zh
Sauti ya Clone
Spark TTS
TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.
Lugha: en, zh
Sauti ya Clone
GPT-SoVITS
Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.
Lugha: en, zh, ja, ko
Sauti ya Clone
Chatterbox
Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.
Lugha: en
Sauti ya Clone
Tortoise TTS
Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.
Lugha: en
Sauti ya Clone
OpenVoice
Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.
Lugha: en, zh, ja, ko, fr, es
Sauti ya Clone
VieNeu-TTS-v2
Kivietnam + English-kuanzisha alama za TTS kwa sauti 7 na sauti ya wazi inayoibuka. CPU-put, hakuna GPU iliyotaka.
Lugha: vi, en
Sauti ya Clone
Chatterbox Turbo
Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.
Lugha: en
Sauti ya Clone
VoxCPM
Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.
Lugha: en, zh
Sauti ya Clone
OuteTTS
TTS anayeishi huko CPU, GPU, au skii kupitia llama.cpp and Transformers.js.
Lugha: en
Sauti ya Clone
Pocket TTS
Kimo cha nuru cha 100M cha parameta kilichotungwa na Kyutai kikiwa na sauti inayofanyizwa kutokana na sampuli moja.
Lugha: en, fr
Sauti ya Clone
CosyVoice3
TEKNOHAMA ZA TEKNOHAMA ZA TEKANA kwa kutumia vishindo viwili, udhibiti wa hisia za moyoni, na sauti ya sufuri inayoibuka.
Lugha: en, zh, ja, ko, de, es, fr, it, ru
Sauti ya Clone
NAMAA Saudi TTS
Mara ya kwanza ya kufungua lugha ya Saudi-Arabu. lahaja ya wenyeji wa Saudi Arabia yenye sauti ya Chatterbox-sawa na ya ki-Slaya.
Lugha: ar
Sauti ya Clone
Darwin TTS
Lugha ya Cross-modal Qwen3-TTTS inatofautiana na FFN zilizochanganywa na muundo wa lugha ya Qwen3- 1.7B kwa ajili ya ufanyizaji wa lugha kwa lugha zilizo tata zaidi.
Lugha: en, ko, ja, zh
Sauti ya Clone
MOSS-TTSD
Majadiliano ya namna hiyo ya kuendeleza mazungumzo ya namna mbalimbali ya ki-Multi-Peter huamsha mazungumzo ya kimitindo pamoja na wazungumzaji wapatao 5 na dakika 60 za sauti zenye upatano.
Lugha: en, zh
Sauti ya Clone
Ming-Omni TTS
Safu ya maneno.5B omni-modal ni mfano kutoka konteAI pamoja na kiwango cha juu cha uzalishaji wa umeme 44.1kHz na sauti ya sufuri inayoibuka.
Lugha: en, zh
Sauti ya Clone
MOSS-TTS Nano
Sehemu ndogo ya 100 M MOSS-TTS hutofautiana na majengo yaleyale, 80x yakiwa madogo zaidi, yasiyo na malipo.
Lugha: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Sauti ya CloneMzazi wa Kwanza API
Picha ya mwisho, mifano 22+. Inaunga mkono matumizi halisi ya wakati.
- Muundo wa wazi kabisa
- Matukio Yanayovutia kwa ajili ya programu za wakati halisi
- Kutayarisha Back kwa ajili ya kazi kubwa
- Vituo vya Internet vinavyoonyesha ndoa kati ya ndoa na mtu mwingine
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Njia Rahisi na Inayobadilika
Anzisha mizani unapokua.
Huru
Wahusika 15,000 + 5,000/day
- 7 Walio huru kutia ndani Kokoro
- Nwari 5,000 kwa kila kizazi
- Njia ya kuingia ni pamoja
keyboard label
Namba 500 za mikopo/miezi
- Waigaji wote 22+
- Watoto 100,000 kwa kila kizazi
- Sauti Yaungana
Project
2,000 Sh. Sh.
- Kila Kitu Kinaanza
- Njia ya kuingia
- Matayarisho ya Kabla ya Ndoa
Biashara
10,000 sifa/miezi
- Kila Kitu cha Kutoa
- Bulk API
- Sehemu ya mbele ya foleni
Maswali Ambayo Watu Huuliza Mara Nyingi
Uwezo wako wa kutatua matatizo ni nini?
Anza Kutumia Sauti ya Mimi Leo
Jiunge na Wafanyizaji, wajenzi, na biashara kwa kutumia TTS.ai