Huru AI Text to Speech

31+ Watukufu, wema. 231+ Na zikaeneza maeneo yote! 34+ Hakuna simulizi lililohitajiwa.

8K+
Wavumbuzi
30K+
vizazi
31+
Waigaji wa AI
231+
sauti
0/500 wahusika · Sign up for 5,000 per generation → Huru
Waeleze rafiki zako kuhusu mapenzi ya TTS.ai?

Kila Kitu Unachohitaji kwa Sauti

30+ Vifaa vinavyoendeshwa na wanamitindo wa AI

31+ Maumbo ya Sauti

Ukurasa wa makini zaidi wa wasifu wa TTS ulio wazi katika jukwaa moja

KokoroKokoro Free

Kokoro ni mfano wa parameta milioni 82 ambao hupiga ngumi juu ya tabaka lake la uzani. Licha ya ukubwa wake mdogo, hiyo hutokeza sauti ya asili na ya ndani sana. Kokoro huunga mkono lugha mbalimbali ikiwa ni pamoja na Kiingereza, Kijapani, Kichina, na Kikorea kwa sauti za namna mbalimbali.

Faida kwa: ZENYE Umaarufu wa juu usio na matumizi mengi, na matumizi mengi

Jaribu Kuwa Huru

PiperPiper Free

Piper ni injini nyepesi iliyoundwa na Rhaspy ambayo hutumia muundo wa herufi za VITS na kikoromeo. Inatumia sana CPU, na kuifanya ifae sana kwa vifaa vya kisasa, kuendesha magari ya nyumbani, na maombi yanayohitaji alama ya TTS. Kwa zaidi ya sauti 100 katika lugha 30+, Piper anatoa hotuba ya asili kwa mwendo halisi wa kasi sana hata katika Raspberry Pi. 4.

Faida kwa: Matangulizi ya haraka, uwezekano wa kupata habari, na matumizi yaliyokazwa

Jaribu Kuwa Huru

VITSVITS Free

VITS (Viaritional Inference With adstarial o -to-end Text-to-Speech) ni njia inayofanana na hiyo inayotokeza sauti za kiasili zaidi kuliko violezo viwili vya sasa vya jukwaani. Inatumia mitiririko tofauti - tofauti iliyoongezwa kwa mitiririko ya kawaida na utaratibu wa uelimishaji, ikitimiza maendeleo makubwa katika hali ya asili.

Faida kwa: Maandishi ya msingi-to-speech yenye mambo ya asili

Jaribu Kuwa Huru

MeloTTSMeloTTS Free

KIKUNDI cha MySlah.i ni maktaba ya lugha nyingi inayounga mkono Kiingereza (Amerika, Kiingereza, Kihindi, Kiaustralia), Kihispania, Kichina, Kijapani, na Kikorea. Ni ya haraka sana, inashughulikia maandishi kwa mwendo wa karibu wakati wote katika CPU peke yake. MeloTS imebuniwa kwa ajili ya matumizi ya uzalishaji na utegemezo wa CPU na GPU inference.

Faida kwa: Matumizi ya Utayarishaji Wenye Kuhitaji TTS

Jaribu Kuwa Huru

OuteTTSOuteTTS Free

Shirika hilo linaunga mkono wasifu wa lugha wenye uwezo wa kutafsiri na kuhifadhi majengo ya awali. Inaunga mkono sehemu mbalimbali za nyuma ikiwa ni pamoja na lama.cpp (CPU/GPU), Hilling Facevace Transformers, ExLlaV2, VLM, na hata ovarificsion inference kupitia Transformer.js. Expots-shot fous foot kupitia wazungumzaji waliookolewa kama JSON.

Faida kwa: Usafiri wa kasi, mazingira ya TTS yenye kupitiwa - pitia, yaliyo chini ya ardhi

Jaribu Kuwa Huru

Pocket TTSPocket TTS Free

Proet TTS ya Kyutai (waratibu wa Mishi) ni kishikizo kikubwa cha 100M cha parameta -to-speech ambacho husugua sana juu ya uzito wake. Kinatenda kwa ustadi katika CPU, kinaunga mkono sauti ya sufuri -hot inayotokana na sampuli moja ya sauti ya sauti, na kutokeza usemi wa asili. Ukubwa mdogo wa kigezo huifanya ifae kwa ajili ya uratibu na mazingira ya chini.

Faida kwa: Vyombo vya kupunguza uzito, mazingira ya Tupu, sauti ya haraka inayoibuka

Jaribu Kuwa Huru

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Faida kwa: Fast lightweight TTS, edge deployment, low-latency applications

Jaribu Kuwa Huru

BarkBark Standard

Muundo wa maandishi -to-audio unaotokeza maneno, muziki, na sauti halisi.

Develer: Suno · License: MIT

Jaribu kufanya hivyo

Bark SmallBark Small Standard

Aina ya nuru ya Bark ikiwa na kiasi cha haraka zaidi cha kumbukumbu na utumizi wa chini zaidi.

Develer: Suno · License: MIT

Jaribu kufanya hivyo

CosyVoice 2CosyVoice 2 Standard

Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.

Develer: Alibaba (Tongyi Lab) · License: Apache 2.0

Jaribu kufanya hivyo

Dia TTSDia TTS Standard

Muundo wa viyombe vya kinenani unaotokeza mazungumzo ya kiasili kati ya wasemaji.

Develer: Nari Labs · License: Apache 2.0

Jaribu kufanya hivyo

Parler TTSParler TTS Standard

Eleza sauti unayotaka katika lugha ya asili na Parler hutokeza usemi unaofanana.

Develer: Hugging Face · License: Apache 2.0

Jaribu kufanya hivyo

GLM-TTSGLM-TTS Standard

Hutimiza kiwango cha chini zaidi cha makosa ya tabia miongoni mwa violezo vya TTS vilivyo wazi.

Develer: Zhipu AI · License: GLM-4 License

Jaribu kufanya hivyo

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.

Develer: Index Team · License: Bilibili Model License

Jaribu kufanya hivyo

Spark TTSSpark TTS Standard

TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.

Develer: SparkAudio · License: CC BY-NC-SA 4.0

Jaribu kufanya hivyo

GPT-SoVITSGPT-SoVITS Standard

Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.

Develer: RVC-Boss · License: MIT

Jaribu kufanya hivyo

OrpheusOrpheus Standard

KISA cha hisia - moyo kilichotayarishwa kwa muda wa saa 100 za data za usemi.

Develer: Canopy Labs · License: Llama 3.2 Community

Jaribu kufanya hivyo

Qwen3 TTSQwen3 TTS Standard

THAWABU za Aliba zenye lugha nyingi zikiwa na uwezo wa kutokeza sauti, sauti zilizotokezwa kimbele, na ubuni wa sauti kutoka kwenye maandishi.

Develer: Alibaba (Qwen) · License: Apache 2.0

Jaribu kufanya hivyo

Chatterbox TurboChatterbox Turbo Standard

Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.

Develer: Resemble AI · License: MIT

Jaribu kufanya hivyo

Dia 2Dia 2 Standard

Majadiliano ya kwanza-TTS yenye mazungumzo ya namna mbalimbali na ishara za kiupuuzi.

Develer: Nari Labs · License: Apache 2.0

Jaribu kufanya hivyo

VoxCPMVoxCPM Standard

Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.

Develer: OpenBMB · License: Apache 2.0

Jaribu kufanya hivyo

TADATADA Standard

Magamba mawili yenye pande mbili za maandishi, 5ksi kwa kasi zaidi kuliko LLM TTS.

Develer: Hume AI · License: MIT

Jaribu kufanya hivyo

VibeVoiceVibeVoice Standard

Picha ndogo kwa ajili ya maudhui ya muda mrefu ya lugha mbalimbali kama vile podikasti na rekodi za sauti.

Develer: Microsoft · License: MIT

Jaribu kufanya hivyo

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Develer: Alibaba (FunAudioLLM) · License: Apache 2.0

Jaribu kufanya hivyo

ChatterboxChatterbox Premium

Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.

Ubora:

Jaribu kufanya hivyo

Tortoise TTSTortoise TTS Premium

Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.

Ubora:

Jaribu kufanya hivyo

StyleTTS 2StyleTTS 2 Premium

Maandishi ya binadamu-level-to-speech kupitia mtindo wa usambazaji na mafunzo.

Ubora:

Jaribu kufanya hivyo

OpenVoiceOpenVoice Premium

Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.

Ubora:

Jaribu kufanya hivyo

Sesame CSMSesame CSM Premium

Usemi wa mazungumzo hutokeza mazungumzo ya asili kwa wakati ufaao na hisia - moyo.

Ubora:

Jaribu kufanya hivyo

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Ubora:

Jaribu kufanya hivyo

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Ubora:

Jaribu kufanya hivyo

CosyVoice 2CosyVoice 2

Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.

Lugha: en, zh, ja, ko, fr, de, it, es

Sauti ya Clone

GLM-TTSGLM-TTS

Hutimiza kiwango cha chini zaidi cha makosa ya tabia miongoni mwa violezo vya TTS vilivyo wazi.

Lugha: en, zh

Sauti ya Clone

IndexTTS-2IndexTTS-2

Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.

Lugha: en, zh

Sauti ya Clone

Spark TTSSpark TTS

TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.

Lugha: en, zh

Sauti ya Clone

GPT-SoVITSGPT-SoVITS

Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.

Lugha: en, zh, ja, ko

Sauti ya Clone

ChatterboxChatterbox

Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.

Lugha: en

Sauti ya Clone

Tortoise TTSTortoise TTS

Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.

Lugha: en

Sauti ya Clone

OpenVoiceOpenVoice

Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.

Lugha: en, zh, ja, ko, fr, de, es, it

Sauti ya Clone

Qwen3 TTSQwen3 TTS

THAWABU za Aliba zenye lugha nyingi zikiwa na uwezo wa kutokeza sauti, sauti zilizotokezwa kimbele, na ubuni wa sauti kutoka kwenye maandishi.

Lugha: en, zh, ja, ko, de, fr, ru, pt, es, it

Sauti ya Clone

Chatterbox TurboChatterbox Turbo

Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.

Lugha: en

Sauti ya Clone

VoxCPMVoxCPM

Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.

Lugha: en, zh

Sauti ya Clone

OuteTTSOuteTTS

TTS anayeishi huko CPU, GPU, au skii kupitia llama.cpp and Transformers.js.

Lugha: en

Sauti ya Clone

Pocket TTSPocket TTS

Kimo cha nuru cha 100M cha parameta kilichotungwa na Kyutai kikiwa na sauti inayofanyizwa kutokana na sampuli moja.

Lugha: en, fr

Sauti ya Clone

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Lugha: en, zh, ja, ko, de, es, fr, it, ru

Sauti ya Clone

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Lugha: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Sauti ya Clone

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Lugha: en, zh

Sauti ya Clone

Mzazi wa Kwanza API

Picha ya mwisho, mifano 22+. Inaunga mkono matumizi halisi ya wakati.

  • Muundo wa wazi kabisa
  • Matukio Yanayovutia kwa ajili ya programu za wakati halisi
  • Kutayarisha Back kwa ajili ya kazi kubwa
  • Vituo vya Internet vinavyoonyesha ndoa kati ya ndoa na mtu mwingine
Mwono API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Njia Rahisi na Inayobadilika

Anzisha mizani unapokua.

Huru

$0

15 sifa

  • Kokoro, Piper, VITS, MeloTTS
  • Mpaka 500 wa herufi
  • 3 gen/hour (hakuna hesabu)
Fanyeni Ishara kwa Hiari

keyboard label

$9/mo

Namba 500 za mikopo/miezi

  • Waigaji wote 22+
  • Watoto 100,000 kwa kila kizazi
  • Sauti Yaungana
Anza
Wanapendwa Sana

Project

$29/mo

2,000 Sh. Sh.

  • Kila Kitu Kinaanza
  • Njia ya kuingia
  • Matayarisho ya Kabla ya Ndoa
Fanya Maendeleo

Biashara

$99/mo

10,000 sifa/miezi

  • Kila Kitu cha Kutoa
  • Bulk API
  • Sehemu ya mbele ya foleni
Tafuta Biashara

Ona mipango yote kutia ndani makundi ya wahusika →

Maswali Ambayo Watu Huuliza Mara Nyingi

TTS.ai ni jukwaa la sauti la AI, linalotoa mifano 22+ ya maandishi, uundaji wa sauti, uandishi wa sauti, na vyombo vya sauti.

Ndiyo, TTS.ai wanatuma ujumbe huru na Kokoro, Piper, VITS, na MeloTS. Hakuna akaunti inayotakiwa.

Kwa mwendo wa kasi, tumia Kokoro au Piper. Kwa ubora, jaribuni CosyVoice 2 au StyTTS 2. Ili ufanyizaji wa sauti, tumia alama Chatterbox au GPT-SHITS.

Ndiyo. Hebu openAI-kisidentity RES API for TTS, STST, uundaji wa sauti, na vyombo vya sauti. Inapatikana kwenye Propo (139/mo) na mipango (dola 99/mo). Tas ploment in tts.ai/api/.

Sifa ya sauti hutofautiana kwa muundo wa kimitindo kama CosyVoice 2, na Chatterboksi hutokeza karibu hotuba ya ubora wa binadamu yenye asili ya taifa na hisia. Maumbo huru kama Kokoro hutoa ubora bora kabisa kwa ajili ya visa vingi.

Lugha TTS.ai zinaunga mkono lugha 30+ katika maktaba yake ya mfano. Kiingereza kina utegemezo mkubwa zaidi, lakini violezo kama CosyVoice 2 vya jalada la Kichina, Kijapani, na Korea; GPT-SSITS hushughulikia Kichina, Kijapani, Kikorea, na Kiingereza; na MeloTS hutegemeza Kiingereza, Kihispania, Kifaransa, Kichina, Kijapani, na Kikorea.

Sisi hatuweki habari zako kwenye kompyuta baada ya kuzitoa. Tunatumia sauti zilizopakiwa kwa ajili ya kipindi cha sasa na hatujazihifadhi.

Sauti zote zilizotokezwa kwa TTS.ai ni zako kutumia biashara, ikiwa ni pamoja na video za YouTube, podikasti, vitabu vya sauti, programu za matangazo, na bidhaa.

Watu TTS.ai wanatengeneza sauti katika tovuti ya WAV kwa kukosa kiwango cha juu kabisa. Unaweza kubadilisha kuwa MP3, FARAC, OGG, au M4A kwa kutumia chombo chetu cha bure cha Audio Aurelier.

Pakua kidokezo kifupi cha sauti (kufikia sekunde 5) ya sauti unayotaka kuunda, kisha chapa maandishi yoyote ili kutokeza sauti hiyo.

Waigaji huru (Kokoro, Piper, VITS, MeloTTS) hawahitaji akaunti na gharama za wahusika. Mifano ya kawaida (2,000/1K input) ni pamoja na Bark, CosyVoice 2, F5-TTSS, na Dia. Premium violezo (wahusika 14,000/1K input) ikiwa ni pamoja na kipenVoice, Chatterbox, SCRS 2, na Tortoise. Kwa ujumla, wanamitindoa kadhalika hutoa sauti za juu zaidi, sauti na sauti za ziada.

Ndiyo. API inaunga mkono hatua za kubadili maandishi mengi ya kusema. Ruhusu maombi mengi na kupata matokeo kwa kutumia kazi ya UUIDs. Mipango ya kuingilia (dola 99/mo) inajumuisha nafasi za kwanza za kazi kwa ajili ya utengenezaji wa haraka zaidi. Mafaa kwa ajili ya utokezaji wa vitabu vya sauti, masomo, na miradi mikubwa ya sauti.
4.1/5 (21)

Uwezo wako wa kutatua matatizo ni nini?

Anza Kutumia Sauti ya Mimi Leo

Jiunge na Wafanyizaji, wajenzi, na biashara kwa kutumia TTS.ai