Huru AI Text to Speech

20+ Watukufu, wema. 107+ Na zikaeneza maeneo yote! 32+ Hakuna simulizi lililohitajiwa.

1K+
Wavumbuzi
2K+
vizazi
20+
Waigaji wa AI
107+
sauti
0/500 wahusika Huru
TTS.ai? Waeleze rafiki zako!

20+ Maumbo ya Sauti

Ukurasa wa makini zaidi wa wasifu wa TTS ulio wazi katika jukwaa moja

KokoroKokoro Free

Kokoro ni mfano wa parameta milioni 82 ambao hupiga ngumi juu ya tabaka lake la uzani. Licha ya ukubwa wake mdogo, hiyo hutokeza sauti ya asili na ya ndani sana. Kokoro huunga mkono lugha mbalimbali ikiwa ni pamoja na Kiingereza, Kijapani, Kichina, na Kikorea kwa sauti za namna mbalimbali.

Faida kwa: ZENYE Umaarufu wa juu usio na matumizi mengi, na matumizi mengi

Jaribu Kuwa Huru

PiperPiper Free

Piper ni injini nyepesi iliyoundwa na Rhaspy ambayo hutumia muundo wa herufi za VITS na kikoromeo. Inatumia sana CPU, na kuifanya ifae sana kwa vifaa vya kisasa, kuendesha magari ya nyumbani, na maombi yanayohitaji alama ya TTS. Kwa zaidi ya sauti 100 katika lugha 30+, Piper anatoa hotuba ya asili kwa mwendo halisi wa kasi sana hata katika Raspberry Pi. 4.

Faida kwa: Matangulizi ya haraka, uwezekano wa kupata habari, na matumizi yaliyokazwa

Jaribu Kuwa Huru

VITSVITS Free

VITS (Viaritional Inference With adstarial o -to-end Text-to-Speech) ni njia inayofanana na hiyo inayotokeza sauti za kiasili zaidi kuliko violezo viwili vya sasa vya jukwaani. Inatumia mitiririko tofauti - tofauti iliyoongezwa kwa mitiririko ya kawaida na utaratibu wa uelimishaji, ikitimiza maendeleo makubwa katika hali ya asili.

Faida kwa: Maandishi ya msingi-to-speech yenye mambo ya asili

Jaribu Kuwa Huru

MeloTTSMeloTTS Free

KIKUNDI cha MySlah.i ni maktaba ya lugha nyingi inayounga mkono Kiingereza (Amerika, Kiingereza, Kihindi, Kiaustralia), Kihispania, Kichina, Kijapani, na Kikorea. Ni ya haraka sana, inashughulikia maandishi kwa mwendo wa karibu wakati wote katika CPU peke yake. MeloTS imebuniwa kwa ajili ya matumizi ya uzalishaji na utegemezo wa CPU na GPU inference.

Faida kwa: Matumizi ya Utayarishaji Wenye Kuhitaji TTS

Jaribu Kuwa Huru

BarkBark Standard

Muundo wa maandishi -to-audio unaotokeza maneno, muziki, na sauti halisi.

Develer: Suno · License: MIT

Jaribu kufanya hivyo

Bark SmallBark Small Standard

Aina ya nuru ya Bark ikiwa na kiasi cha haraka zaidi cha kumbukumbu na utumizi wa chini zaidi.

Develer: Suno · License: MIT

Jaribu kufanya hivyo

CosyVoice 2CosyVoice 2 Standard

Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.

Develer: Alibaba (Tongyi Lab) · License: Apache 2.0

Jaribu kufanya hivyo

Dia TTSDia TTS Standard

Muundo wa viyombe vya kinenani unaotokeza mazungumzo ya kiasili kati ya wasemaji.

Develer: Nari Labs · License: Apache 2.0

Jaribu kufanya hivyo

Parler TTSParler TTS Standard

Eleza sauti unayotaka katika lugha ya asili na Parler hutokeza usemi unaofanana.

Develer: Hugging Face · License: Apache 2.0

Jaribu kufanya hivyo

GLM-TTSGLM-TTS Standard

Hutimiza kiwango cha chini zaidi cha makosa ya tabia miongoni mwa violezo vya TTS vilivyo wazi.

Develer: Zhipu AI · License: GLM-4 License

Jaribu kufanya hivyo

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.

Develer: Index Team · License: Bilibili Model License

Jaribu kufanya hivyo

Spark TTSSpark TTS Standard

TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.

Develer: SparkAudio · License: CC BY-NC-SA 4.0

Jaribu kufanya hivyo

GPT-SoVITSGPT-SoVITS Standard

Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.

Develer: RVC-Boss · License: MIT

Jaribu kufanya hivyo

OrpheusOrpheus Standard

KISA cha hisia - moyo kilichotayarishwa kwa muda wa saa 100 za data za usemi.

Develer: Canopy Labs · License: Llama 3.2 Community

Jaribu kufanya hivyo

Qwen3 TTSQwen3 TTS Standard

THAWABU za Aliba zenye lugha nyingi zikiwa na uwezo wa kutokeza sauti, sauti zilizotokezwa kimbele, na ubuni wa sauti kutoka kwenye maandishi.

Develer: Alibaba (Qwen) · License: Apache 2.0

Jaribu kufanya hivyo

ChatterboxChatterbox Premium

Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.

Ubora:

Jaribu kufanya hivyo

Tortoise TTSTortoise TTS Premium

Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.

Ubora:

Jaribu kufanya hivyo

StyleTTS 2StyleTTS 2 Premium

Maandishi ya binadamu-level-to-speech kupitia mtindo wa usambazaji na mafunzo.

Ubora:

Jaribu kufanya hivyo

OpenVoiceOpenVoice Premium

Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.

Ubora:

Jaribu kufanya hivyo

Sesame CSMSesame CSM Premium

Usemi wa mazungumzo hutokeza mazungumzo ya asili kwa wakati ufaao na hisia - moyo.

Ubora:

Jaribu kufanya hivyo

CosyVoice 2CosyVoice 2

Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.

Lugha: en, zh, ja, ko, fr, de, it, es

Sauti ya Clone

GLM-TTSGLM-TTS

Hutimiza kiwango cha chini zaidi cha makosa ya tabia miongoni mwa violezo vya TTS vilivyo wazi.

Lugha: en, zh

Sauti ya Clone

IndexTTS-2IndexTTS-2

Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.

Lugha: en, zh

Sauti ya Clone

Spark TTSSpark TTS

TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.

Lugha: en, zh

Sauti ya Clone

GPT-SoVITSGPT-SoVITS

Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.

Lugha: en, zh, ja, ko

Sauti ya Clone

ChatterboxChatterbox

Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.

Lugha: en

Sauti ya Clone

Tortoise TTSTortoise TTS

Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.

Lugha: en

Sauti ya Clone

OpenVoiceOpenVoice

Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.

Lugha: en, zh, ja, ko, fr, de, es, it

Sauti ya Clone

Qwen3 TTSQwen3 TTS

THAWABU za Aliba zenye lugha nyingi zikiwa na uwezo wa kutokeza sauti, sauti zilizotokezwa kimbele, na ubuni wa sauti kutoka kwenye maandishi.

Lugha: en, zh, ja, ko, de, fr, ru, pt, es, it

Sauti ya Clone

Mzazi wa Kwanza API

Picha ya mwisho, mifano 22+. Inaunga mkono matumizi halisi ya wakati.

  • Muundo wa wazi kabisa
  • Matukio Yanayovutia kwa ajili ya programu za wakati halisi
  • Kutayarisha Back kwa ajili ya kazi kubwa
  • Vituo vya Internet vinavyoonyesha ndoa kati ya ndoa na mtu mwingine
Mwono API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Njia Rahisi na Inayobadilika

Anzisha mizani unapokua.

Huru

$0

15 sifa

  • Kokoro, Piper, VITS, MeloTTS
  • Mpaka 500 wa herufi
  • 3 gen/hour (hakuna hesabu)
Fanyeni Ishara kwa Hiari

keyboard label

$9/mo

Namba 500 za mikopo/miezi

  • Waigaji wote 22+
  • 100,000 chars per generation
  • Sauti Yaungana
Anza
Wanapendwa Sana

Project

$29/mo

2,000 Sh. Sh.

  • Kila Kitu Kinaanza
  • Njia ya kuingia
  • Matayarisho ya Kabla ya Ndoa
Fanya Maendeleo

Biashara

$99/mo

10,000 sifa/miezi

  • Kila Kitu cha Kutoa
  • Bulk API
  • Sehemu ya mbele ya foleni
Tafuta Biashara

Ona mipango yote kutia ndani makundi ya wahusika →

Maswali Ambayo Watu Huuliza Mara Nyingi

TTS.ai ndio jukwaa la sauti la AI, linalotoa violezo 22-to-speech, uundaji wa sauti, uandishi wa sauti, na vyombo vya sauti.

Ndiyo, TTS.ai wanatuma ujumbe huru na Kokoro, Piper, VITS, na MeloTS. Hakuna akaunti inayotakiwa.

Kwa mwendo wa kasi, tumia Kokoro au Piper. Kwa ubora, jaribuni CosyVoice 2 au StyTTS 2. Ili ufanyizaji wa sauti, tumia alama Chatterbox au GPT-SHITS.

Ndiyo. Hebu openAI-kisidentity RES API for TTS, STST, uundaji wa sauti, na vyombo vya sauti. Inapatikana kwenye Propo (139/mo) na mipango (dola 99/mo). Tas ploment in tts.ai/api/.

Sifa ya sauti hutofautiana kwa muundo wa kimitindo kama CosyVoice 2, na Chatterboksi hutokeza karibu hotuba ya ubora wa binadamu yenye asili ya taifa na hisia. Maumbo huru kama Kokoro hutoa ubora bora kabisa kwa ajili ya visa vingi.

Jarida la Kiingereza (TTS.ai) linaunga mkono lugha 30+ katika maktaba yake ya mfano.

Sisi hatuweki habari zako kwenye kompyuta baada ya kuzitoa. Tunatumia sauti zilizopakiwa kwa ajili ya kipindi cha sasa na hatujazihifadhi.

Sauti zote zilizotokezwa kwa TTS.ai ni zako kutumia biashara, ikiwa ni pamoja na video za YouTube, podikasti, vitabu vya sauti, programu za matangazo, na bidhaa.

TTS.ai inaamsha sauti kwenye tovuti ya WAV kwa kiwango cha juu kabisa. Unaweza kubadilisha kuwa MP3, FAC, OGG, au M4A kwa kutumia chombo chetu cha bure cha Audio Transformer. API inaunga mkono kuonyesha wazi muundo wako unaopendelewa wa kitokezwaji moja kwa moja katika ombi hilo.

Pakua kidokezo kifupi cha sauti (kufikia sekunde 5) ya sauti unayotaka kuunda, kisha chapa maandishi yoyote ili kutokeza sauti hiyo.

Waigaji huru (Kokoro, Piper, VITS, MeloTTS) hawahitaji akaunti na gharama za wahusika. Mifano ya kawaida (2,000/1K input) ni pamoja na Bark, CosyVoice 2, F5-TTSS, na Dia. Premium violezo (wahusika 14,000/1K input) ikiwa ni pamoja na kipenVoice, Chatterbox, SCRS 2, na Tortoise. Kwa ujumla, wanamitindoa kadhalika hutoa sauti za juu zaidi, sauti na sauti za ziada.

Ndiyo. API inaunga mkono hatua za kubadili maandishi mengi ya kusema. Ruhusu maombi mengi na kupata matokeo kwa kutumia kazi ya UUIDs. Mipango ya kuingilia (dola 99/mo) inajumuisha nafasi za kwanza za kazi kwa ajili ya utengenezaji wa haraka zaidi. Mafaa kwa ajili ya utokezaji wa vitabu vya sauti, masomo, na miradi mikubwa ya sauti.
4.0/5 (8)

Anza Kutumia Sauti ya Mimi Leo

Jiunge na Wafanyizaji, wajenzi, na biashara kwa kutumia TTS.ai