Huru AI Text to Speech

33+ Watukufu, wema. 273+ Na zikaeneza maeneo yote! 33+ Hakuna simulizi lililohitajiwa.

17K+
Wavumbuzi
70K+
vizazi
33+
Waigaji wa AI
273+
sauti
Waeleze rafiki zako kuhusu mapenzi ya TTS.ai?

Kila Kitu Unachohitaji kwa Sauti

30+ Vifaa vinavyoendeshwa na wanamitindo wa AI

33+ Maumbo ya Sauti

Ukurasa wa makini zaidi wa wasifu wa TTS ulio wazi katika jukwaa moja

KokoroKokoro Huru

Kokoro ni mfano wa parameta milioni 82 ambao hupiga ngumi juu ya tabaka lake la uzani. Licha ya ukubwa wake mdogo, hiyo hutokeza sauti ya asili na ya ndani sana. Kokoro huunga mkono lugha mbalimbali ikiwa ni pamoja na Kiingereza, Kijapani, Kichina, na Kikorea kwa sauti za namna mbalimbali.

Faida kwa: ZENYE Umaarufu wa juu usio na matumizi mengi, na matumizi mengi

Jaribu Kuwa Huru

PiperPiper Huru

Piper ni injini nyepesi iliyoundwa na Rhaspy ambayo hutumia muundo wa herufi za VITS na kikoromeo. Inatumia sana CPU, na kuifanya ifae sana kwa vifaa vya kisasa, kuendesha magari ya nyumbani, na maombi yanayohitaji alama ya TTS. Kwa zaidi ya sauti 100 katika lugha 30+, Piper anatoa hotuba ya asili kwa mwendo halisi wa kasi sana hata katika Raspberry Pi. 4.

Faida kwa: Matangulizi ya haraka, uwezekano wa kupata habari, na matumizi yaliyokazwa

Jaribu Kuwa Huru

VITSVITS Huru

VITS (Viaritional Inference With adstarial o -to-end Text-to-Speech) ni njia inayofanana na hiyo inayotokeza sauti za kiasili zaidi kuliko violezo viwili vya sasa vya jukwaani. Inatumia mitiririko tofauti - tofauti iliyoongezwa kwa mitiririko ya kawaida na utaratibu wa uelimishaji, ikitimiza maendeleo makubwa katika hali ya asili.

Faida kwa: Maandishi ya msingi-to-speech yenye mambo ya asili

Jaribu Kuwa Huru

MeloTTSMeloTTS Huru

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Faida kwa: Matumizi ya Utayarishaji Wenye Kuhitaji TTS

Jaribu Kuwa Huru

Kani TTS 2Kani TTS 2 Huru

Kani-TTTS-2 na AXNIneSix ni kielelezo kidogo sana cha joto cha 400M cha parater kilichojengwa kwa iquid Ama LFM2 juu ya uti wa mgongo na NVIDIA NanoCodec. Inaendeshwa kwa sekunde 3GB VRAM na inatengeneza sekunde 10 za usemi katika faida ya A100 (RTF 0.2).

Faida kwa: Kizazi cha Kiingereza kilichofungwa kwa vifaa vya chini vya kudhibiti matumizi, picha fupi

Jaribu Kuwa Huru

OuteTTSOuteTTS Huru

Shirika hilo linaunga mkono wasifu wa lugha wenye uwezo wa kutafsiri na kuhifadhi majengo ya awali. Inaunga mkono sehemu mbalimbali za nyuma ikiwa ni pamoja na lama.cpp (CPU/GPU), Hilling Facevace Transformers, ExLlaV2, VLM, na hata ovarificsion inference kupitia Transformer.js. Expots-shot fous foot kupitia wazungumzaji waliookolewa kama JSON.

Faida kwa: Usafiri wa kasi, mazingira ya TTS yenye kupitiwa - pitia, yaliyo chini ya ardhi

Jaribu Kuwa Huru

Pocket TTSPocket TTS Huru

Proet TTS ya Kyutai (waratibu wa Mishi) ni kishikizo kikubwa cha 100M cha parameta -to-speech ambacho husugua sana juu ya uzito wake. Kinatenda kwa ustadi katika CPU, kinaunga mkono sauti ya sufuri -hot inayotokana na sampuli moja ya sauti ya sauti, na kutokeza usemi wa asili. Ukubwa mdogo wa kigezo huifanya ifae kwa ajili ya uratibu na mazingira ya chini.

Faida kwa: Vyombo vya kupunguza uzito, mazingira ya Tupu, sauti ya haraka inayoibuka

Jaribu Kuwa Huru

Kitten TTSKitten TTS Huru

Kitten TTS ya KittenML ni kifananishi cha uzito wa juu sana kilichojengwa kwenye ONNX. Kina sauti tofauti - tofauti kuanzia 15M hadi 80M (25-80 MB kwenye diski), huwasilisha sauti ya juu ya cynthesis juu ya CPU bila kuhitaji sauti ya GPU. Sauti zilizojengwa 8-in, mwendo wa sauti unaoweza kurekebishwa, na maandishi yaliyofanyizwa kwa ajili ya nambari, fedha, na vipengele.

Faida kwa: TTS nyepesi, programu za kisasa, programu za kupunguza uzito

Jaribu Kuwa Huru

Ming-Omni TTSMing-Omni TTS Huru

Ming-omni-tts - 0.5B kwa kuijumuisha AI ni mfano wa sauti uliounganishwa na omni-modal uliojengwa juu ya BailingMM ulio na uti wa mgongo wa Patch-by-Patch spiple-matting ound decoder. Hues 44.1kHz (karibu na ubora wa CD), hutegemeza sauti ya sufuri kutoka kwa rejezeo la tatu+ la pili, na hutia ndani hisia - moyo / matamshi / USM kudhibiti sauti / JMSON.[8]

Faida kwa: Maelezo ya hali ya juu yenye lugha mbili, sauti inayoongozwa na hisia ikitenda, vitabu vya sauti vya Kichina

Jaribu Kuwa Huru

MOSS-TTS NanoMOSS-TTS Nano Huru

MOS-TTS-Naano-100M ni kampuni ya OpenMOS iliyo na ukubwa wa 100M-parameta tofauti ya familia ya MOS-TTS, ikishiriki ujenzi wa majengo yaliyochelewa.

Faida kwa: Utokezaji wa bure wa TTS, matokeo ya juu ya mageuzi, matumizi yasiyo makali sana

Jaribu Kuwa Huru

BarkBark Kiwango

Muundo wa maandishi -to-audio unaotokeza maneno, muziki, na sauti halisi.

Develer: Suno · License: MIT

Jaribu kufanya hivyo

Bark SmallBark Small Kiwango

Aina ya nuru ya Bark ikiwa na kiasi cha haraka zaidi cha kumbukumbu na utumizi wa chini zaidi.

Develer: Suno · License: MIT

Jaribu kufanya hivyo

CosyVoice 2CosyVoice 2 Kiwango

Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.

Develer: Alibaba (Tongyi Lab) · License: Apache 2.0

Jaribu kufanya hivyo

Dia TTSDia TTS Kiwango

Muundo wa viyombe vya kinenani unaotokeza mazungumzo ya kiasili kati ya wasemaji.

Develer: Nari Labs · License: Apache 2.0

Jaribu kufanya hivyo

Parler TTSParler TTS Kiwango

Eleza sauti unayotaka katika lugha ya asili na Parler hutokeza usemi unaofanana.

Develer: Hugging Face · License: Apache 2.0

Jaribu kufanya hivyo

IndexTTS-2IndexTTS-2 Kiwango

Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.

Develer: Index Team · License: Bilibili Model License

Jaribu kufanya hivyo

Spark TTSSpark TTS Kiwango

TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.

Develer: SparkAudio · License: CC BY-NC-SA 4.0

Jaribu kufanya hivyo

GPT-SoVITSGPT-SoVITS Kiwango

Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.

Develer: RVC-Boss · License: MIT

Jaribu kufanya hivyo

OrpheusOrpheus Kiwango

Human-level emotional TTS model trained on 100K hours of speech data.

Develer: Canopy Labs · License: Llama 3.2 Community

Jaribu kufanya hivyo

Qwen3 TTSQwen3 TTS Kiwango

THAWABU za Aliba zenye lugha nyingi zikiwa na sauti na muundo wa sauti kutoka kwenye maandishi.

Develer: Alibaba (Qwen) · License: Apache 2.0

Jaribu kufanya hivyo

VieNeu-TTS-v2VieNeu-TTS-v2 Kiwango

Kivietnam + English-kuanzisha alama za TTS kwa sauti 7 na sauti ya wazi inayoibuka. CPU-put, hakuna GPU iliyotaka.

Develer: Phạm Nguyễn Ngọc Bảo · License: Apache 2.0

Jaribu kufanya hivyo

Chatterbox TurboChatterbox Turbo Kiwango

Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.

Develer: Resemble AI · License: MIT

Jaribu kufanya hivyo

VoxCPMVoxCPM Kiwango

Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.

Develer: OpenBMB · License: Apache 2.0

Jaribu kufanya hivyo

VibeVoiceVibeVoice Kiwango

Picha ndogo kwa ajili ya maudhui ya muda mrefu ya lugha mbalimbali kama vile podikasti na rekodi za sauti.

Develer: Microsoft · License: MIT

Jaribu kufanya hivyo

CosyVoice3CosyVoice3 Kiwango

TEKNOHAMA ZA TEKNOHAMA ZA TEKANA kwa kutumia vishindo viwili, udhibiti wa hisia za moyoni, na sauti ya sufuri inayoibuka.

Develer: Alibaba (FunAudioLLM) · License: Apache 2.0

Jaribu kufanya hivyo

NAMAA Saudi TTSNAMAA Saudi TTS Kiwango

Mara ya kwanza ya kufungua lugha ya Saudi-Arabu. lahaja ya wenyeji wa Saudi Arabia yenye sauti ya Chatterbox-sawa na ya ki-Slaya.

Develer: NAMAA Space · License: MIT

Jaribu kufanya hivyo

Darwin TTSDarwin TTS Kiwango

Lugha ya Cross-modal Qwen3-TTTS inatofautiana na FFN zilizochanganywa na muundo wa lugha ya Qwen3- 1.7B kwa ajili ya ufanyizaji wa lugha kwa lugha zilizo tata zaidi.

Develer: FINAL-Bench · License: Apache 2.0

Jaribu kufanya hivyo

MOSS-TTSDMOSS-TTSD Kiwango

Majadiliano ya namna hiyo ya kuendeleza mazungumzo ya namna mbalimbali ya ki-Multi-Peter huamsha mazungumzo ya kimitindo pamoja na wazungumzaji wapatao 5 na dakika 60 za sauti zenye upatano.

Develer: OpenMOSS · License: Apache 2.0

Jaribu kufanya hivyo

ChatterboxChatterbox Premi

Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.

Ubora:

Jaribu kufanya hivyo

Tortoise TTSTortoise TTS Premi

Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.

Ubora:

Jaribu kufanya hivyo

StyleTTS 2StyleTTS 2 Premi

Maandishi ya binadamu-level-to-speech kupitia mtindo wa usambazaji na mafunzo.

Ubora:

Jaribu kufanya hivyo

OpenVoiceOpenVoice Premi

Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.

Ubora:

Jaribu kufanya hivyo

Sesame CSMSesame CSM Premi

Usemi wa mazungumzo hutokeza mazungumzo ya asili kwa wakati ufaao na hisia - moyo.

Ubora:

Jaribu kufanya hivyo

CosyVoice 2CosyVoice 2

Kufurika kwa Alibaba kwa asili ya binadamu na kukaribia kuchelewa mno.

Lugha: en, zh, ja, ko, fr, de, it, es

Sauti ya Clone

IndexTTS-2IndexTTS-2

Zero-shot TTS ikiwa na udhibiti mzuri wa hisia - moyo na uwazi wa juu.

Lugha: en, zh

Sauti ya Clone

Spark TTSSpark TTS

TEGEMEA Sauti kwa hisia - moyo zinazoweza kudhibitiwa na mtindo wa kusema kwa kutumia mashine.

Lugha: en, zh

Sauti ya Clone

GPT-SoVITSGPT-SoVITS

Ni sauti chache zinazofanyiza TTS ambazo hunasa sauti yoyote kutoka kwa sekunde 5 tu za sauti.

Lugha: en, zh, ja, ko

Sauti ya Clone

ChatterboxChatterbox

Sauti ya Taifa-of-the-art sufuri - imetokana na udhibiti wa hisia - moyo kutoka Resemble AI.

Lugha: en

Sauti ya Clone

Tortoise TTSTortoise TTS

Maandishi ya kigeni-to-speech yalikazia ubora wa muundo wa mtu binafsi.

Lugha: en

Sauti ya Clone

OpenVoiceOpenVoice

Sauti nzito sana huibuka kwa kutumia mawimbi ya sauti juu ya mtindo, hisia, na matamshi.

Lugha: en, zh, ja, ko, fr, es

Sauti ya Clone

VieNeu-TTS-v2VieNeu-TTS-v2

Kivietnam + English-kuanzisha alama za TTS kwa sauti 7 na sauti ya wazi inayoibuka. CPU-put, hakuna GPU iliyotaka.

Lugha: vi, en

Sauti ya Clone

Chatterbox TurboChatterbox Turbo

Feader Chatterboksi yenye vigubiko vya chini ya200 na vibandiko vya kuchekesha kwa ajili ya kucheka, kukohoa, na kadhalika.

Lugha: en

Sauti ya Clone

VoxCPMVoxCPM

Tokezizer-free TTS inayotokeza sauti ya 44.1Hz yenye mukhtadha wa muktadha-ona mpangilio wa fungu.

Lugha: en, zh

Sauti ya Clone

OuteTTSOuteTTS

TTS anayeishi huko CPU, GPU, au skii kupitia llama.cpp and Transformers.js.

Lugha: en

Sauti ya Clone

Pocket TTSPocket TTS

Kimo cha nuru cha 100M cha parameta kilichotungwa na Kyutai kikiwa na sauti inayofanyizwa kutokana na sampuli moja.

Lugha: en, fr

Sauti ya Clone

CosyVoice3CosyVoice3

TEKNOHAMA ZA TEKNOHAMA ZA TEKANA kwa kutumia vishindo viwili, udhibiti wa hisia za moyoni, na sauti ya sufuri inayoibuka.

Lugha: en, zh, ja, ko, de, es, fr, it, ru

Sauti ya Clone

NAMAA Saudi TTSNAMAA Saudi TTS

Mara ya kwanza ya kufungua lugha ya Saudi-Arabu. lahaja ya wenyeji wa Saudi Arabia yenye sauti ya Chatterbox-sawa na ya ki-Slaya.

Lugha: ar

Sauti ya Clone

Darwin TTSDarwin TTS

Lugha ya Cross-modal Qwen3-TTTS inatofautiana na FFN zilizochanganywa na muundo wa lugha ya Qwen3- 1.7B kwa ajili ya ufanyizaji wa lugha kwa lugha zilizo tata zaidi.

Lugha: en, ko, ja, zh

Sauti ya Clone

MOSS-TTSDMOSS-TTSD

Majadiliano ya namna hiyo ya kuendeleza mazungumzo ya namna mbalimbali ya ki-Multi-Peter huamsha mazungumzo ya kimitindo pamoja na wazungumzaji wapatao 5 na dakika 60 za sauti zenye upatano.

Lugha: en, zh

Sauti ya Clone

Ming-Omni TTSMing-Omni TTS

Safu ya maneno.5B omni-modal ni mfano kutoka konteAI pamoja na kiwango cha juu cha uzalishaji wa umeme 44.1kHz na sauti ya sufuri inayoibuka.

Lugha: en, zh

Sauti ya Clone

MOSS-TTS NanoMOSS-TTS Nano

Sehemu ndogo ya 100 M MOSS-TTS hutofautiana na majengo yaleyale, 80x yakiwa madogo zaidi, yasiyo na malipo.

Lugha: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Sauti ya Clone

Mzazi wa Kwanza API

Picha ya mwisho, mifano 22+. Inaunga mkono matumizi halisi ya wakati.

  • Muundo wa wazi kabisa
  • Matukio Yanayovutia kwa ajili ya programu za wakati halisi
  • Kutayarisha Back kwa ajili ya kazi kubwa
  • Vituo vya Internet vinavyoonyesha ndoa kati ya ndoa na mtu mwingine
Mwono API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Njia Rahisi na Inayobadilika

Anzisha mizani unapokua.

Huru

$0

Wahusika 15,000 + 5,000/day

  • 7 Walio huru kutia ndani Kokoro
  • Nwari 5,000 kwa kila kizazi
  • Njia ya kuingia ni pamoja
Fanyeni Ishara kwa Hiari

keyboard label

$9/mo

Namba 500 za mikopo/miezi

  • Waigaji wote 22+
  • Watoto 100,000 kwa kila kizazi
  • Sauti Yaungana
Anza
Wanapendwa Sana

Project

$29/mo

2,000 Sh. Sh.

  • Kila Kitu Kinaanza
  • Njia ya kuingia
  • Matayarisho ya Kabla ya Ndoa
Fanya Maendeleo

Biashara

$99/mo

10,000 sifa/miezi

  • Kila Kitu cha Kutoa
  • Bulk API
  • Sehemu ya mbele ya foleni
Tafuta Biashara

Ona mipango yote kutia ndani makundi ya wahusika →

Maswali Ambayo Watu Huuliza Mara Nyingi

TTS.ai ni jukwaa la sauti la AI, linalotoa mifano 22+ ya maandishi, uundaji wa sauti, uandishi wa sauti, na vyombo vya sauti.

Ndiyo, TTS.ai wanatuma ujumbe huru na Kokoro, Piper, VITS, na MeloTS. Hakuna akaunti inayotakiwa.

Kwa mwendo wa kasi, tumia Kokoro au Piper. Kwa ubora, jaribuni CosyVoice 2 au StyTTS 2. Ili ufanyizaji wa sauti, tumia alama Chatterbox au GPT-SHITS.

Ndiyo. LepenAI-visidentible REST API for TTS, STET, ufanyizaji wa sauti, na vyombo vya sauti. Vyombo vya sauti. Vitu hivyo vilitia ndani kila mpango ikiwa huru, pamoja na mipaka ya viwango (Free: 10 req/min, Lite: 20, Lete: 30, Pro: 60, Business: 300).

Sifa ya sauti hutofautiana kwa muundo wa kimitindo kama CosyVoice 2, na Chatterboksi hutokeza karibu hotuba ya ubora wa binadamu yenye asili ya taifa na hisia. Maumbo huru kama Kokoro hutoa ubora bora kabisa kwa ajili ya visa vingi.

Lugha TTS.ai zinaunga mkono lugha 30+ katika maktaba yake ya mfano. Kiingereza kina utegemezo mkubwa zaidi, lakini violezo kama CosyVoice 2 vya jalada la Kichina, Kijapani, na Korea; GPT-SSITS hushughulikia Kichina, Kijapani, Kikorea, na Kiingereza; na MeloTS hutegemeza Kiingereza, Kihispania, Kifaransa, Kichina, Kijapani, na Kikorea.

Sisi hatuweki habari zako kwenye kompyuta baada ya kuzitoa. Tunatumia sauti zilizopakiwa kwa ajili ya kipindi cha sasa na hatujazihifadhi.

Sauti zote zilizotokezwa kwa TTS.ai ni zako kutumia biashara, ikiwa ni pamoja na video za YouTube, podikasti, vitabu vya sauti, programu za matangazo, na bidhaa.

Watu TTS.ai wanatengeneza sauti katika tovuti ya WAV kwa kukosa kiwango cha juu kabisa. Unaweza kubadilisha kuwa MP3, FARAC, OGG, au M4A kwa kutumia chombo chetu cha bure cha Audio Aurelier.

Pakua kidokezo kifupi cha sauti (kufikia sekunde 5) ya sauti unayotaka kuunda, kisha chapa maandishi yoyote ili kutokeza sauti hiyo.

Waigaji huru (Kokoro, Piper, VITS, MeloTTS) hawahitaji akaunti na gharama za wahusika. Mifano ya kawaida (2,000/1K input) ni pamoja na Bark, CosyVoice 2, F5-TTSS, na Dia. Premium violezo (wahusika 14,000/1K input) ikiwa ni pamoja na kipenVoice, Chatterbox, SCRS 2, na Tortoise. Kwa ujumla, wanamitindoa kadhalika hutoa sauti za juu zaidi, sauti na sauti za ziada.

Ndiyo. API inaunga mkono hatua za kubadili maandishi mengi ya kusema. Ruhusu maombi mengi na kupata matokeo kwa kutumia kazi ya UUIDs. Mpango wa Biashara (dola 99/mo) na ngazi za juu zaidi zinajumuisha njia za kwanza kwa ajili ya utengenezaji wa haraka zaidi. Mafaa kwa ajili ya utokezaji wa vitabu vya sauti, masomo, na miradi mikubwa ya sauti.
4.1/5 (42)

Uwezo wako wa kutatua matatizo ni nini?

Anza Kutumia Sauti ya Mimi Leo

Jiunge na Wafanyizaji, wajenzi, na biashara kwa kutumia TTS.ai