ئەركىن AI تېكىستتىن سۆزگە

33+ ئوچۇق مەنبەلىك مودېللار، 273+ ئاۋازلار 33+ تىللار. ھېسابات كېرەك ئەمەس.

18K+
ياراتقۇچىسى
71K+
ئەۋلادلار
33+
AI مودېللىرى
273+
ئاۋازلار
TTS.ai نى ياخشى كۆرەمسىز؟ دوستلىرىڭىزغا ئېيتىپ بېرىڭلار!

ئاۋاز AI ئۈچۈن كېرەكلىك ھەممىسى

ئېچىۋېتىلگەن مەنبەلىك AI مودېللىرى بىلەن تەمىنلەنگەن 30+ قورال

33+ AI ئاۋاز مودېلى

ئوچۇق مەنبەلىك TTS نىڭ ئەڭ كەڭ كۆلەملىك توپلىمى

KokoroKokoro بوش

Kokoro 82 مىليون پارامېتىرلىق تېكىستتىن سۆزگە ئۆز دەرىجىسىدىن يۇقىرى ئۈنۈم بېرىدىغان پروگرامما. ئۇزۇنلۇقى كىچىك بولسىمۇ، ئەمما ئىنتايىن تەبىئىي ۋە ئىپادىلەشچان سۆزلەرنى ئىشلەپ چىقىرىدۇ. Kokoro ئىنگىلىزچە، ياپونچە، خەنزۇچە ۋە كورېيچە قاتارلىق نۇرغۇن تىللارنى قوللايدۇ ھەمدە ھەر خىل ئىپادىلەشچان ئاۋازلارنى قوللايدۇ. ئۇ ئىنتايىن تېز ئىشلەيدۇ - GPU دىكى ھەقىقىي ۋاقىتتىكىدىن 100 ھەسسە تېز ئاۋازلارنى ئىشلەپ چىقىرىدۇ.

ئەڭ ياخشىسى: يۇقىرى سۈپەتلىك TTS، ئەڭ ئاز كېچىكتۈرگۈچ، سۈرەتكە ئېلىش پروگراممىسى

ھەقسىز سىناش

PiperPiper بوش

Piper Rhasspy تەرىپىدىن ياسالغان VITS ۋە larynx قۇرۇلمىسىنى ئىشلىتىدىغان يېنىك تېكىستتىن سۆزگە ئۆزگەرتكۈچ پروگرامما. ئۇ پۈتۈنلەي CPU نىڭ ئۈستىدە ئىشلەيدۇ، شۇڭا Edge ئۈسكۈنىلىرى، ئۆي ئاپتوماتىك سىستېمىسى ۋە توردىن سىرت TTS تەلەپ قىلىدىغان پروگراممىلارغا ماس كېلىدۇ. Piper 30 دىن ئارتۇق تىلدىكى 100 دىن ئارتۇق ئاۋاز بىلەن تەمىنلەيدۇ، Raspberry Pi 4 نىڭ ئۆزىدىمۇ تېز سۈرئەتتە تەبىئىي ئاۋازلىق سۆزلەشنى تەمىنلەيدۇ.

ئەڭ ياخشىسى: تېز ئالدىن كۆزىتىش، قولايلىق ۋە كىرگۈزۈلگەن پروگرامما

ھەقسىز سىناش

VITSVITS بوش

VITS (ئاخىردىن ئاخىرغىچە تېكىستتىن سۆزگە ئۆزگىرىشچان ئىزاھلاش) ھازىرقى ئىككى باسقۇچلۇق مودېلغا قارىغاندا تېخىمۇ تەبىئىي ئاۋازنى پەيدا قىلىدىغان تەڭشەكلىك ئاخىردىن ئاخىرغىچە TTS ئۇسۇلىدۇر. ئۇ ئۆزگىرىشچان ئىزاھلاشنى نورماللاشتۇرۇش ئېقىمى ۋە ئۆزگىرىشچان تەربىيەلەش جەريانى بىلەن كۈچەيتىپ، تەبىئىيلىكنى زور دەرىجىدە ئاشۇرىدۇ.

ئەڭ ياخشىسى: ئاددىي مەقسەتتىكى تېكىستتىن سۆزگە ئۆزگىرىش پروگراممىسى

ھەقسىز سىناش

MeloTTSMeloTTS بوش

MyShell.ai تەرىپىدىن ياسالغان MeloTTS ئىنگىلىزچە (ئامېرىكىلىق، بىرىتانىيەلىك، ھىندى، ئاۋسترالىيەلىك)، ئىسپانچە، فرانسۇزچە، خەنزۇچە، ياپونچە ۋە كورىيەچە تىللارنى قوللايدىغان كۆپ تىللىق TTS كىتابخانىسىدۇر. ئۇ ئىنتايىن تېز، پەقەت CPU نىڭ كۈچى بىلەن تېكىستنى رېئال ۋاقىتتىكى سۈرئەتتە ئىشلىتەلەيدۇ. MeloTTS ئىشلەپچىقىرىش ئۈچۈن ياسالغان بولۇپ CPU ۋە GPU نىڭ ھەممىسىنى قوللايدۇ.

ئەڭ ياخشىسى: تېز، كۆپ تىللىق TTS تەلەپ قىلىدىغان ئىشلەپچىقىرىش پروگراممىسى

ھەقسىز سىناش

Kani TTS 2Kani TTS 2 بوش

Kani-TTS-2 NineNineSix نىڭ LiquidAI LFM2 ئاساسىدا Nvidia NanoCodec بىلەن ياسالغان 400M پارامېتىرلىق ئىنتايىن يېنىك بىر مودېل. ئۇ پەقەت 3GB VRAM نىڭ ئىچىدە ئىشلەيدۇ ۋە ~2 سېكۇنتتا 10 سېكۇنت سۆزلەشكە (RTF 0.2) ئېرىشىدۇ. ئاۋازنى ئاۋازلىق يانفونغا كىرگۈزۈش ئارقىلىق ئاۋازنى سىزىشنى قوللايدۇ.

ئەڭ ياخشىسى: تېز ياساش، ئاز مەنبەلىك مۇھىت، تېز ئالدىن كۆزىتىش

ھەقسىز سىناش

OuteTTSOuteTTS بوش

OuteTTS چوڭ تىل مودېللىرىنى تېكىستتىن سۆزگە ئۆزگەرتىش ئىقتىدارىنى قوشۇپ، ئەسلى قۇرۇلمىسىنى ساقلاپ قالىدۇ. ئۇ llama.cpp (CPU/GPU)، Hugging Face Transformers، ExLlamaV2، VLLM ۋە Transformers.js ئارقىلىق توركۆرگۈنىڭ چۈشەنچىسىنى قوللايدۇ. JSON تىپىدا ساقلانغان ئاۋازلىق پروفېيىللار ئارقىلىق ئاۋازنى سىزىش ئىقتىدارى بار.

ئەڭ ياخشىسى: Edge نىڭ ئورنىتىشى، توركۆرگۈ ئاساسىدىكى TTS، ئاز مەنبەلىك مۇھىتلار

ھەقسىز سىناش

Pocket TTSPocket TTS بوش

Pocket TTS Kyutai (Moshi نىڭ ياراتقۇچىسى) تەرىپىدىن ياسالغان 100M پارامېتىرلىق تېكىستتىن سۆزگە ئۆزىنىڭ ئېغىرلىقىدىنمۇ ئېغىر بولغان بىر كونتروللۇق. CPU نىڭ ئىقتىدارىنى ياخشى ئىشلىتىدۇ، بىرلا ئاۋاز نۇسخىسىدىن ئاۋازنى سىزىشنى قوللايدۇ، ۋە تەبىئىي ئاۋازلىق سۆزلەرنى ئىشلەتىدۇ. كىچىك چوڭلۇقى ئۇنى Edge نىڭ يان تەرەپكە ئورۇنلاشتۇرۇلۇشى ۋە ئاز مەنبەلىك مۇھىتلارغا ماس كېلىدۇ.

ئەڭ ياخشىسى: يېنىك ئورۇنلاشتۇرغۇچ، CPU-لا ئىشلىتىدىغان مۇھىت، تېز ئاۋازنى تەقلىدلەش

ھەقسىز سىناش

Kitten TTSKitten TTS بوش

Kitten TTS by KittenML ONNX نىڭ ئاساسىدا ياسالغان ئىنتايىن يېنىك تېكىستتىن سۆزگە ئۆزگەرتكۈچ. 15M دىن 80M گە قەدەر پارامېتىر (دېسكىدا 25-80 MB) نىڭ تۈرلىرى بىلەن، CPU نىڭ گرافىكىلىق بىرلىككە كەلتۈرگۈچىگە ئېھتىياجسىز ھالدا يۇقىرى سۈپەتلىك سۆز بىرىكتۈرگۈچنى تەمىنلەيدۇ. 8 خىل ئىچىدە بار ئاۋاز، تەڭشەلگەن سۆز بىرلىككە كەلتۈرگۈچ، سانلار، پۇل بىرلىكلىرى ۋە بىرلىكلەر ئۈچۈن ئىچىدە بار تېكىست ئالدىن بىرلەشتۈرگۈچ. Edge نىڭ يانداش ۋە تۆۋەن ۋاقىتلىق پروگراممىلىرى ئۈچۈن ئەڭ ياخشى.

ئەڭ ياخشىسى: تېز، يېنىك TTS، edge نىڭ مەشغۇلاتى، تۆۋەن ۋاقىتلىق پروگرامما

ھەقسىز سىناش

Ming-Omni TTSMing-Omni TTS بوش

Ming-omni-tts-0.5B by inclusionAI BailingMM نىڭ تىك يان بوشلۇقى بىلەن Patch-by-Patch ئاۋاز رېكوردىرلاش سىستېمىسى بىلەن ياسالغان بىر كۆچمە omni-modal سۆزلەش مودېلى. 44.1kHz چىقىرىش (CD نىڭ سۈپىتىگە يېقىن)، 3+ سېكۇنتلۇق رىقابەتتىن zero-shot ئاۋازنى клонلاشنى قوللايدۇ، JSON بۇيرۇقى ئارقىلىق ئىچىگە ھېسسىيات / دىيالېك / BGM كونتروللۇقىنى كىرگۈزۈدۇ. مۇكەممەل تۇراقلىق — جۇڭگولۇق دەرىجە بويىچە 0.83% WER.

ئەڭ ياخشىسى: يۇقىرى سۈپەتلىك ئىككى تىللىق سۆزلەش، ھېسسىيات كونتروللۇقىدىكى ئاۋاز ئويۇنى، خەنزۇچە ئاۋازلىق كىتاب مەزمۇنى

ھەقسىز سىناش

MOSS-TTS NanoMOSS-TTS Nano بوش

MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.

ئەڭ ياخشىسى: Free-tier TTS, high-volume production, low-latency interactive use

ھەقسىز سىناش

BarkBark ئاددىي

راستچىل سۆزلەش، مۇزىكا ۋە ئاۋاز ئۈنۈملىرىنى ھاسىل قىلىدىغان ئۆزگەرتكۈچ ئاساسىدىكى تېكىستتىن ئاۋازغا ئۆزگەرتىش مودېلى.

ئىجاد قىلغۇچى: Suno · ئىجازەتنامە: MIT

سىناپ بېقىش

Bark SmallBark Small ئاددىي

Bark نىڭ تېز چۈشەنچىگە ئىگە ۋە ئاز يادرو ئىشلىتىدىغان يېنىك نۇسخىسى.

ئىجاد قىلغۇچى: Suno · ئىجازەتنامە: MIT

سىناپ بېقىش

CosyVoice 2CosyVoice 2 ئاددىي

Alibaba's scaleable streaming TTS with human-parity naturalness and nearly zero latency.

ئىجاد قىلغۇچى: Alibaba (Tongyi Lab) · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

Dia TTSDia TTS ئاددىي

سۆزلىگۈچىلەر ئارىسىدا تەبىئىي مۇنازىرە پەيدا قىلىدىغان كۆپ سۆزلىگۈچلىك مۇنازىرە ھاسىل قىلىش مودېلى.

ئىجاد قىلغۇچى: Nari Labs · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

Parler TTSParler TTS ئاددىي

ئاڭلاشنى خالايدىغان ئاۋازنى تەبىئىي تىلدا چۈشەندۈرۈڭ، Parler مۇۋاپىق ئاۋازنى ھاسىل قىلىدۇ.

ئىجاد قىلغۇچى: Hugging Face · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

IndexTTS-2IndexTTS-2 ئاددىي

Zero-shot TTS مۇكەممەل ھېسسىيات باشقۇرۇش ۋە يۇقىرى ئىپادىلەش ئىقتىدارىغا ئىگە.

ئىجاد قىلغۇچى: Index Team · ئىجازەتنامە: Bilibili Model License

سىناپ بېقىش

Spark TTSSpark TTS ئاددىي

تىزگىنلەيدىغان ھېسسىيات ۋە سۆزلەش ئۇسلۇبى ئارقىلىق TTS ئاۋازىنى клонلاش.

ئىجاد قىلغۇچى: SparkAudio · ئىجازەتنامە: CC BY-NC-SA 4.0

سىناپ بېقىش

GPT-SoVITSGPT-SoVITS ئاددىي

پەقەت 5 سېكۇنتلۇق ئاۋازدىن ھەرقانداق ئاۋازنى قايتا ياسايدىغان ئاز ساندىكى ئاۋازنى قايتا ياساش پروگراممىسى.

ئىجاد قىلغۇچى: RVC-Boss · ئىجازەتنامە: MIT

سىناپ بېقىش

OrpheusOrpheus ئاددىي

100K سائەت سۆزلەش سانلىق-مەلۇماتىغا ئاساسەن تەربىيلەنگەن ئىنسان دەرىجىلىك ھېسسىياتلىق TTS مودېلى.

ئىجاد قىلغۇچى: Canopy Labs · ئىجازەتنامە: Llama 3.2 Community

سىناپ بېقىش

Qwen3 TTSQwen3 TTS ئاددىي

Alibaba نىڭ كۆپ تىللىق TTS، ئاۋازنى كۆچۈرۈش، ئالدىن بەلگىلەنگەن ئاۋازلار ۋە تېكىستتىن ئاۋاز ياساش ئىقتىدارى بار.

ئىجاد قىلغۇچى: Alibaba (Qwen) · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

VieNeu-TTS-v2VieNeu-TTS-v2 ئاددىي

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

ئىجاد قىلغۇچى: Phạm Nguyễn Ngọc Bảo · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

Chatterbox TurboChatterbox Turbo ئاددىي

200ms تىن تۆۋەن ۋاقىت كېچىكىشى ۋە كۈلكىلەر، كۆكرەك ئاغرىشلار ۋە باشقا ئىشلار ئۈچۈن paralinguistic تىكىش بىلەن تېز Chatterbox.

ئىجاد قىلغۇچى: Resemble AI · ئىجازەتنامە: MIT

سىناپ بېقىش

VoxCPMVoxCPM ئاددىي

Tokenizerسىز TTS 44.1kHz ئاۋازنى 44.1kHz ئاۋازغا ئايلاندۇرۇپ چىقىرىدۇ.

ئىجاد قىلغۇچى: OpenBMB · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

VibeVoiceVibeVoice ئاددىي

Microsoft نىڭ ئۇزۇن شەكىلدە كۆپ ئاڭلىغۇچىلىق مەزمۇنلار ئۈچۈن ئىشلىتىلىدىغان مودېلى، مەسىلەن: podcast ۋە ئاۋازلىق كىتابلار.

ئىجاد قىلغۇچى: Microsoft · ئىجازەتنامە: MIT

سىناپ بېقىش

CosyVoice3CosyVoice3 ئاددىي

ئىككى خىل ئېقىم، ھېسسىيات كونتروللۇقى ۋە ئاۋازنى سىزىش ئىقتىدارىغا ئىگە يېڭى ئەۋلاد كۆپ تىللىق TTS.

ئىجاد قىلغۇچى: Alibaba (FunAudioLLM) · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

NAMAA Saudi TTSNAMAA Saudi TTS ئاددىي

تۇنجى ئوچۇق سەئۇدى ئەرەبىستان TTS. Chatterbox-quality ئاۋازنى تەقلىدلەش بىلەن سەئۇدى ئەرەبىستاننىڭ ئۆزگىچە تىلى.

ئىجاد قىلغۇچى: NAMAA Space · ئىجازەتنامە: MIT

سىناپ بېقىش

Darwin TTSDarwin TTS ئاددىي

Qwen3-1.7B تىل مودېلى بىلەن بىرلەشتۈرۈلگەن FFN ئېغىرلىقلىرى بار cross-modal Qwen3-TTS نىڭ كۆپ تىللىق клонلاشنى تېخىمۇ تېزلەشتۈرۈش ئىقتىدارى بار.

ئىجاد قىلغۇچى: FINAL-Bench · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

MOSS-TTSDMOSS-TTSD ئاددىي

5000 دىن ئارتۇق يازغۇچى ۋە شائىرلار 60 دىن ئارتۇق ئىلمىي ماقالە ۋە 50 دىن ئارتۇق ئىلمىي ماقالە يازغان.

ئىجاد قىلغۇچى: OpenMOSS · ئىجازەتنامە: Apache 2.0

سىناپ بېقىش

ChatterboxChatterbox يۇقىرى دەرىجىلىك

Resemble AI نىڭ ھېسسىياتنى كونترول قىلىش ئىقتىدارىنى ئۆز ئىچىگە ئالغان يېڭىلىق يارىتىلغان zero-shot ئاۋاز كۆچۈرۈش پروگراممىسى.

سۈپىتى:

سىناپ بېقىش

Tortoise TTSTortoise TTS يۇقىرى دەرىجىلىك

نۇرغۇن ئاۋازلىق تېكىستتىن سۆزگە ئۆز-ئۆزىنى قايتۇرۇۋېلىش قۇرۇلمىسى بىلەن سۈپەتكە ئەھمىيەت بېرىدۇ.

سۈپىتى:

سىناپ بېقىش

StyleTTS 2StyleTTS 2 يۇقىرى دەرىجىلىك

ئىنسانىي دەرىجىدىكى تېكىستتىن سۆزگە ئۇسلۇب تارقىتىش ۋە قارشىلىق تەربىيىسى ئارقىلىق.

سۈپىتى:

سىناپ بېقىش

OpenVoiceOpenVoice يۇقىرى دەرىجىلىك

سۈپەت، ھېسسىيات ۋە ئاۋازنى كونترول قىلىش ئىقتىدارىغا ئىگە بولغان دەرھال ئاۋازنى كۆچۈرۈش پروگراممىسى.

سۈپىتى:

سىناپ بېقىش

Sesame CSMSesame CSM يۇقىرى دەرىجىلىك

مۇۋاپىق ۋاقىت ۋە ھېسسىيات بىلەن تەبىئىي مۇنازىرە پەيدا قىلىدىغان سۆزلىشىش مودېلى.

سۈپىتى:

سىناپ بېقىش

CosyVoice 2CosyVoice 2

Alibaba's scaleable streaming TTS with human-parity naturalness and nearly zero latency.

تىللار: en, zh, ja, ko, fr, de, it, es

ئاۋازنى قۇرۇپ چىقىش

IndexTTS-2IndexTTS-2

Zero-shot TTS مۇكەممەل ھېسسىيات باشقۇرۇش ۋە يۇقىرى ئىپادىلەش ئىقتىدارىغا ئىگە.

تىللار: en, zh

ئاۋازنى قۇرۇپ چىقىش

Spark TTSSpark TTS

تىزگىنلەيدىغان ھېسسىيات ۋە سۆزلەش ئۇسلۇبى ئارقىلىق TTS ئاۋازىنى клонلاش.

تىللار: en, zh

ئاۋازنى قۇرۇپ چىقىش

GPT-SoVITSGPT-SoVITS

پەقەت 5 سېكۇنتلۇق ئاۋازدىن ھەرقانداق ئاۋازنى قايتا ياسايدىغان ئاز ساندىكى ئاۋازنى قايتا ياساش پروگراممىسى.

تىللار: en, zh, ja, ko

ئاۋازنى قۇرۇپ چىقىش

ChatterboxChatterbox

Resemble AI نىڭ ھېسسىياتنى كونترول قىلىش ئىقتىدارىنى ئۆز ئىچىگە ئالغان يېڭىلىق يارىتىلغان zero-shot ئاۋاز كۆچۈرۈش پروگراممىسى.

تىللار: en

ئاۋازنى قۇرۇپ چىقىش

Tortoise TTSTortoise TTS

نۇرغۇن ئاۋازلىق تېكىستتىن سۆزگە ئۆز-ئۆزىنى قايتۇرۇۋېلىش قۇرۇلمىسى بىلەن سۈپەتكە ئەھمىيەت بېرىدۇ.

تىللار: en

ئاۋازنى قۇرۇپ چىقىش

OpenVoiceOpenVoice

سۈپەت، ھېسسىيات ۋە ئاۋازنى كونترول قىلىش ئىقتىدارىغا ئىگە بولغان دەرھال ئاۋازنى كۆچۈرۈش پروگراممىسى.

تىللار: en, zh, ja, ko, fr, es

ئاۋازنى قۇرۇپ چىقىش

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

تىللار: vi, en

ئاۋازنى قۇرۇپ چىقىش

Chatterbox TurboChatterbox Turbo

200ms تىن تۆۋەن ۋاقىت كېچىكىشى ۋە كۈلكىلەر، كۆكرەك ئاغرىشلار ۋە باشقا ئىشلار ئۈچۈن paralinguistic تىكىش بىلەن تېز Chatterbox.

تىللار: en

ئاۋازنى قۇرۇپ چىقىش

VoxCPMVoxCPM

Tokenizerسىز TTS 44.1kHz ئاۋازنى 44.1kHz ئاۋازغا ئايلاندۇرۇپ چىقىرىدۇ.

تىللار: en, zh

ئاۋازنى قۇرۇپ چىقىش

OuteTTSOuteTTS

CPU، GPU ياكى توركۆرگۈ ئارقىلىق llama.cpp ۋە Transformers.js ئارقىلىق ئىشلىگەن LLM ئاساسىدىكى TTS.

تىللار: en

ئاۋازنى قۇرۇپ چىقىش

Pocket TTSPocket TTS

Kyutai نىڭ يېنىك 100M پارامېتىرلىق مودېلى، بىرلا سىناقتىن ئاۋازنى клонلاش.

تىللار: en, fr

ئاۋازنى قۇرۇپ چىقىش

CosyVoice3CosyVoice3

ئىككى خىل ئېقىم، ھېسسىيات كونتروللۇقى ۋە ئاۋازنى سىزىش ئىقتىدارىغا ئىگە يېڭى ئەۋلاد كۆپ تىللىق TTS.

تىللار: en, zh, ja, ko, de, es, fr, it, ru

ئاۋازنى قۇرۇپ چىقىش

NAMAA Saudi TTSNAMAA Saudi TTS

تۇنجى ئوچۇق سەئۇدى ئەرەبىستان TTS. Chatterbox-quality ئاۋازنى تەقلىدلەش بىلەن سەئۇدى ئەرەبىستاننىڭ ئۆزگىچە تىلى.

تىللار: ar

ئاۋازنى قۇرۇپ چىقىش

Darwin TTSDarwin TTS

Qwen3-1.7B تىل مودېلى بىلەن بىرلەشتۈرۈلگەن FFN ئېغىرلىقلىرى بار cross-modal Qwen3-TTS نىڭ كۆپ تىللىق клонلاشنى تېخىمۇ تېزلەشتۈرۈش ئىقتىدارى بار.

تىللار: en, ko, ja, zh

ئاۋازنى قۇرۇپ چىقىش

MOSS-TTSDMOSS-TTSD

5000 دىن ئارتۇق يازغۇچى ۋە شائىرلار 60 دىن ئارتۇق ئىلمىي ماقالە ۋە 50 دىن ئارتۇق ئىلمىي ماقالە يازغان.

تىللار: en, zh

ئاۋازنى قۇرۇپ چىقىش

Ming-Omni TTSMing-Omni TTS

inclusionAI نىڭ 0.5B ئومۇمىي-مۇددىئال سۆزلەش مودېلى، يۇقىرى سەمىمىيلىكلىك 44.1kHz چىقىش ۋە ئاۋازنى زاپاسلاشتۇرۇش.

تىللار: en, zh

ئاۋازنى قۇرۇپ چىقىش

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

تىللار: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

ئاۋازنى قۇرۇپ چىقىش

ئىجادىيەتچىلەرگە خاس API

OpenAI بىلەن ماس كېلىدىغان REST API. بىر ئاخىرقى نۇقتىسى، 22+ مودېلى. راستىنلا ۋاقىتلىق پروگراممىلارنى تولۇق قوللايدۇ.

  • OpenAI-غا ماس كېلىدىغان پىچىم
  • رېئال ۋاقىت پروگراممىلىرى ئۈچۈن TTS قوزغىتىش پروگراممىسى
  • چوڭ ئىشلارنى توپلاش پروگراممىسى
  • Webhook ئېلانلىرى
API پۈتۈكلىرىنى كۆرۈش
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ئاددىي، ئوچۇق باھالاش

ھەقسىز باشلاڭ. ئۆسۈشكە ئەگىشىپ چوڭايىڭ.

بوش

$0

15,000 ھەرپ + 5,000/كۈن

  • Kokoro نى ئۆز ئىچىگە ئالغان 7 مۇلازىمەت
  • ھەر بىر نەشردە 5000 ھەرپ
  • API قوزغىتىش قوشۇلغان
ھەقسىز قوشۇلۇڭ

باشلىغۇچ

$9/مىگابايت

ئايدا 500 كرېدىت

  • ھەممىسى 22+ مودېل
  • ھەر بىر نەشردە 100000 ھەرپ
  • ئاۋازنى كۆچۈرۈش پروگراممىسى
باشلاش
ئەڭ ياقتۇرۇلغانلار

كەسپىي

$29/مىگابايت

ئايدا 2000 كرېدىت

  • باشلىغۇچتىكى ھەممىسى
  • API زىيارەت قىلىش
  • ئالدىنقى ئورۇنغا قويۇش
كەسپىي بولۇش

تىجارەت

$99/مىگابايت

ئايدا 10000 كرېدىت

  • Pro دىكى ھەممىسى
  • كۆپ API
  • ئالدىنقى قاتار
ئىشنى ئېلىش

پۇل تولۇقلاشنى ئۆز ئىچىگە ئالغان پىلانىلارنى كۆرۈش →

كۆپ سورالغان سوئاللار

TTS.ai ئەڭ كەڭ دائىرىلىك AI ئاۋاز پىلانى بولۇپ، 22+ تېكىستتىن سۆزگە مودېل، ئاۋازنى تەقلىدلەش، سۆزدىن تېكىستكە، ئاۋاز قورالى قاتارلىقلارنى تەمىنلەيدۇ. ھەممىسى ئېچىۋېتىلگەن، ھېچقانداق بىر شىركەت بىلەن مۇناسىۋىتى يوق.

ئۇنداق ئەمەس! TTS.ai Kokoro، Piper، VITS ۋە MeloTTS نىڭ تېكىستتىن سۆزگە ئۆزگەرتىش پروگراممىسىنى ھەقسىز بېرىدۇ. ھېسابات كېرەك ئەمەس. 15000 ئەرەب ھەرپىنى ھەقسىز ئېلىش ۋە بارلىق پروگراممىغا ئېرىشىش ئۈچۈن تىزىملىتىڭ. ھەقلىق پروگرامما ئايدا 9 دوللاردىن باشلىنىدۇ.

تېزلىك ئۈچۈن Kokoro ياكى Piper نى ئىشلىتىڭ. سۈپەت ئۈچۈن CosyVoice 2 ياكى StyleTTS 2 نى ئىشلىتىڭ. ئاۋازنى كۆچۈرۈش ئۈچۈن Chatterbox ياكى GPT-SoVITS نى ئىشلىتىڭ. مۇنازىرە ئۈچۈن Dia TTS نى ئىشلىتىڭ. ئوخشاش مەزمۇننى سېلىشتۇرۇش ئۈچۈن بىر قانچە مودېلنى ئىشلىتىڭ.

ئۇنداق. TTS، STT، ئاۋازنى تەقلىدلەش ۋە ئاۋاز قورالى ئۈچۈن OpenAI-غا ماس كېلىدىغان REST API. ھەقسىز بولغان ھەر قانداق پروگرامما بىلەن بىرلىكتە بېرىلىدۇ، سۈرئىتى دەرىجىگە قاراپ تەڭشەلىدۇ (خەلقئارا: 10 req/min، چىرايلىق: 20، باشلانغۇچ: 30، كەسپىي: 60، تىجارەت: 300). tts.ai/api/ دىكى ھۆججەتلەردىن كۆرۈڭ.

ئاۋازنىڭ سۈپىتى ھەر خىل بولىدۇ. CosyVoice 2، StyleTTS 2 ۋە Chatterbox قاتارلىق ئالىي دەرىجىلىك نۇسخىلار تەبىئىي ئاۋاز ۋە ھېسسىيات بىلەن ئادەمگە ئوخشاپ كېتىدىغان سۈپەتتە سۆزلەيدۇ. Kokoro قاتارلىق ھەقسىز نۇسخىلار كۆپىنچە ئەھۋاللاردا ياخشى سۈپەتتە سۆزلەيدۇ.

TTS.ai 30 دىن ئارتۇق تىلنى قوللايدۇ. ئىنگىلىزچە ئەڭ كەڭ قوللايدۇ، لېكىن CosyVoice 2 نىڭ قوللايدىغان تىللىرى جۇڭگوچە، ياپونچە ۋە كورىيەچە؛ GPT-SoVITS نىڭ قوللايدىغان تىللىرى جۇڭگوچە، ياپونچە، كورىيەچە ۋە ئىنگىلىزچە؛ MeloTTS نىڭ قوللايدىغان تىللىرى ئىنگىلىزچە، ئىسپانچە، فىرانسۇزچە، جۇڭگوچە، ياپونچە ۋە كورىيەچە.

ئۇنداق. ھەممىسى بىزنىڭ مۇئەييەنلەشتۈرۈلگەن GPU مۇلازىمېتىرلىرىمىزدا ئىشلىنىدۇ. تېكىست كىرگۈزگۈچىڭىزنى ياكى ياسالغان ئاۋازنى يەتكۈزگەندىن كېيىن ساقلىمايمىز. كۆچۈرۈش ئۈچۈن يۈكلەنگەن ئاۋاز نۇسخىلىرى پەقەت ھازىرقى سەھىپىدەلا ئىشلىتىلىدۇ، ساقلانمايدۇ. بىز سىزنىڭ سانلىق-مەلۇماتىڭىزنى ھېچقاچان ئۈچىنچى تەرەپلەر بىلەن ئورتاقلاشمايمىز ياكى ئۇنى مودېللارنى تەربىيەلەش ئۈچۈن ئىشلىتىمىز.

ئۇنداق ئەمەس. TTS.ai دىكى بارلىق ئاۋازلار YouTube ۋىدىيولىرى، پادىشاھلىق، ئاۋازلىق كىتابلار، يۇمشاق دېتاللار، ئېلانلار ۋە مەھسۇلاتلارنى ئۆز ئىچىگە ئالغان تىجارەت ئۈچۈن ئىشلىتىشىڭىزگە بولىدۇ. بىزنىڭ مودېللىرىمىز ئوچۇق مەنبەلىك بولۇپ (MIT، Apache 2.0) ئىجازەت بېرىلگەن ئىجازەتلەر بويىچە ئىشلىتىلىدۇ. ھېچقانداق ھەق تەلەپ قىلىنمايدۇ.

TTS.ai ئەڭ يۇقىرى سۈپەتكە ئېرىشىش ئۈچۈن ئالدىنئالا WAV پىچىمىنى ئىشلەتىدۇ. MP3، FLAC، OGG ياكى M4A غا ئۆزگەرتىش ئۈچۈن بىزنىڭ ھەقسىز ئاۋاز ئۆزگەرتكۈچ قورالىمىزنى ئىشلىتىڭ. API سىزنىڭ تاللىغان چىقىرىش پىچىمىنى تەلەپ قىلىشنى قوللايدۇ.

كۆچۈرمەكچى بولغان ئاۋازنىڭ قىسقا ئاۋاز نۇسخىسىنى (5 سېكۇنتتىن ئاز) يۈكلەپ، ئاندىن بۇ ئاۋازنى سۆزلەش ئۈچۈن تېكىست كىرگۈزۈڭ. Chatterbox، GPT-SoVITS ۋە CosyVoice 2 قاتارلىقلار ئاۋازنى كۆچۈرۈشنى قوللايدۇ. كۆچۈرۈلگەن ئاۋاز ئاۋازلىق، ئاۋازلىق ۋە سۆزلەش ئۇسلۇبىنى ئۆز ئىچىگە ئالىدۇ.

ھەقسىز نۇسخىلار (Kokoro، Piper، VITS، MeloTTS) ھېساباتنى تەلەپ قىلمايدۇ ۋە ھېچقانداق كرېدىت تەلەپ قىلمايدۇ. ئاددىي نۇسخىلار (2 كرېدىت/1000 ھەرپ) Bark، CosyVoice 2، F5-TTS ۋە Dia نى ئۆز ئىچىگە ئالىدۇ. ئالاھىدە نۇسخىلار (4 كرېدىت/1000 ھەرپ) OpenVoice، Chatterbox، StyleTTS 2 ۋە Tortoise نى ئۆز ئىچىگە ئالىدۇ. ھەقلىق نۇسخىلار كۆپىنچە يۇقىرى سۈپەتلىك، تېخىمۇ كۆپ ئاۋاز ۋە ئاۋازنى كۆچۈرۈش قاتارلىق قوشۇمچە ئىقتىدارلارنى ئۆز ئىچىگە ئالىدۇ.

ئۇنداق. بۇ API كۆپ مىقداردىكى تېكىستنى سۆزگە ئايلاندۇرۇش ئۈچۈن توپلاشنى قوللايدۇ. كۆپ قېتىملىق تەلەپلەرنى سۇنۇپ، UUID نى ئىشلىتىپ نەتىجەلەرنى ئاندىن ئالغىلى بولىدۇ. تىجارەت پىلانى ($99/ئاي) ۋە يۇقىرىقىلار تېز توپلاشنى قوللايدىغان ئالدىنقى قاتارغا كىرىش ئىقتىدارىغا ئىگە. ئاۋازلىق كىتابلارنى ئىشلەش، دەرسلىك مەزمۇنلىرىنى ۋە چوڭ كۆلەملىك سۆزلەش قۇرۇلۇشلىرى ئۈچۈن ئەڭ ياخشى.
4.1/5 (42)

قانداق ياخشىلاشقا بولىدۇ؟ سىزنىڭ پىكىرىڭىز بىزنى مەسىلىلەرنى ھەل قىلىشقا يېتەكلەيدۇ.

AI ئاۋازنى بۈگۈن ئىشلىتىشكە باشلاڭ

TTS.ai نى ئىشلىتىپ ياراتقۇچىلار، ئىجادىيەتچىلەر ۋە شىركەتلەر بىلەن ھەمكارلىشىش