Report Bug / Feature Request

راستىنلا ۋاقىتلىق ئاۋازنى قۇلۇپلاش - ھەرقانداق ئاۋازنى بىر نەچچە سېكۇنت ئىچىدە قۇلۇپلاش

5 سېكۇنتلىق ئاۋازنى ئىشلىتىپ ھەرقانداق ئاۋازنى клонلاش. Chatterbox، CosyVoice 2، GPT-SoVITS ۋە OpenVoice قاتارلىق 9 ئوچۇق مەنبەلىك ئاۋاز клонلاش مودېلى. 0-شوتلۇق клонلاش، تەربىيەلەش كېرەك ئەمەس - نەملە قوشۇپ، سۆزنى دەرھال تولدۇرۇشقا بولىدۇ. ھەممىسى تىجارەتچىلەرگە چەكلەنگەن.

راستىنلا ۋاقىت 5 سېكۇنتلۇق نەمۇنە 9 خىل تىپلىق تىپلاش ئوچۇق مەنبە 17+ تىللار ھېسسىيات باشقۇرۇش

راستىنلا ۋاقىتلىق ئاۋازنى قۇلۇپلاش ئىقتىدارى

ئەڭ يېڭى AI بىلەن ئاۋازلارنى دەرھال клонلاش - تەربىيەلەش، سانلىق-مەلۇماتلار توپلىمى، كۈتۈش كېرەك ئەمەس

Zero-Shot نىڭ کلونلاش پروگراممىسى

تەربىيەلەش، تەڭشەش، سانلىق-مەلۇمات توپلاش كېرەك ئەمەس. 5 سېكۇنتلىق ئاۋازنى يۈكلەپ، دەرھال تىپلىق ئاۋازنى ئالغىلى بولىدۇ. AI ئاۋازنى تولۇق ئاڭلاش ئىقتىدارىنى تىكلەپ بېرىدۇ.

9 خىل تىپلىق تىپلاش

Chatterbox، CosyVoice 2، GPT-SoVITS، OpenVoice، Spark، IndexTTS-2، GLM-TTS، Qwen3-TTS ۋە Tortoise قاتارلىقلارنى تاللاڭ. ھەر بىر مودېلنىڭ سۈپىتى، تېزلىكى ۋە تىلى ئوخشاش ئەمەس.

تىللار ئارىسىدىكى كۈلتۈر

ئىنگىلىزچە ئاۋازنى قۇللاپ، خىتايچە، ياپونچە، كورىيەچە ۋە باشقا تىللاردا سۆزلەشكە ئىشلىتىش. CosyVoice 2 ۋە Qwen3-TTS 17 دىن ئارتۇق تىلدا ئاۋازنى ساقلايدۇ.

ھېسسىيات باشقۇرۇش

Chatterbox، OpenVoice ۋە GLM-TTS ھېسسىيات ئاساسىدا سۆزلەشنى قوللايدۇ. خۇشال، غەمكىن، غەزەپلەنگەن، پىچىرلىغان قاتارلىق ھەر خىل ھېسسىياتلارنى ئۆز ئىچىگە ئالغان ئوخشاش بىر تېكىستنى ياساپ چىقىش ھەمدە بۇ جەرياندا ئاۋازنى ساقلاش.

ئوچۇق مەنبەلىك ۋە تىجارەتچى

ھەر بىر قۇللىنىش مودېلى MIT ياكى Apache 2.0 ئىجازىتى بويىچە ئېچىۋېتىلگەن. قۇللانغان ئاۋازلارنى تىجارەت ئۈچۈن مەزمۇن، مەھسۇلات ۋە پروگراممىلار ئۈچۈن ھەقسىز ئىشلىتىش مۇمكىن.

API نى قۇلۇپلاش

پروگرامما ئارقىلىق ئاۋازنى клонلاش ئۈچۈن REST API. ئاۋازنى يانفونغا چۈشۈرۈپ، تېكىستنى كۆرسىتىپ، клонلانغان سۆزنى قوبۇل قىلىڭ. Python ۋە JavaScript ئۈچۈن SDK. كۆپ ساندىكى ئىشلارنى ئونلاپ клонلاش.

ئاۋازنى تەقلىدلەش مودېللىرى

ھەربىر كلونلاش ئىشلىتىش ئەھۋالى ئۈچۈن 9 ئوچۇق مەنبەلىك مودېل

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 ئاۋازنى كۆچۈرۈش پروگراممىسى

ئەڭ ياخشىسى: ئەڭ ياخشى ئومۇمىي سۈپەت — 5 سېكۇنتلۇق نەقىل، ھېسسىيات كونترولى، MIT نىڭ ئىجازىتى بىلەن

سىناش Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ئاۋازنى كۆچۈرۈش پروگراممىسى

ئەڭ ياخشىسى: ئەڭ ياخشى كۆپ تىللىق كلونلاش — خەنزۇچە، ئىنگىلىزچە، ياپونچە، كورېيەچە ئاۋازنى ساقلايدۇ

سىناش CosyVoice 2

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 ئاۋازنى كۆچۈرۈش پروگراممىسى

ئەڭ ياخشىسى: ھېسسىيات ۋە ئۇسلۇبنى ئۆزگەرتىش بىلەن تېز رەڭ ئۆزگىرىش پروگراممىسى

سىناش OpenVoice

Spark TTSSpark TTS

Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Medium 4/5 ئاۋازنى كۆچۈرۈش پروگراممىسى

ئەڭ ياخشىسى: ئەڭ تېز كۆچۈرۈش مودېلى — نەتىجىلەر ~12 سېكۇنت ئىچىدە

سىناش Spark TTS

IndexTTS-2IndexTTS-2

Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Medium 4/5 ئاۋازنى كۆچۈرۈش پروگراممىسى

ئەڭ ياخشىسى: سۆزلىگۈچىنىڭ ئوخشىماسلىقى يۇقىرى بولغان ياخشى جۇڭگو-ئىنگلىز كلونلاش پروگراممىسى

سىناش IndexTTS-2

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 ئاۋازنى كۆچۈرۈش پروگراممىسى

ئەڭ ياخشىسى: ستۇدىيىلىك دەرىجىدىكى نەتىجە - ئاۋازلىق كىتابلار ۋە يۇقىرى سۈپەتلىك سۆزلەش ئۈچۈن ئەڭ ياخشى

سىناش Tortoise TTS

راستىنلا ۋاقىتلىق ئاۋازنى تەقلىدلەش

قىسقا ئاۋاز نۇسخىسىدىن چەكسىز كۆچۈرۈلگەن سۆزگە

1

ئاۋازنى كۆچۈرۈش

5-30 سېكۇنت ئىچىدە سىز قۇللىنىشنى خالايدىغان ئاۋازدىن ئاڭلىتىشنى ئاڭلاش ياكى ئۈن ئېلىش پروگراممىسى. WAV، MP3 ياكى توركۆرگۈڭىزدە ئاڭلىتىش.

2

كلونلاش مودېلىنى تاللا

سىزنىڭ تەلەپلىرىڭىزگە ماس كېلىدىغان بىر نەرسە تاللاڭ - Chatterbox ياخشى سۈپەت ئۈچۈن، Spark تېزلىك ئۈچۈن، CosyVoice 2 كۆپ تىللىق ئۈچۈن.

3

تېكىستنى كىرگۈزۈڭ

سىز قۇللانغان ئاۋازدا سۆزلەشنى خالايدىغان تېكىستنى كىرگۈزۈپ ياكى قويۇڭ. بۇ مودېل قوللايدىغان ھەر قانداق تىل ئىشلىتىلىدۇ.

4

ياساش ۋە چۈشۈرۈش

10-25 سېكۇنت ئىچىدە ياسالغان ئاۋازىڭىزنى ئاڭلاش ئۈچۈن ياساش نى چېكىڭ. WAV ياكى MP3 تىپىدا چۈشۈرۈپ ئىشلىتىڭ.

Zero-Shot ئاۋازنى كلوبلاش قانداق ئىشلەيدۇ

چىداملىق تەڭشەش، سانلىق-مەلۇمات توپلاش يوق - پەقەت يۈكلەپ، قۇلۇپلاش

ئاۋازنى چىقىرىش پروگراممىسى

AI ئاۋازنى ماتېماتىكا ئاساسىدا سىزىپ چىقىپ، ئاۋازنى سىزىپ چىقىش ئۈچۈن ئاۋازنى تەھلىل قىلىدۇ

  • ئاۋاز 5 سېكۇنتتىن ئاز بولسالا ئىشلەيدۇ
  • ئاۋازنىڭ ئېگىزلىكى، ئاۋازنىڭ تىپى ۋە سۆزلەش ئۇسۇلىنى تۇتۇش پروگراممىسى
  • تەربىيەلەش ياكى تەڭشەش كېرەك ئەمەس
  • ئاۋاز ھەرگىزمۇ مەڭگۈلۈك ساقلانمايدۇ

شەرتلىك سۆز بىرىكتۈرگۈچ

TTS مودېلى سۆزلىگۈچنى كىرگۈزۈش بىلەن يېڭى سۆزلەرنى ھاسىل قىلىدۇ. نەتىجە تېكىستنى سۆزلىگۈچنىڭ سۆزلىرىگە ئوخشايدۇ - تەبىئىي سۆزلىشىش، مۇۋاپىق تەكىتلەش ۋە ئاساسلىق ئاۋاز

  • بىرلا نەمىدىن چەكسىز سۆزلەرنى قۇرۇش پروگراممىسى
  • تىللار ئارىسىدىكى كلونلاش (ئۆزگەرتىلگەن تىللارنى سۆزلەش)
  • ھېسسىيات ۋە ئۇسلۇبنى يۆتكەش
  • 10-25 سېكۇنت ئىچىدە نەتىجە چىقىرىدۇ

ئاۋازنى تىپلاش مودېلىنى سېلىشتۇرۇش

سىزنىڭ كلونلاش ئىشلىتىش ئەھۋالىڭىز ئۈچۈن توغرا مودېلنى تاللاڭ

مودېل ئەڭ كىچىك ئىزاھ تېزلىك سۈپىتى تىللار ھېسسىيات ئىجازەتنامە
Chatterbox 5s ~21s ئەڭ ياخشى EN MIT
CosyVoice 2 5s ~20s ياخشى CN، EN، JP، KO+ Apache 2.0
GPT-SoVITS 5s ~16s ياخشى CN، EN، JP، KO MIT
OpenVoice 5s ~15s ياخشى خەنزۇچە، خەنزۇچە، خەنزۇچە، خەنزۇچە MIT
Spark TTS 5s ~12s ياخشى CN، EN Apache 2.0
IndexTTS-2 5s ~18s ياخشى CN، EN Apache 2.0
GLM-TTS 5s ~25s ياخشى CN، EN Apache 2.0
Qwen3-TTS 5s ~16s ياخشى CN، EN، JP، KO+ Apache 2.0
Tortoise 15s ~60s ستوديو EN Apache 2.0

كىشىلەرنىڭ راستىنلا ۋاقىتلىق ئاۋازنى تەقلىد قىلىشنى ئىشلىتىش سەۋەبى

مەزمۇنلارنى ياساشتىن قولايلىقنى ئاشۇرۇشقا قەدەر—ئاۋازنى كۆچۈرۈشنىڭ كۆپ خىل ئىشلىتىش دائىرىسى بار

ئاۋازلىق كىتاب سۆزلەش

ئاپتورلار ئۆز ئاۋازىنى تىپلاپ، ئاۋازلىق كىتابلارنى يېزىپ چىقىرىدۇ. بۇنى ئاۋازلىق كىتابنى يېزىپ چىقىرىش ئۈچۈن ئىشلىتىش كېرەك.

سىننى دوپپلاش

سىنلارنى باشقا تىللارغا تەرجىمە قىلىش پروگراممىسى

مەزمۇن قۇرۇش

YouTube، Podcast ۋە TikTok ياساشچىلار ئۆزلىرىنىڭ ئاۋازىنى بىردەكلىككە ئىگە قىلىش ئۈچۈن клонلايدۇ. يېڭى مەزمۇنلارنى ئاۋازغا ئېلىش ئۈچۈن ئاۋاز قوشۇش پروگراممىسى ياكى ھازىرقى سىنلارنى باشقا تىلدا ئىشلەتكۈچى پروگرامما.

قولايلىق

كېسەللىك ياكى ئوپېراتسىيە سەۋەبىدىن ئاۋازىنى يوقاتقان كىشىلەر بۇرۇنقى ئاۋازنى تىپلاپ ئاۋازىنى ساقلاپ قالغىلى بولىدۇ. تىپلانغان ئاۋاز ئۇلارغا تېكستتىن سۆزگە ئۆز ئاۋازىنى ئىشلىتىپ ئالاقە قىلىشقا ياردەم بېرىدۇ.

ئويۇن ئىجاد قىلىش

ئاۋازلىق ئەسەرلەرنى ياساش ۋە ستوديو ۋاقتىنى تەقسىملەشكە ئادەتلىنىپ قالماستىن، چەكسىز مۇنازىرە تۈرلىرىنى قۇرۇش پروگراممىسى. ھەر بىر سۆزنى قايتا يېزىپ چىقىش كېرەك بولمىغان ئويۇنلار، مودلار ۋە تىپلىق ئويۇنلار ئۈچۈن بەكلا ياخشى

IVR ۋە تېلېفون سىستېمىسى

شىركەتنىڭ باياناتچىسىنى كلونلاش پروگراممىسى

TTS.ai ۋە باشقا ئاۋازنى تىپلاش چارىلىرى

9 Models بىرلا ئوچۇق مەنبەلىك قۇرۇلۇشنى نېمە ئۈچۈن يېڭىدۇ

خاسلىق TTS.ai SV2TTS ElevenLabs Resemble AI
مودېللارنى قۇلۇپلاش 9 1 1 1
ئەڭ كىچىك ئاۋاز 5 sec 5 sec 30 sec 3 min
تەربىيەلەش كېرەك يوق يوق يوق ھەئە
ئاۋاز سۈپىتى (2025) ستوديو دەرىجىسى كۈن ياخشى ياخشى
ھېسسىيات باشقۇرۇش
تىللار ئارىسىدىكى كۈلتۈر
ئوچۇق مەنبە
گرافىكىلىق بىرلىك بۇلۇت ھەئە بۇلۇت بۇلۇت
API قوزغىتىش
ئازادە قاتلام 15000 ھەرپ ئۆز-ئۆزى چەكلەنگەن

ئاۋازنى تەقلىدلەش API

REST API ئارقىلىق پروگرامما ئارقىلىق ئاۋازلارنى قۇللاش

Python — ئاۋازنى تەقلىدلەش REST API
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")

# Clone a voice from a 5-second sample
result = client.clone_voice(
    name="My Cloned Voice",
    file="reference.wav",       # 5-30 seconds of clear speech
    model="chatterbox",         # or cosyvoice2, openvoice, spark...
    text="Hello! This is my cloned voice speaking new text.",
)

# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
    f.write(audio)
cURL — ئاۋازنى تەقلىدلەش REST API
curl -X POST https://api.tts.ai/v1/voice-clone \
  -H "Authorization: Bearer sk-tts-YOUR_KEY" \
  -F "reference=@voice_sample.wav" \
  -F "text=This is my cloned voice." \
  -F "model=chatterbox"

ئاۋازنى ئەڭ ياخشى سۈرەتكە ئېلىش ئۈچۈن تەۋسىيە

بۇ ئاۋاز خاتىرىلەش ئۇسۇلى ئارقىلىق ئەڭ توغرا ئاۋازنى ئېلىش پروگراممىسى

تىنچ مۇھىت

ئاۋازنى ئاۋازسىز ئۆيدە ئەڭ ئاز بولغاندا ئارقا كۆرۈنۈش ئاۋاز بىلەن يېزىش. AI ئاۋازنى ئاۋازلىق ھۆججەتتىن تېخىمۇ توغرا چىقىرىۋېتىدۇ.

10-30 سېكۇنت

5 سېكۇنت ئىشلەيدۇ، 10-30 سېكۇنت ئىشلەيدىكەن، نەتىجىسى تېخىمۇ ياخشى بولىدۇ. AI نەقەدەر كۆپ سۆز ئاڭلىسا، شۇنچە توغرا كلونلايدۇ.

تەبىئىي سۆزلەش

بىر خىل سۆزلەش ئۇسۇلى ئەمەس، بەلكى تەبىئىي سۆزلەش ئۇسۇلى. ھەر خىل ئاۋاز ۋە تېزلىكنى قوشۇڭ. AI تەبىئىي سۆزلەش ئۇسۇلىڭىزنى، توقۇنۇش ۋە تەكىتلەشنى قوشۇپ تۇتىدۇ.

بىرلا ئاۋازلىق

پەقەت بىر ئادەم سۆزلەيدىغان نەمۇنە ئىشلىتىڭ. كۆپ ئاۋازلار سۆزلىگۈچنى بۇزۇپ، ئارىلاشما نەتىجە چىقىرىدۇ.

ئاۋازلارنى ئەتىگەندىن باشلاپ تۇلۇقلاش

5 سېكۇنتلۇق ئاۋازنى يۈكلەپ، 30 سېكۇنت ئىچىدە سىزنىڭ تۇغۇلغان ئاۋازىڭىزنى ئاڭلاپ بېقىش. ھەقسىز سىناش.

ئاۋازنى ھازىرلا قۇلۇپلاش API پۈتۈكلىرى

كۆپ سورالغان سوئاللار

راستىنلا ۋاقىتلىق ئاۋازنى كۆچۈرۈش ھەققىدە كۆپ سورالغان سوئاللار

راستىنلا ۋاقىتلىق ئاۋازنى تىپلاش بىر ئادەمنىڭ ئاۋازىنى 5 سېكۇنتلۇق قىسقا ئاۋازدىن تىپلاپ چىقىرىش ئۈچۈن ئىشلىتىلىدىغان AI تېخنىكىسىدۇر. سىز ئاۋازنى تىپلاپ چىقىرىدۇ، AI ئۇ ئادەمنىڭ ئاۋازىغا ئوخشايدىغان يېڭى سۆزلەرنى ياسايدۇ. TTS.ai 9 خىل ئاۋازنى تىپلاش مودېلىنى تەمىنلەيدۇ، ھەر بىرىنىڭ سۈپىتى، تېزلىكى ۋە تىل قوللىشى ئوخشاش ئەمەس.

كۆپىنچە مودېللار (Chatterbox، CosyVoice 2، Spark، GPT-SoVITS، OpenVoice) 5 سېكۇنتتىن ئازراق ۋاقىتنى تەلەپ قىلىدۇ. Tortoise 15 سېكۇنتتىن ئارتۇق ۋاقىتنى تەلەپ قىلىدۇ. بارلىق مودېللار ئۈچۈن ئەڭ ياخشى سۈپەت ئۈچۈن، 10-30 سېكۇنتلۇق ئېنىق، بىرلا ئاۋازلىق تەۋسىيە قىلىنىدۇ. ئاۋازلىق سىزىقنىڭ ئارقا كۆرۈنۈشى ۋە مۇزىكا بولمايدۇ.

ئاۋازنى قۇلۇپلاش تېخنىكىسى ئۆزى قانۇنلۇق. لېكىن، پەقەت ئىشلىتىشكە رۇخسەت قىلىنغان ئاۋازلارنىلا قۇلۇپلاشىڭىز كېرەك. ئۆزىڭىزنىڭ ئاۋازىڭىز، سىز رۇخسەت قىلغان ئاۋازلار ياكى خەلقئارادا ئىشلىتىلىدىغان ئاۋازلار. ئاۋازنى قۇلۇپلاش ئارقىلىق رۇخسەتسىز بىرەر كىشىنى قۇلۇپلاش، يالغانچىلىق قىلىش ياكى يالغان مەزمۇنلارنى ياساش نۇرغۇن دۆلەتلەردە قانۇنسىز. TTS.ai نىڭ شەرتلىرى سىزنىڭ قۇلۇپلىغان ھەر قانداق ئاۋازغا ھوقۇقىڭىز بارلىقىنى تەلەپ قىلىدۇ.

بۇ ئىشلىتىش ئەھۋالىڭىزغا باغلىق. Chatterbox ئەڭ يۇقىرى سۈپەتلىك، ھېسسىياتنى كونترول قىلىدىغان ئىنگىلىزچە ئاۋازنى ياسايدۇ. CosyVoice 2 كۆپ تىللىق ئاۋازنى ياساش ئۈچۈن ئەڭ ياخشىسى (خىتايچە، ئىنگىلىزچە، ياپونچە، كورىيەچە). Spark ئەڭ تېز بولۇپ ~12 سېكۇنت ئىچىدە ياسايدۇ. Tortoise ئاۋازنى ياساشتا ئەڭ ياخشىسى، لېكىن تېزلىكى ئازراق. GPT-SoVITS ئاۋازنى ياساشتا ئەڭ ياخشىسى. ئاۋازىڭىزغا ئەڭ ماس كېلىدىغان بىر قانچە خىل ئۇسۇلنى سىناپ بېقىڭ.

ئۇنداق — بۇ تىللار ئارىسىدىكى ئاۋازنى تەقلىدلەش دېيىلىدۇ. CosyVoice 2، Qwen3-TTS ۋە OpenVoice بۇنى قوللايدۇ. مەسىلەن، سىز ئىنگىلىزچە ئاۋازنى ئۈنۈملۈك يوللاپ، سۆزلىگۈچىنىڭ ئاۋاز خاراكتېرىنى ساقلاپ تۇرۇپ، خىتايچە، ياپونچە ياكى كورېيچە سۆزلەشنى ياساپ چىقىرالايسىز. سۈپىتى مودېل ۋە تىل جۈپىگە قاراپ ئۆزگىرىپ تۇرىدۇ.

CorentinJ/Real-Time-Voice-Cloning GitHub قۇرۇلۇشى (60K+ يۇلتۇز) SV2TTS نى ئىشلىتىدۇ، بۇ 2019 يىلى قۇرۇلغان قۇرۇلما. بۇ ۋاقىتتىكى يېڭىلىق بولۇپ، Chatterbox، CosyVoice 2، GPT-SoVITS قاتارلىق زامانىۋى ماشىنىلار ئاۋازنىڭ سۈپىتىنى ياخشىلاپ، ئاۋازنى ئاڭلىغۇچىغا تېخىمۇ يېقىنلاشتۇرىدۇ. TTS.ai 9 خىل يېڭى ماشىنىنى ئىشلەتىدۇ (SV2TTS نىڭ ماشىنىسىغا قارىغاندا) ۋە GPU نى تەڭشەش كېرەك ئەمەس — پەقەت يۈكلەپ، клонلاشقا بولىدۇ.

ئۇنداق. TTS.ai ئاۋازنى клонلاش ئۈچۈن REST API نى تەمىنلەيدۇ. ئاۋاز ۋە تېكىستنى يوللاپ، بىر مودېلنى تاللاپ، клонلانغان سۆزنى قوبۇل قىلىڭ. Python SDK (`pip install ttsai`)، JavaScript SDK (`npm install @ttsainpm/ttsai`) ياكى HTTP تەلەپلىرى ئارقىلىق قولغا كەلتۈرگىلى بولىدۇ. بىر قانچە تېكىستنى ئوخشاش клонلانغان ئاۋاز بىلەن ئىشلەشكە ئاتلانما клонلاشنى قوللايدۇ.

ئۇنداق. سىز ئاۋازنى تۇلۇقلاپ بولغاندىن كېيىن، ئۇنى ھېساباتىڭىزغا ساقلاپ قويۇپ، ئاۋازنى قايتا چۈشۈرمەيلا، سىز تاللىغان ساندا قايتا ئىشلىتىشكە بولىدۇ. ساقلاپ قويۇلغان ئاۋازلار ئاۋازنى تۇلۇقلاش بەتتىكى ئاۋازلار توپلىمىدا كۆرۈنىدۇ ۋە API ئارقىلىق قولغا كەلتۈرۈلىدۇ.

WAV، MP3، OGG، FLAC ۋە WebM نىڭ ھەممىسى قوللىنىلىدۇ. يەنە كىرگۈزۈلگەن مايكروفوننى ئىشلىتىپ توركۆرگۈڭىزدە تىكلەپ ئاۋازنى ئاڭلاشقا بولىدۇ. ئەڭ ياخشى نەتىجە ئۈچۈن 16kHz ياكى ئۇنىڭدىن يۇقىرى بولغان ئاۋازنى ئاڭلاشقا بولىدۇ. AI كىرگۈزگۈچنىڭ پىچىرلىشىغا قارىماي ئاۋازنى ئالدىن ئىشلەپ چىقىرىدۇ (ئېكسپېلىراللاش، ئاۋازنى سۈزۈش).

ياساش ۋاقتى تۈرگە قاراپ ئۆزگىرىپ تۇرىدۇ: Spark ئەڭ تېز ~12 سېكۇنت، OpenVoice ~15 سېكۇنت، GPT-SoVITS ~16 سېكۇنت، CosyVoice 2 ~20 سېكۇنت، Chatterbox ~21 سېكۇنت، Tortoise ~60 سېكۇنت. بۇ ۋاقىتلار ئاددىي جۈملە ئۇزۇنلۇقىدىكى تېكىست ئۈچۈن. ئۇزۇن تېكىستلەر ئۈچۈن مۇناسىۋەتلىك ۋاقىتلار ئۇزۇن بولىدۇ.

ئۇنداق. TTS.ai دىكى 9 خىل قۇللىنىش مودىللىرى ھەممىسى تىجارەتچىلەرگە ئىشلىتىشكە رۇخسەت قىلىدىغان ئوچۇق مەنبەلىك ئىجازەتنامە (MIT ياكى Apache 2.0) نى ئىشلىتىدۇ. قۇللانغان ئاۋازنى YouTube سىنلىرىدا، پادىشاھلىق پروگراممىلىرىدا، ئاۋازلىق كىتابلاردا، پروگراممىلاردا، ئويۇنلاردا، تېلېفون سىستېمىلىرىدا ۋە باشقا تىجارەتچىلەرگە ئىشلىتىشكە بولىدۇ - ئەگەر ئاۋاز مەنبەسىنىڭ ھوقۇقىغا ئىگە بولساڭىز.

ئۇنداق ئەمەس. بىز ئىشلەتكەن ھەر بىر مودېلنىڭ ئوچۇق مەنبەسى بار ۋە GitHub/HuggingFace دا قوللىنىلىدۇ. Chatterbox، CosyVoice 2، GPT-SoVITS، OpenVoice، Spark، IndexTTS-2، GLM-TTS، Qwen3-TTS ياكى Tortoise نى ئۆزىڭىزنىڭ GPU مۇلازىمېتىرىڭىزدا ئۆزىڭىز باشقۇرالايسىز. نۇرغۇن مۇلازىمېتىرلار NVIDIA GPU نىڭ 4-24GB VRAM لىق نۇسخىسىنى تەلەپ قىلىدۇ. TTS.ai نىڭ ھەممىسى قۇرۇلۇشنى باشقۇرىدۇ، شۇڭا سىز بۇنى قىلىشقا ھاجەت يوق.
5.0/5 (1)

What could we improve? Your feedback helps us fix issues.

ھەرقانداق ئاۋازنى بىر نەچچە سېكۇنت ئىچىدە كلوبۇنلاش

9 ئوچۇق مەنبەلىك ئاۋازنى клонلاش مودېلى. 5 سېكۇنتلۇق سىمۋوللار. تەربىيەلەش كېرەك ئەمەس. ھەقسىز سىناپ بېقىڭ - ئاۋازنى ئۈنۈملۈك يوللاپ ئاۋازنى ئون مىنۇت ئىچىدە ئاڭلايسىز.