GPT-SoVITS

Default

تلواله چينايي Neutral GPT-SoVITS

Default is a neutral AI voice powered by the GPT-SoVITS text-to-speech model. This :دوتنه_ voice speaks چينايي and delivers سټېډيو-quality speech synthesis. With ورو خو لوړ- وفادارۍ generation speed and a quality rating of 5/5, Default is well-suited for voice cloning, singing synthesis, content creator voice replication. GPT-SoVITS انجن د RVC-Boss under the MIT license لخوا جوړ شوی، چې دا د سوداګريزې کارونې لپاره خوندي کوي. Key capabilities include: 5-second cloning, singing voice, few-shot learning, high fidelity, cross-lingual. The GPT-SoVITS model also supports voice cloning — upload a short audio sample to create a custom voice that retains the same quality characteristics.

هېڅ کچونه

GPT-SoVITSبېلګه خبرتياوې

بېلګه GPT-SoVITS
پرمخبيونکی RVC-Boss
څرنګوالی
چټکتيا ورو
منښتليک MIT
نقلول منل شوی
ځناور معیاري (2 کریډیټونه / 1K کرښې)
پېرامې 200M
معمارۍ GPT + SoVITS
کال 2024

د غوره کارولو قضیې Default

د دې غږ پر بنسټ سپارښتل شوي کاريالونه

غږيز کتابونه او غږيزې خبرې

Use Default to narrate long-form content with natural prosody and expression.

ويډيو غږونه

د یوټیوب ویډیوګانو، اعلاناتو او ټولنیزو رسنیو محتوا ته مسلکي کیسه اضافه کړئ.

پوډکاسټونه او خپرونه

د پوډکاسټونو، راډیو، او مسلکي خپرونو لپاره د سټوډیو کیفیت محصول مناسب.

دوديزه نښه غږ

د خپل ځان د غږ سره د دې غږ د ډول د يو ځانګړي برنډ TTS غږ جوړولو کلون.

نور GPT-SoVITS غږونه

د همدې TTS بېلګه څخه نور غږونه

English Default

انګريزي Neutral

Japanese Default

جاپاني Neutral

Korean Default

کورياييName Neutral

ډېرې پوښتنې

GPT-SoVITS د GPT-style ژبې ماډل کولو سره د SoVITS (د ژباړې او ترکیب له لارې د غږ غږ انډول) سره د قوي څو-شوټ غږ کلون کولو لپاره یوځای کوي. د حوالې غږ په څیر لږ 5 ثانیو سره، دا کولی شي په سمه توګه غږ کلون کړي او د وینا کونکي ځانګړتیاوې ساتلو سره نوي وینا رامینځته کړي. دا په دواړو خبرې او غږ غږ ترکیب کې ښه دی.

GPT-SoVITS د RVC-Boss لخوا رامینځته شوی او د MIT جواز لاندې خپور شوی، کوم چې د تولید شوي غږ سوداګریز کارولو ته اجازه ورکوي.

GPT-SoVITS 4 ژبې ملاتړ کوي: انګلیسي، چینايي، جاپاني، کوریا.

GPT-SoVITS is in the Standard tier — 2 credits per 1,000 characters. You can preview any GPT-SoVITS voice for free before generating full audio.

GPT-SoVITS لري ورو (د کیفیت د اولویت) نسل سرعت. دا په هر نسل اوږد وخت نیسي خو لوړ وفاداري محصول توليدوي.

GPT-SoVITS د TTS.ai د غږ کیفیت لپاره 5 / 5 درجه ده. دا د سټوډیو درجه، د انسان په څیر وینا وړاندې کوي.

هو، GPT-SoVITS د صفر-شوټ غږ کلون کولو ملاتړ کوي. د دودیز غږ جوړولو لپاره د حوالې غږ 5-30 ثانیې پورته کړئ.

هو، GPT-SoVITS په ځانګړي توګه د غږ کلونینګ، د سندرو ترکیب، د محتوا جوړونکي غږ نقل کولو لپاره سپارښتنه کیږي. د دې 5 ثانیه کلونینګ، د سندرو غږ، د څو شتو زده کړې وړتیاوې دا د دې کارولو قضیې لپاره یو غوره انتخاب کوي.

هو، GPT-SoVITS د MIT لاندې جواز لري، کوم چې د سوداګریزو کارونې اجازه ورکوي. د GPT-SoVITS غږونو سره تولید شوي غږونه په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو پروژو کې کارول کیدی شي.

هو، د TTS.ai ټول غږونه د سوداګریزو جواز لرونکو خلاص سرچینو ماډلونو (MIT، Apache 2.0) کارولو لپاره کارول کیږي. تولید شوي غږ ستاسو دی چې په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو غوښتنلیکونو کې وکارول شي.

د ماډل نوم او غږ ID سره / api / v1 / tts / ته د POST غوښتنه واستوئ. زموږ د API سندونو پاڼه د Python، JavaScript، Go، او cURL کې د کوډ مثالونو لپاره وګورئ.

هو، په دې مخ کې د لوبې تڼۍ کلیک وکړئ ترڅو یوه نمونه واوریدل شي. تاسو کولی شئ د متن په وینا پاڼه کې د دودیز متن ډول هم وکاروئ او د هرې غږ سره وړیا مخکښ تولید کړئ.

هڅه Default اوس

کومه ليکنه وليکﺉ او د دې له خوا يې اورﺉ Default. د کارولو لپاره وړيا.