ڳالھائڻ کان ڳالھائڻ

ڳالهائيندڙ آڊيو تبديل ڪريو - آواز، جذبو، ٻولي ۽ انداز تبديل ڪريو جڏهن ته اصل مواد محفوظ ڪريو.

آڊيو ذريعو

پنھنجي فائل ھتي ڌڪيو ۽ ھيٺ لايو، يا برائوزر

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
يا پنھنجي آواز کي رڪارڊ ڪريو-
00:00

تبديلي جون ترتيبون

پنھنجي فائل ھتي ڌڪيو ۽ ھيٺ لايو، يا برائوزر

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

نتيجو

ڳالهائڻ جو آڊيو اپ لوڊ ڪريو، پنهنجو تبديلي چونڊيو، ۽ شروع ڪرڻ لاءِ تبديلي تي ڪلڪ ڪريو

ڳالهائڻ تبديل ڪيو وڃي ٿو... ھيءُ ڪجهه دير وٺي سگھي ٿو.

اصل

0:00 0:00

تبديل ٿيل

0:00 0:00

ڪيئن ڪم ڪري ٿو

وڊيو اپ لوڊ ڪريو

رڪارڊ ڪريو يا اپ لوڊ ڪريو آڊيو جيڪو توهان تبديل ڪرڻ چاهيو ٿا

تبديليون

آواز جي تبديلي، انداز جي منتقلي يا ٻوليءَ جي تبديلي چونڊيو

3. AI تبديليون

AI آڊيو پروسيس ڪري ٿو end-to-end ڳالهائڻ جي مواد کي محفوظ ڪري

ڊائون لوڊ

نتيجو ٻڌو ۽ پنھنجي تبديل ٿيل آڊيو ڊائون لوڊ ڪريو

استعمال جا ڪيس

مواد، رسائي ۽ تخليقي منصوبن لاءِ ڳالهائڻ کان ڳالهائڻ

وڊيو ڊبلنگ

اصل ڳالهائيندڙ کي برقرار رکندي ٻين ٻولين ۾ وڊيوز ڊب ڪريو

احساس جي سڌاري

رڪارڊنگ جي جذباتي آواز کي تبديل ڪريو - آرامده ڳالهائڻ کي جذباتي بڻايو، يا غير جانبدار ڳالهائڻ کي گرم ۽ دوستاڻي بڻايو.

وڊيو اوور پيداوار

مختلف آوازن ۽ اندازن سان ڳاڙهي آواز جي رڪارڊنگ کي پالش ٿيل آواز ۾ تبديل ڪريو.

آواز جي اڻ ڄاڻائي

اسپيڪر کي لڪايو

ڳالهائڻ کان ڳالهائڻ جا ماڊل

OpenVoice

تڪڙو آواز تبديلي سان granular انداز ڪنٽرول. آواز جي سڃاڻپ، رفتار، ۽ احساس سيڪنڊن ۾ تبديل ڪريو.

  • جلدي پروسيس
  • انداز منتقلي
  • وچولي ٻولي

Chatterbox

Zero-shot آواز کلوننگ fine-grained احساس ڪنٽرول سان Resemble AI کان.

  • احساس ڪنٽرول
  • Zero-shot ڪلوننگ
  • اعليٰ سچائي

CosyVoice 2

8 ٻولين ۾ زباني آوازن جو ڪلوننگ، قدرتي پروسوڊي ۽ اسٽريمنگ مدد سان.

  • ٻوليون
  • آواز جي کلوننگ
  • ڊرائنگ

گھڻا پڇيا ويندا سوال

Speech to Speech (STS) AI هڪ ڳالهائيندڙ آڊيو رڪارڊنگ کي مختلف ڳالهائڻ جي خروجي ۾ تبديل ڪري ٿو - آواز، انداز، احساس، يا ٻولي کي تبديل ڪندي جڏهن ته اصل لفظن ۽ وقت کي برقرار رکي ٿو. اهو ڳالهائڻ جي سڃاڻپ، پروسيسنگ، ۽ سنٿز کي هڪ پائيپ لائن ۾ گڏ ڪري ٿو.

لفظن مان ڳالھائڻ لکيل لفظن کي آڊيو ۾ تبديل ڪري ٿو. لفظن مان ڳالھائڻ موجود آڊيو کي انپٽ طور وٺي ٿو ۽ ان کي سڌو سنئون نئين آڊيو ۾ تبديل ڪري ٿو - اصل رڪارڊنگ جي طبعي ريتم، وقفن، زور ۽ جذبن کي برقرار رکڻ بجاءِ سڌو سنئون لفظن مان ڳالھائڻ پيدا ڪري ٿو.

عام استعمالن ۾ ٻين ٻولين ۾ وڊيوز کي ڊبلنگ ڪرڻ، هڪ رڪارڊنگ ۾ ڳالهائيندڙ جي آواز کي تبديل ڪرڻ، موجوده آڊيو جي احساس يا آواز کي ترتيب ڏيڻ، خام رڪارڊنگ کان وڊيوز ٺاهڻ، ۽ مواد کي برقرار رکندي آواز جي رڪارڊنگ کي نامعلوم ڪرڻ شامل آهن.

آواز جي تبديلي جا ماڊل جهڙوڪ OpenVoice ۽ RVC آواز کان آواز تائين تبديلي کي سنڀاليندا آهن. زبانن جي وچ ۾ ڳالهائڻ لاءِ ڳالهائڻ لاءِ، CosyVoice 2 ۽ GPT-SoVITS مختلف ٻولين ۾ کلون ۽ ٻيهر سنٿيز ڪري سگھن ٿا. Chatterbox پڻ حوالو-آڊيو تي ٻڌل سنٿيز کي سپورٽ ڪري ٿو.

ھائو. آواز جي کلوننگ ماڊل استعمال ڪندي، توھان پنھنجي ڳالھائڻ کي ٻئي ٻوليءَ ۾ تبديل ڪري سگھو ٿا جڏهن ته پنھنجي آواز جي خاصيتن کي محفوظ ڪري سگھو ٿا. AI توھان جي آواز جي شناخت کي ڪڍي ۽ آڊيو کي مقصد جي ٻولي يا انداز ۾ ٻيهر ٺاھي سگھي ٿو.

پائيپ لائن پهرين توھان جي ڳالھائڻ کي نقل ڪري ٿو، متن کي مقصد جي ٻوليءَ ۾ ترجمو ڪري ٿو، پوءِ آواز جي کلوننگ استعمال ڪري ٿو توھان جي اصل آواز ۾ ترجمو ڪيل متن کي سنٿسيٽ ڪرڻ لاءِ. CosyVoice 2 جھڙا ماڊل 8 ٻولين کي cross-language synthesis لاءِ مدد ڏين ٿا.

بهترين نتيجن لاءِ، صاف آڊيو کي گهٽ ۾ گهٽ پس منظر جي شور سان اپ لوڊ ڪريو. WAV يا FLAC 16kHz يا وڌيڪ تي بهترين ڪم ڪندو. MP3، OGG، M4A، ۽ WEBM به قبول ڪيا ويندا. صاف ڳالهائڻ تمام صحيح تبديليون پيدا ڪندو.

ويجھو-حقيقي-وقت جي پروسيسنگ اسان جي API ذريعي دستياب آهي جيئن ته Kokoro ۽ Faster Whisper. Latency ماڊل ۽ آڊيو ڊگھائي تي منحصر آهي، پر sub-3-second turnarounds مختصر بيانن لاءِ حاصل ڪري سگهجي ٿو.

ھائو. Chatterbox, Spark TTS, ۽ IndexTTS-2 جهڙا ماڊل احساس ۽ انداز ڪنٽرول کي مدد ڏين ٿا. توھان آرامده ڳالھائڻ کي حيران ڪندڙ، ڏکيو خوشيءَ ۾ يا غير جانبدار کي ڊرامي ۾ تبديل ڪري سگھو ٿا جڏھن ته ھڪ ئي لفظن ۽ ڳالھائيندڙ جي شناخت کي برقرار رکي سگھو ٿا.

ڳالهائڻ کان ڳالهائڻ سڃاڻپ ۽ سنٿس ڪريڊٽس کي گڏ ڪري ٿو. عام 1 منٽ جي تبديلي چونڊيل ماڊلن تي منحصر 3-8 ڪريڊٽس استعمال ڪري ٿي. ڪوڪورو وانگر مفت درجي جا ماڊل صفر خرچ سان سنٿس قدم لاءِ استعمال ڪري سگھجن ٿا.

مفت استعمال ڪندڙ 1 منٽ تائين آڊيو پروسيس ڪري سگھن ٿا. ادا ڪيل منصوبا 10 منٽن تائين فائلن کي سپورٽ ڪن ٿا. ڊگھي ريڪارڊنگ لاءِ آڊيو کي حصن ۾ ورهايو يا اسان جي API کي استعمال ڪريو بيچ پروسيسنگ لاءِ ڪنهن به ڊگھائي جي حدن سان.

ھائو، سمورا اپ لوڊ ٿيل آڊيو اسان جي محفوظ GPU سرور تي پروسيس ڪيا ويندا آھن ۽ 24 ڪلاڪن اندر پاڻمرادو حذف ڪيا ويندا آھن. اسان پنھنجو آڊيو ماڊلن کي تربيت ڏيڻ لاءِ ڪڏھن به استعمال نه ڪندا آھيون. سڀ منتقليون ڪوڊ ٿيل ڳنڍڻ استعمال ڪندا آھن ۽ سرور کان سرور تائين مواصلات تصديق ٿيل آھي.
5.0/5 (1)

AI سان ڪنهن به ڳالھه کي تبديل ڪريو

آواز، احساس، ٻولي ۽ انداز تبديل ڪريو. مفت ۾ رجسٽر ٿيو ۽ شروع ڪرڻ لاءِ 50 ڪرنٽ حاصل ڪريو.