کلام سے کلام

بولے گئے آڈیو کو تبدیل کریں - آواز، جذبہ، زبان اور انداز کو تبدیل کریں اور اصل مواد کو محفوظ رکھیں.

آپ کی زبان میں اب تک ہمارے پاس TTS آوازیں نہیں ہیں. ہمیں آپ کی آوازیں شامل کرنے میں مدد کریں! آپ کی آواز فروخت کریں

آڈیو سرچشمہ

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
- یا اپنی آواز ریکارڈ -
00:00

تبدیلی کی ترتیبات

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

نتيجہ

آواز آ ڊيو اپ لوڈ کريں ، اپنا تبديلي منتخب کريں اور شروع کر نے کے ليے تبديلي کلک کريں

بات تبدیل... یہ ایک لمحہ لے سکتا ہے.

اصل

تبدیل شدہ

یہ کیسے کام کرتا ہے

1. اپ لوڈ کلام

آپ تبدیل کرنا چاہتے ہیں اوڈیو ریکارڈ یا اپ لوڈ کریں

تبديلي منتخب کريں

آواز تبديلي، انداز منتقلي يا زبان تبديلي منتخب کريں

3. AI تبديلياں

AI اوڈيو پروسیسنگ انڈ-ٹو-اینڈ کلام کے مواد کو محفوظ رکھتا ہے

ڈاؤن لوڈ

نتيجہ سنيں اور آپ کے تبديل شدہ او ڊيو ڈائون لوڈ کريں

استعمال کے حالات

مضمون، رسائی، اور تخلیقی پروجیکٹوں کے لیے کلام سے کلام

ویڈیو ڈبلنگ

ویڈیوز کو دیگر زبانوں میں ڈب کریں اور اس کے ساتھ ساتھ اصل بولنے والے کی آواز کی خصوصیات کو محفوظ رکھیں.

احساسات کا تناسب

ريکورڈنگ کے جذباتي آواز کو تبديل کريں - خاموش بولي کي جذباتي بنا ئيں يا غير جانبدار بولي گرم اور دوستي

وائٹ اوور پروڈکشن

مختلف آوازوں اور اندازوں کے ساتھ صاف آوازوں میں غیر محفوظ آواز ریکارڈنگ تبدیل کریں

آواز نام نہاد

ہر لفظ کو محفوظ کرتے ہوئے ایک اسپیکر کی شناخت کو چھپائیں، خفیہ یا نجی حفاظت کے لئے.

کلام سے کلام ماڈل

OpenVoice

گرينل انداز کنٹرول کے ساتھ تیز آواز تبدیلي. آواز شناخت، رفتار اور جذبات کو سیکنڈز میں بدليں

  • تیز پروسیسنگ
  • انداز منتقلی
  • کراس-لنگويج

Chatterbox

Resemble AI سے fine-grained احساس کنٹرول کے ساتھ صفر-شٹ آواز کلوننگ.

  • احساسات کا کنٹرول
  • صفر-شٹ کلوننگ
  • اعلیٰ وفاداري

CosyVoice 2

8 زبانوں میں کراس-زبان آواز کلوننگ قدرتی prosody اور اسٹریمنگ حمایت کے ساتھ.

  • زبانیں
  • آواز کا کلوننگ
  • ڈرائنگ

بار بار پوچھے گئے سوالات

اسپیک ٹو اسپیک (STS) AI ایک بولے ہوئے اوڈیو ریکارڈنگ کو مختلف بولے ہوئے آؤٹ پٹ میں تبدیل کرتا ہے- آواز، انداز، جذبہ، یا زبان کو تبدیل کرتے ہوئے اصل لفظوں اور وقت کو محفوظ کرتے ہوئے۔ یہ بولے جانے، پروسیسنگ، اور ترکیب کو ایک واحد پائپ لائن میں جوڑتا ہے۔

ٹیکسٹ سے اسپیکینگ لکھے ہوئے متن کو آڈیو میں تبدیل کرتا ہے ۔ اسپیکینگ سے اسپیکینگ موجود آڈیو کو انپٹ کے طور پر لیتا ہے اور اسے براہ راست نئی آڈیو میں تبدیل کرتا ہے — اصل ریکارڈ کی قدرتی ریتمی کو محفوظ کرتے ہوئے ، توقف ، زور اور احساس کو صاف متن سے اسپیکینگ پیدا کرنے کی بجائے

عام استعمال میں ویڈیوز کو دوسری زبانوں میں ڈبلینگ کرنا، ایک ریکارڈ میں اسپیکر کی آواز کو تبدیل کرنا، موجود آڈیو کی جذبات یا آواز کو تبدیل کرنا، خام ریکارڈ سے وائٹ اوور بنانا، اور مواد کو محفوظ رکھتے ہوئے آواز کی ریکارڈنگ کو نامعلوم بنانا شامل ہے۔

آواز تبدیل ماڈل جیسے اوپن وائٹس اور RVC آواز سے آواز تک تبدیلی کو ہینڈل کرتے ہیں. زبانوں کے درمیان گفتگو کے لئے، CosyVoice2 اور GPT-SoVITS مختلف زبانوں میں کلون اور ری-سنتھزز کر سکتے ہیں. Chatterbox بھی حوالہ-آڈیو پر مبنی سنتز کو مدد دیتا ہے.

ہاں، آواز کلوننگ ماڈل استعمال کر کے، آپ اپنی آواز کو مختلف زبان میں تبدیل کر سکتے ہیں جبکہ آپ کی آواز کی خصوصیت محفوظ رہتی ہے۔ AI آپ کی آواز کی شناخت کو نکالا اور مقصد زبان یا انداز میں آڈیو کو دوبارہ سنتھز کر سکتا ہے۔

پيپ لائن اول آپ کے بولنے کو نقل کر تا هے ، متن کا مقصد زبان ميں ترجمہ کر تا هے ، پھر آواز کي کلوننگ استعمال کر تا هے تا ترجمہ کيے گئے متن کو آپ کی اصل آواز ميں منسجم کر نے کے ليے ۔ CosyVoice2کے طرح کے ماڈل کراس-لنگويج سينتھز کے ليے 8 زبانوں کو مدد ديتے هيں

بہترین نتيجے کے لیے، کم سے کم پس منظر کی شور کے ساتھ صاف آڈیو اپ لوڈ کریں. WAV یا FLAC 16kHz یا اس سے زیادہ پر بہترین کام کرتے ہیں. MP3، OGG، M4A، اور WEBM کو بھی قبول کیا جاتا ہے. صاف بولنا سب سے صحیح تبدیلیاں پیدا کرتا ہے.

قریبی ریئل ٹائم پروسیسنگ ہمارے API کے ذریعے دستیاب ہے جو کہ Kokoro جیسے تیز ماڈلز کو استعمال کر رہا ہے اور شناخت کے لئے Faster Whisper. Latency ماڈل اور آڈیو لمبائی پر منحصر ہے، لیکن سب-3 سیکنڈ کے ترنراؤنڈز مختصر اتنظامات کے لئے حاصل کرنے کے قابل ہیں.

ہاں Chatterbox، Spark TTS اور IndexTTS-2 جیسے ماڈل جذبات اور انداز کو کنٹرول کر نے کے ليے مدد کر تے هيں آپ آرام سے بول کر کيا جا سکتا هے ، غم سے خوشي ميں ، يا خنثي سے درامائي ميں ، اور هميشه کے ليے عين لفظ اور ناطق کي شناخت رکھ سکتے هيں

سکوپ سے سکوپ تک عرفي اور سنتھز کر کٹ کا ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں ميں

مفت استعمال کرنے والے 1 منٹ تک آڈیو پروسیسنگ کر سکتے ہیں. ادا کردہ پلان 10 منٹ تک فائلوں کی حمایت کرتے ہیں. لمبی ریکارڈنگ کے لیے، آڈیو کو حصوں میں تقسیم کریں یا بغیر لمبائی کی حد کے بیچ پروسیسنگ کے لیے ہماری API استعمال کریں.

ہاں، تمام اپ لوڈ شدہ آڈیو ہمارے محفوظ GPU سرور پر پروسیسنگ کی جاتی ہے اور خودکار طور پر 24 گھنٹوں کے اندر حذف کی جاتی ہے۔ ہم آپ کی آڈیو کو ماڈلز کو تربیت دینے کے لئے کبھی نہیں استعمال کرتے۔ تمام منتقلیاں خفیہ کنکشن کا استعمال کرتی ہیں اور سرور سے سرور مواصلات تصدیق کی جاتی ہے۔
5.0/5 (1)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

AI کے ساتھ کسی بھی کلام کو تبدیل کریں

آواز، احساس، زبان اور انداز بدليں مفت ري رجسٽري کريں اور شروع کر نے کے ليے 50 کريٹس حاصل کريں