ڳالھائڻ کان متن

AI سان آڊيو ۽ وڊيو کي متن ۾ تبديل ڪريو. 99 ٻولين، وقت جي نشانين، ۽ ڳالهائيندڙ جي ڳولا جي حمايت ڪري ٿو.

آڊيو اپ لوڊ ڪريو

پنھنجي فائل ھتي ڌڪيو ۽ ھيٺ لايو، يا برائوزر

Supports MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
— يا پنھنجي مائڪروفون مان رڪارڊ ڪريو —
00:00

ترتيب ڏيڻ

1 credits Sign up to track usage

لکڻ

آڊيو فائل اپ لوڊ ڪريو ۽ شروع ڪرڻ لاءِ ترانسڪريپ تي ڪلڪ ڪريو

آڊيو نقل ڪيو وڃي ٿو... ھيءُ ٿوري دير وٺي سگھي ٿو.

ڏٺو ويو:

ڪيئن ڪم ڪري ٿو

آڊيو اپ لوڊ

پنھنجي آڊيو يا وڊيو فائل اپ لوڊ ڪريو. اسان MP3, WAV, FLAC, OGG, M4A, MP4, ۽ WebM فارميٽ کي 100MB تائين سپورٽ ڪريون ٿا.

2. AI ترانسڪرپشن

اسان جا AI ماڊل توهان جي آڊيو کي پروسيس ڪندا آهن، ٻوليءَ کي ڳوليندا آهن، ڳالهائيندڙن کي سڃاڻندا آهن، ۽ وقت جي نشانين سان صحيح متن پيدا ڪندا آهن.

3. پنھنجو متن حاصل ڪريو

پنھنجو ترجمو ڪاپي ڪريو يا ان کي TXT يا SRT سرٽيفڪيٽ فارميٽ ۾ ڊائون لوڊ ڪريو. جيئن گھرجي ترتيب ڏيو ۽ بهتر ڪريو.

استعمال جا ڪيس

هر صنعت ۽ ورڪ فلو لاءِ ڳالهائڻ کان متن

ڪانفرنسون ۽ گڏجاڻيون

Zoom، ٽيمون، ۽ گوگل ميٽ رڪارڊ خودڪار طريقي سان نقل ڪريو. عمل جي شيءِ کي ٻيهر نه وڃايو. ڪانفرنس جي نوٽس يا عنوانن جي طور تي برآمد ڪريو.

مصاحبا ۽ صحافت

مضمونن، تحقيقي دستاويزن، ۽ دستاويزن لاءِ مصاحبن کي نقل ڪريو. اسپيڪر ڊائريزيشن آسان ذميواريءَ لاءِ ڪهڙو چيو هو اهو سڃاڻڻ لاءِ.

پوڊ ڪاسٽ ۽ ميڊيا

پوڊ ڪاسٽ جي حصن لاءِ ترنسڪريٽ ٺاهيو ۽ نوٽس ڏيکاريو. پنھنجي آڊيو مواد جي ڳولا جي قابل آرڪائيوز ٺاهيو. وڊيو پوڊ ڪاسٽ ۾ سب ٽيگ شامل ڪريو.

ليڪچر ۽ تعليم

رڪارڊ ڪيل ڪلاسن کي مطالعي جي نوٽن ۾ تبديل ڪريو. تعليمي مواد کي صحيح عنوانن سان رسائي وارو بڻايو. ٻڌڻ جي نقصان وارن شاگردن کي مدد ڏيو.

طبي ڊڪشنري

ڊاڪٽر-مريض مشورا، ڪلينڪل نوٽس، ۽ طبي ڊڪشنري نقل ڪريو. AI-powered دقت سان دستي دستاويزن جا ڪلاڪ بچايو.

قانوني عمل

بيانن، ٻڌڻين، ۽ گراهڪن جي گڏجاڻين کي نقل ڪريو. قانوني حوالن لاءِ صحيح وقت جو نشان. عدالت جي دستاويزن لاءِ مناسب فارميٽ ۾ برآمد ڪريو.

STT ماڊل جو مقابلو

Whisper

OpenAI جو مضبوط ڳالهائڻ سڃاڻپ ماڊل 99 ٻولين کي سپورٽ ڪري ٿو.

  • 0 ٻوليون
  • ٻوليون
  • ترجمو
  • وقت جون نشانيون
  • شور لاءِ مضبوط
OpenAI

Faster Whisper

4x CTranslate2 جي بهتري سان ويسپر کان وڌيڪ تيز، ساڳيو دقت.

  • 0 ٻوليون
  • 4x تيز
  • ياد گهٽاءِ
  • سڀ ماڊل سائيز
  • بيٽ پروسيس
  • VAD فلٽرنگ
SYSTRAN

SenseVoice

50 کان وڌيڪ ٻولين ۾ احساس جي ڳولا سان ڳالهائڻ سمجھڻ جو ماڊل.

  • 0 ٻوليون
  • ٻوليون
  • احساس جي ڳولا
  • آڊيو واقعا
  • اسپيڪر جو تشخيص
  • گھڻو ميٽا ڊيٽا
Alibaba (FunAudioLLM)

گھڻا پڇيا ويندا سوال

ڳالهائڻ کان متن (STT)، خودڪار ڳالهائڻ جي سڃاڻپ (ASR) پڻ سڏيو ويندو آهي، ڳالهائڻ واري ٻولي کي لکيل متن ۾ تبديل ڪري ٿو. اسان جا ماڊل AI استعمال ڪندا آهن ته گڏجاڻين، مناظرن، پوڊ ڪاسٽن، محاورن ۽ وڌيڪ کان آڊيو کي درست طريقي سان نقل ڪن.

وڌيڪ تيز ويسپر استعمال ڪرڻ جي صلاح ڏني وئي آھي - اھو اصل ويسپر کان 4x تيز آھي جڏھن ته اھو ھڪ ئي دقت برقرار رکندو آھي. جيڪڏھن توھان کي احساس جي ڳولا يا آڊيو واقعن جي ڳولا جي ضرورت آھي ته SenseVoice استعمال ڪريو.

اسان MP3، WAV، M4A، OGG، FLAC، WEBM، ۽ سڀ کان عام آڊيو/وڊيو فارميٽس کي سپورٽ ڪريون ٿا. وڌ ۾ وڌ فائل سائز 50MB آهي. وڏين فائلن لاءِ، آڊيو کي ورهائڻ تي غور ڪريو.

مفت استعمال ڪندڙ 5 منٽن تائين آڊيو رڪارڊ ڪري سگھن ٿا. ادا ڪيل منصوبا 2 ڪلاڪن تائين آڊيو فائلن جي حمايت ڪن ٿا. ڊگھي رڪارڊنگ لاءِ اسان جو API استعمال ڪريو.

اسان جا ماڊل صاف انگريزي ڳالهائڻ تي 95% + دقت حاصل ڪن ٿا. دقت ٻولي، آڊيو معيار، ۽ پس منظر جي شور تي منحصر آهي. تيز ويسپر ۽ ويسپر 99 ٻولين کي مختلف دقت جي سطحن سان مدد ڏين ٿا.

ھائو، اسان جا ترقي يافته نقل طريقا آڊيو ۾ مختلف ڳالهائيندڙن کي سڃاڻڻ ۽ نشان لڳائڻ ۾ مدد ڪري سگهن ٿا. ذريعن جو ذخيرو خاص طور تي گڏجاڻين جي نقلن، مناظرن ۽ ڪيترن ئي ماڻهن جي پوڊڪاسٽن لاءِ فائديمند آهي جتي توهان کي ڄاڻڻ جي ضرورت آهي ته ڪير ڇا چيو.

ريئل ٽائيم اسٽريمنگ ٽرانسڪرپشن اسان جي API ذريعي دستياب آهي. آڊيو کي ٽڪرن ۾ پروسيس ڪيو ويندو آهي جيئن اهو اچي ٿو، ٿوري دير سان حصيداري ٽرانسڪرپشن مهيا ڪري ٿو. هي زنده عنوانن ۽ ريئل ٽائيم نوٽس وٺڻ لاءِ مثالي آهي.

ھائو، اسان جي ترجمي جي نتيجي ۾ لفظ جي سطح تي وقت جا نشان شامل آهن جن کي SRT، VTT، يا ASS سبٽائٽ فائل طور برآمد ڪري سگهجي ٿو. هي يوٽيوب وڊيوز، آن لائن ڪورسز، ۽ سماجي ميڊيا مواد ۾ عنوان شامل ڪرڻ لاءِ مثالي آهي.

ھائو، سڀني ترجمي جي نتيجن ۾ حصي جي سطح تي وقت جو نشان شامل آهي. لفظ جي سطح تي وقت جو نشان به موجود آهي، جيڪو آڊيو ۾ هر لفظ لاءِ صحيح شروعات ۽ آخر وقت ڏيکاريندو آهي.

فسٽ ويسپير کي مختلف آڊيو تي تربيت ڏني وئي آھي ۽ وچولي پس منظر جي شور کي چڱيءَ طرح سنڀاليندو آھي. تمام گھڻي شور واري رڪارڊنگ لاءِ، آءٌ صلاح ڏيان ٿو ته آءٌ آڊيو کي اڳ ۾ اسان جي آڊيو وڌائيندڙ ذريعي هلائيندس ته جيئن نقل ڪرڻ کان اڳ واضحي ۾ واڌارو اچي.

ھائو، اپ لوڊ ٿيل آڊيو فائلون اسان جي محفوظ GPU سرور تي پروسيس ڪيون وينديون آهن ۽ ترسيل جي مڪمل ٿيڻ کانپوءِ پاڻمرادو حذف ڪيون وينديون آهن. اسين توهان جي آڊيو کي تربيت جي مقصدن لاءِ نه محفوظ ڪندا آهيون، نه ورهائيندا آهيون ۽ نه استعمال ڪندا آهيون. سڀ منتقليون ڪوڊ ٿيل هونديون آهن.

مفت استعمال ڪندڙ 5 منٽن تائين آڊيو کي بغير ڪنهن خرچ جي نقل ڪري سگهن ٿا. ادا ڪيل منصوبا آڊيو جي مدت تي ٻڌل ڪريڊٽ استعمال ڪن ٿا: تقريبن 1 ڪريڊٽ هر منٽ آڊيو. تفصيلي منصوبي جي معلومات ۽ ڪريڊٽ بنڊلز لاءِ اسان جي قيمتن جي صفحي کي ڏسو.
5.0/5 (1)

AI سان آڊيو نقل ڪريو

99 ٻولين ۾ صحيح ترجما حاصل ڪريو. مفت ۾ رجسٽر ٿيو ۽ شروع ڪرڻ لاءِ 50 ڪريڊٽس حاصل ڪريو.