Report Bug / Feature Request

لفظ سے متن

AI کے ساتھ آڈیو اور ویڈیو کو ٹیکسٹ میں تبدیل کریں. 99 زبانوں، ٹائم سٹیمپز، اور اسپیکر ڈیٹیکشن کی حمایت کرتا ہے.

آپ کی زبان میں اب تک ہمارے پاس TTS آوازیں نہیں ہیں. ہمیں آپ کی آوازیں شامل کرنے میں مدد کریں! آپ کی آواز فروخت کریں

آڈیو یا ویڈیو اپ لوڈ کریں

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

MP3, WAV, FLAC, OGG, M4A, MP4, WebM کی حمایت کرتا ہے. زیادہ سے زیادہ 100MB.

file.mp3

0 MB
— یا اپنے مائیکرو فون سے ریکارڈ —
00:00

ترتیبات

1,000/min حروف رجسٹر کریں استعمال کو پیچھا کریں

نقل

آ ڈيو فائل اپ لوڈ کريں اور شروع کر نے کے ليے نقل کريں کلک کريں

آڈیو نقل کر رہے ہیں... یہ ایک لمحہ لے سکتا ہے.

تلاش:

یہ کیسے کام کرتا ہے

آڈیو اپ لوڈ کریں

آپ کی آڈیو یا ویڈیو فائل اپ لوڈ کریں. ہم MP3, WAV, FLAC, OGG, M4A, MP4, اور WebM فارمیٹ کی 100MB تک حمایت کرتے ہیں.

2. AI نقل

ہمارے AI ماڈل آپ کی آڈیو پروسیسنگ، زبان کی دریافت، بولنے والوں کی شناخت، اور وقت کے نشانوں کے ساتھ صحیح تحریر پیدا کرتے ہیں.

3. آپ کا متن حاصل کریں

آپ کی نقل کاپی کریں یا اسے TXT یا SRT سب ٹیٹر فارمیٹ میں ڈاؤن لوڈ کریں. ضرورت کے مطابق تغیر اور اصلاح کریں.

استعمال کے حالات

ہر صنعت اور ورک فلو کے لئے زبان سے ٹیکس

میٹنگیں اور کانفرنسیں

خودکار طور پر زوم، ٹیم اور گوگل میٹ ریکارڈنگ کو نقل کریں. دوبارہ کبھی بھی ایک عمل ایٹم نہیں کھو سکتے. میٹنگ نوٹ یا ذیلی عنوان کے طور پر برآمد کریں.

انٹرویو اور صحافت

آرٹیکل، تحقیقی مقالات اور دستاویزی مواد کے لئے انٹرویو نقل کریں۔ اسپیکر ڈیاریزیشن آسان درجہ بندی کے لئے کس نے کیا کہا اس کی شناخت کرتا ہے۔

پوڈکاسٹ اور میڈیا

پوڈکاسٹ کے حصوں کے لیے نقل اور اشارے پیدا کریں. اپنے آڈیو مواد کی تلاشی محفوظہ بنائیں. ویڈیو پوڈکاسٹ میں ذیلی عنوانات شامل کریں.

تعلیم

ريکارڈ کريے جا نے والے محاضرات کو مطالعے کے نوٹس ميں تبديل کريں تعليمي مواد کو صحيح عنوانوں کے ساتھ دستياب کريں سننے کے نقصان کے ساتھ طالب علموں کو مدد ديں

طبي ديکتيشن

ڈاکٹر-مصاب مشورے، کلینیکل نوٹ، اور میڈیکل ڈکٹیشن کو نقل کریں. AI-powered accuracy کے ساتھ دستی دستاویزات کے گھنٹوں کو بچائیں.

قانونی عمل

نقل کیے جا رہے ہیں، اور کلائنٹ میٹنگز. قانونی حوالے کے لئے صحیح ٹائم سٹیمپ. کورٹ دستاویز کے لئے مناسب فارمیٹ میں برآمد.

STT ماڈل موازنہ

Whisper

99 زبانوں کو مدد دینے والا OpenAI کا مضبوط کلام شناخت ماڈل

  • زبانیں
  • ترجمہ
  • وقت
  • شور کے لیے مضبوط
OpenAI

Faster Whisper

CTranslate2 بہتری کے ساتھ Whisper سے 4x تیز، ایک ہی دقت.

  • 4x تیز
  • کم یادداشت
  • تمام ماڈل سائز
  • بیکٹ پروسیسنگ
  • VAD فلٹرنگ
SYSTRAN

SenseVoice

50+ زبانوں کے ساتھ جذبات کی دریافت کے ساتھ کلام سمجھنے کا ماڈل.

  • 50+ زبانیں
  • احساسات کا پتہ لگانا
  • آڈیو واقعات
  • اسپیکر
  • بھرپور میٹا ڈیٹا
Alibaba (FunAudioLLM)

لفظ سے متن میں تبدیل کرنے کے منصوبے

مفت شروع کریں، آپ کو مزید ضرورت ہو تو اپگریڈ کریں

مفت
  • 1 منٹ آڈیو حد
  • تیز Whisper ماڈل
  • بنيادي نقل
  • 100+ زبانیں
سب سے زیادہ مقبول
مفت اکاؤنٹ
  • 30 منٹ آڈیو + 15,000 حروف
  • تمام STT ماڈل
  • لفظ سطح کے ٹائم سٹیمپ
  • SRT اور VTT سب ٹیٹرز کی برآمد
  • اسپیکر
مفت میں رجسٹر کریں
پرو
  • 2 گھنٹے کی آڈیو فائلیں
  • بٹ نقل
  • ترجیحی پروسیسنگ
  • API رسائی
  • ذاتي لفظي فهرست
بہتری

بار بار پوچھے گئے سوالات

اسپیک ٹو ٹیکسٹ (STT) ، جسے خودکار اسپیک ریکگنیشن (ASR) بھی کہا جاتا ہے ، بولی ہوئی زبان کو لکھی ہوئی متن میں تبدیل کرتا ہے ۔ ہمارے ماڈل AI کا استعمال میٹنگوں ، انٹرویو ، پوڈکاسٹ ، محاضرات اور مزید سے صحیح طور پر آڈیو نقل کرنے کے لئے کرتے ہیں۔

زیادہ تر استعمال کے حالات کے ليے فسٹر ويسپر کا مشوره دیا جاتا هے - یہ اصل ويسپر سے 4x تيز هے جبکہ عين دقت کو محفوظ رکھتا هے اگر آپ کو احساسات يا او ديو ايجنٹ کٹ کی ضرورت هے تو سينس ويز استعمال کريں

ہم MP3, WAV, M4A, OGG, FLAC, WEBM اور زیادہ تر عام آڈیو/ویڈیو فارمیٹ کو سپورٹ کرتے ہیں. زیادہ سے زیادہ فائل سائز 50MB ہے. بڑے فائلوں کے لیے، اوڈیو کو پہلے تقسیم کرنے پر غور کریں.

مفت استعمال کرنے والے 5 منٹ تک اوڈیو نقل کر سکتے ہیں. ادا کردہ منصوبے 2 گھنٹوں تک اوڈیو فائلوں کی حمایت کرتے ہیں. لمبی ریکارڈنگ کے لیے، ہمارے API کو بٹک پروسیسنگ کے ساتھ استعمال کریں.

ہمارے ماڈل صاف انگريزي بولنے پر 95% + درستي حاصل کريں دقيت زبان، آڊيو کو ليٹائي اور پس منظر شور کے مطابق مختلف هے فسٹر ويسپر اور ويسپر مختلف درستي سطحوں کے ساتھ 99 زبانوں کو مدد ديتے هے

ہاں، ہماری اعلیٰ نقلی موڈ مختلف اسپیکروں کی شناخت اور لیبل کرنے کے قابل ہے۔ اسپیکر ڈیاریزیشن میٹنگ کے نقلی، انٹرویو اور متعدد افراد کے پوڈکاسٹ کے لئے خاص طور پر مفید ہے جہاں آپ کو یہ جاننے کی ضرورت ہے کہ کون نے کیا کہا ہے۔

ریئل ٹائم اسٹریمنگ ٹرانسکریپشن ہمارے API کے ذریعے فسٹر ویسپرز کے استعمال سے دستیاب ہے۔ آڈیو کو ٹکڑے ٹکڑے میں پروسیسنگ کیا جاتا ہے جیسے کہ یہ آتا ہے، کم لیٹنسی کے ساتھ جزوی ٹرانسکریپٹس فراہم کرتا ہے۔ یہ لائیو سرٹیفیکیشن اور ریئل ٹائم نوٹ لینے کے لئے بہترین ہے۔

ہاں، ہماری نقلی خروجی میں ورڈ-لیول ٹائم سٹیمپ شامل ہیں جو SRT، VTT، یا ASS سب ٹیٹر فائلوں کے طور پر برآمد کی جاسکتی ہیں۔ یہ یو ٹیوب ویڈیوز، آن لائن کورس اور سوشل میڈیا مواد میں عنوانات شامل کرنے کے لئے بہترین ہے۔

ہاں، تمام ترنسکریپشن کے نتائج میں ڈیفالٹ طور پر سیگمنٹ-لیول ٹائم سٹیمپ شامل ہیں. ورڈ-لیول ٹائم سٹیمپ بھی دستیاب ہیں، آڈیو میں ہر لفظ کے لیے صحیح شروع اور ختم وقت دکھاتے ہیں.

تیز آواز مختلف آڈیوز پر تربیت دی گئی ہے اور متوسط پس منظر کی شور کو اچھی طرح ہینڈل کرتا ہے. بہت شوردار ریکارڈنگ کے لیے، ہم ترجیح دیتے ہیں کہ آپ پہلی بار ہمارے آڈیو انکوائرر کے ذریعے آڈیو چلاتے ہیں تاکہ نقل سے پہلے واضحی میں بہتری آئے.

ہاں، اپ لوڈ کی گئی آڈیو فائلیں ہمارے محفوظ GPU سرور پر پروسیسنگ کی جاتی ہیں اور نقل مکمل ہونے کے بعد خودکار طور پر حذف کر دی جاتی ہیں۔ ہم آپ کی آڈیو کو تربیت کے مقصدوں کے لیے ذخیرہ نہیں کرتے، تقسیم نہیں کرتے یا استعمال نہیں کرتے۔ تمام منتقلیاں خفیہ ہوتی ہیں۔

مفت استعمال کرنے والے 5 منٹ تک کے اوڈیو کو بغیر کسی خرچ کے نقل کر سکتے ہیں۔ ادا کردہ منصوبے اوڈیو کی مدت کے بنیاد پر حروف کا استعمال کرتے ہیں: تقریباً 1000 حروف پر منٹ۔ تفصیلی منصوبے کی معلومات اور حروف کے پکوں کے لئے ہماری قیمتوں کی صفحے کو دیکھیں۔
5.0/5 (1)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

AI کے ساتھ آڈیو نقل کریں

99 زبانوں میں صحیح نقل حاصل کریں. مفت میں رجسٹر کریں اور شروع کرنے کے لئے 15,000 حروف حاصل کریں.