تحويل الكلام إلى نص

نسخ الصوت والفيديو إلى نص مع الذكاء الاصطناعي. يدعم 99 لغة، وعلامات التوقيت، والكشف عن المتحدث.

تحميل الصوت

اسحب و أسقط ملفك هنا، أو تصفح

Supports MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
— أو تسجيل من ميكروفونك —
00:00

الإعدادات

1 credits Sign up to track usage

النصوص

تحميل ملف صوتي وانقر فوق نسخ للبدء

نقل الصوت قد يستغرق هذا لحظة

الكشف عنها:

كيف يعمل

1 - تحميل الصوت

تحميل ملف الصوت أو الفيديو الخاص بك. ونحن ندعم MP3, WAV, FLAC, OGG, M4A, MP4, و WebM صيغ حتى 100 ميغابايت.

2 - منظمة العفو الدولية

نماذج الذكاء الاصطناعي لدينا معالجة الصوت، والكشف عن اللغة، وتحديد المتحدثين، وتوليد نص دقيق مع الختم الزمني.

3 - احصل على نصك

نسخ نسختك أو تحميلها في شكل TXT أو SRT النصوص الجانبية. تحرير وصقل حسب الحاجة.

حالات الاستخدام

تحويل الكلام إلى نص لكل صناعة وتدفق عمل

الاجتماعات والمؤتمرات

نسخ تلقائيا Zoom، الأفرقة، و Google Meet التسجيلات. لا تفوت أبدا بند العمل مرة أخرى. تصدير كملاحظات الاجتماع أو النصوص الفرعية.

المقابلات والصحافة

نسخ المقابلات للمقالات، والورقات البحثية، والأفلام الوثائقية. يحدد تسجيل المتحدث من قال ماذا من أجل الإسناد السهل.

وسائط الإعلام

توليد النصوص وعرض الملاحظات لحلقات البودكاست. إنشاء محفوظات قابلة للبحث من المحتوى الصوتي. إضافة النصوص إلى البودكاست الفيديو.

المحاضرات والتعليم

وتحويل المحاضرات المسجلة إلى مذكرات دراسية، وجعل المحتوى التعليمي متاحا مع تعليقات دقيقة، ودعم الطلاب ذوي الإعاقة السمعية.

الإملاء الطبي

نقل المشاورات بين الطبيب والمريض، والملاحظات الإكلينيكية، والإملاء الطبي. توفير ساعات من التوثيق اليدوي مع دقة الذكاء الاصطناعي.

الإجراءات القانونية

وتدوين الشهادات وجلسات الاستماع والاجتماعات مع العملاء، ووضع أختام زمنية دقيقة للمراجع القانونية، وتصديرها في أشكال مناسبة لوثائق المحكمة.

مقارنة نماذج STT

Whisper

OpenAI's robust speech recognition model supporting 99 languages.

  • 0 اللغات
  • 99 languages
  • Translation
  • Timestamps
  • Robust to noise
OpenAI

Faster Whisper

4x faster than Whisper with CTranslate2 optimization, same accuracy.

  • 0 اللغات
  • 4x faster
  • Lower memory
  • All model sizes
  • Batch processing
  • VAD filtering
SYSTRAN

SenseVoice

Speech understanding model with emotion detection, 50+ languages.

  • 0 اللغات
  • 50+ languages
  • Emotion detection
  • Audio events
  • Speaker analysis
  • Rich metadata
Alibaba (FunAudioLLM)

الأسئلة المتكررة

Speech to text (STT), also called automatic speech recognition (ASR), converts spoken language into written text. Our models use AI to accurately transcribe audio from meetings, interviews, podcasts, lectures, and more.

Faster Whisper is recommended for most use cases — it's 4x faster than the original Whisper while maintaining the same accuracy. Use SenseVoice if you need emotion detection or audio event detection alongside transcription.

نحن ندعم MP3, WAV, M4A, OGG, FLAC, WEBM, وأكثر أشكال الصوت/الفيديو شيوعا. الحد الأقصى لحجم الملف هو 50 ميغابايت. بالنسبة للملفات الكبيرة، فكر في تقسيم الصوت أولاً.

Free users can transcribe up to 5 minutes of audio. Paid plans support audio files up to 2 hours. For longer recordings, use our API with batch processing.

Our models achieve 95%+ accuracy on clear English speech. Accuracy varies by language, audio quality, and background noise. Faster Whisper and Whisper support 99 languages with varying accuracy levels.

Yes, our advanced transcription modes can identify and label different speakers in the audio. Speaker diarization is especially useful for meeting transcripts, interviews, and multi-person podcasts where you need to know who said what.

يتوفر تدفق النصوص في الوقت الحقيقي من خلال واجهة برمجة التطبيقات الخاصة بنا باستخدام Faster Whisper. ويتم معالجة الصوت في قطع عند وصوله، مما يوفر نصوصا جزئية مع تأخير منخفض. وهذا مثالي للعرض النصي المباشر وأخذ الملاحظات في الوقت الحقيقي.

Yes, our transcription output includes word-level timestamps that can be exported as SRT, VTT, or ASS subtitle files. This is perfect for adding captions to YouTube videos, online courses, and social media content.

Yes, all transcription results include segment-level timestamps by default. Word-level timestamps are also available, showing the exact start and end time for each word in the audio.

برنامج Faster Whisper مدرب على الصوتيات المتنوعة ويتعامل مع الضوضاء الخلفية المعتدلة بشكل جيد. وبالنسبة للتسجيلات الشديدة الضوضاء، نوصي بتشغيل الصوتيات من خلال محسن الصوتيات أولا لتحسين الوضوح قبل النسخ.

نعم، يتم معالجة الملفات الصوتية التي يتم تحميلها على خواديمنا الآمنة للمعالجة الرسومية ويتم حذفها تلقائيا بعد الانتهاء من النسخ. ونحن لا نخزن أو نتقاسم أو نستخدم ملفاتك الصوتية لأغراض التدريب. وجميع عمليات النقل مشفرة.

Free users can transcribe up to 5 minutes of audio at no cost. Paid plans use credits based on audio duration: approximately 1 credit per minute of audio. Check our pricing page for detailed plan information and credit bundles.
5.0/5 (1)

نسخ الصوت مع الذكاء الاصطناعي

احصل على نسخ دقيقة بـ 99 لغة انضم مجاناً واحصل على 50 نقطة للبدء