ترجمۀ گفتارName

ترجمه گفتار به زبان‌های دیگر با حفظ گوینده

منبع صوتی

پروندۀ خود را به اینجا بکشید و بگذارید ، یا مرور

Upload audio or video to translate. MP3, WAV, FLAC, MP4. Max 100MB.

file.mp3

0 MB
— یا از میکروفون خود ضبط کنید —
00:00

تنظیمات ترجمه

از شبیه‌سازی صدا برای حفظ بلندگوهای اصلی استفاده می‌کند

نتایج

بارگذاری صدا و انتخاب زبان‌ها برای ترجمه گفتار

ترجمه گفتار ممکنه يه لحظه طول بکشه

متن اصلی

متن ترجمه شده

صوت ترجمه شده

0:00 0:00

چگونه ترجمه گفتار کار می‌کند

بارگذاری صوتی

پروندۀ صوتی یا ویدئویی خود را در هر زبانی که پشتیبانی می‌شود بارگذاری کنید

رونوشت و ترجمه

هوش مصنوعی سخنرانی را رونوشت می کند و آن را به زبان هدف شما ترجمه می کند.

3. صدای شبیه

گزینه‌ای برای نگه داشتن گوینده اصلی

بارگیری

متن ترجمه‌شده و صدای ترکیب‌شده را در زبان هدف دریافت کنید

موارد استفاده

ترجمه گفتار برای ارتباطات و محتوای جهانیName

دوبله ویدئو

ترجمه ویدئوها به چندین زبان با حفظ گوینده اصلی

محلی‌سازی محتوا

پادکست‌ها، دوره‌ها و ارائه‌ها را برای بازارهای بین‌المللی بومی‌سازی کنید. با ترجمه محتوای صوتی بدون تلاش به مخاطبان جدید دست یابید.

جلسات بین‌المللی

ترجمۀ ضبط جلسات برای تیمهای چندملیتی. اشتراک‌گذاری یادداشتهای جلسه و خلاصه‌های صوتی در هر عضو تیم

آموزش الکترونیکی

محتوای آموزشی و سخنرانی‌ها را به چندین زبان ترجمه کنید. دوره‌ها را بدون ضبط مجدد برای دانش‌آموزان در سراسر جهان در دسترس قرار دهید.

رسانه و پخش

ترجمه بخش‌های خبری، مستندها و برنامه‌های پخش شده برای توزیع بین‌المللی با صداهای طبیعی.

ارتباطات تجاری

ترجمه آگهی‌های شرکتی، مواد آموزشی و ارتباطات داخلی برای تیم‌های جهانی به زبان مادری آن‌ها.

پرسشهای متداول

Speech translation converts spoken audio in one language into spoken audio in another language, preserving the original speaker's voice characteristics. It combines speech recognition, text translation, and voice cloning.

We support translation between 50+ languages using our speech-to-text models, and voice preservation in 8+ languages using CosyVoice 2. The most popular pairs are English ↔ Spanish, English ↔ Chinese, and English ↔ French.

Translation accuracy depends on the language pair and audio quality. For major language pairs (English, Spanish, French, German, Chinese), accuracy is comparable to professional translation services. Less common language pairs may have slightly lower accuracy.

Voice preservation quality is excellent with CosyVoice 2 and GPT-SoVITS, maintaining the speaker's unique tone, pitch, and speaking style across languages. The output sounds like the original speaker naturally speaking the target language.

بله ، ترجمه دسته ای از طریق API ما در دسترس است. می توانید چندین پروندۀ صوتی ارسال کنید و نسخه‌های ترجمه شده هر کدام را دریافت کنید. این برای ترجمه مجموعه کامل پادکست ، دوره‌های ویدئویی یا ضبط جلسات ایده‌آل است.

The translated audio maintains similar timing to the original speech, making it suitable for video dubbing. You can also export timestamped transcripts in SRT format to create aligned subtitles in the translated language.

Our API supports near-real-time translation by processing audio in chunks. While not instant, the pipeline can handle live scenarios with a few seconds of delay — useful for multilingual meetings and live presentations.

Yes, our speech translation is suitable for professional dubbing workflows. The voice-preserved output can be used for YouTube localization, e-learning courses, corporate training videos, and film dubbing with further post-production refinement.

Speech translation combines STT, translation, and TTS credits. A typical 1-minute audio translation uses approximately 5-10 credits depending on the models selected. Free accounts receive 50 credits on signup to try the service.

ما پرونده‌های MP3، WAV، OGG، FLAC، M4A و WEBM را تا ۵۰ مگابایت می‌پذیریم. برای بهترین نتایج حفظ صدا، صدای با کیفیت بالا (WAV یا FLAC) را با گفتار واضح و کمترین نویز پس‌زمینه بارگذاری کنید.

Yes, our speech recognition models handle a wide range of accents including American, British, Australian, Indian English, Latin American and European Spanish, and regional Chinese dialects. The system adapts to the speaker's accent automatically.

The translation engine handles general and domain-specific content well, including medical, legal, technical, and business terminology. For highly specialized content, you can review and edit the intermediate text transcript before generating the translated audio.
5.0/5 (1)

شکستن موانع زبانی با هوش مصنوعی

Translate speech into 30+ languages while preserving the original voice. Sign up free to start.