النصوص المتعددة اللغات إلى حديث - أكثر من 30 لغة

تولد صوتاً طبيعياً في أكثر من 30 لغة مع النطق الأصلي. من الهندية واليابانية إلى العربية والإسبانية، تقدم نماذج الذكاء الاصطناعي لدينا تركيباً صوتياً أصلياً متعدد اللغات. مثالي للتوطين، وتعلم اللغات، والمحتوى الدولي، واستنساخ الصوت عبر اللغات.

30+ لغة الهندية اليابانية الإسبانية العربية

جربها الآن

مجاني مع كوكورو، بايبر، فيتس، ميلو تي تي إس
سيظهر الصوت الذي أنتجته هنا
المولدة
تنزيل
أحب TTS.ai؟ أخبر أصدقائك!

خصائص متعددة اللغات لترجمة النصوص

توليف الكلام على مستوى عالمي عبر اللغات واللغات

30+ لغة

توليد الكلام في أكثر من 30 لغة بما في ذلك الإنكليزية، الهندية، اليابانية، الإسبانية، الصينية، العربية، الكورية، الفرنسية، الألمانية، الروسية، البرتغالية، وأكثر.

النطق باللغة الأصلية

ويجري تدريب كل نموذج على تسجيلات للمتحدثين الأصليين، مما يكفل النطق الحقيقي، والنبرة، والإيقاع لكل لغة مدعومة.

الاستنساخ عبر اللغات

استنساخ صوت بلغة واحدة وتوليد الكلام بلغة أخرى - يحافظ برنامج CosyVoice 2 على الهوية الصوتية عبر 8 لغات للمحتوى العالمي.

دعم اللغات

الدعم الكامل للغات من اليمين إلى اليسار بما في ذلك العربية والعبرية والأوردية والفارسية مع معالجة النصوص الصحيحة ومخرج الكلام الطبيعي.

كشف اللغة

ويحدد الكشف التلقائي عن اللغة لغة النص المدخل ومسارات النموذج والصوت المناسبين لتحقيق أفضل جودة في النطق.

متغيرات النبرة

خيارات لهجات متعددة داخل اللغات - اﻻنكليزية اﻷمريكية والبريطانية والهندية واﻻسترالية؛ واﻻسبانية اﻷوروبية واﻻسبانية اﻷمريكية الﻻتينية؛ ومزيد من المتغيرات اﻹقليمية.

أفضل النماذج لترجمة النصوص الآلية المتعددة اللغات

النماذج التي تحظى بأوسع نطاق من الدعم اللغوي وأفضل نوعية متعددة اللغات

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 استنساخ الصوت

أفضل ل: أفضل نموذج متعدد اللغات - ٨ لغات مع استنساخ صوتي متعدد اللغات

حاول CosyVoice 2

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

أفضل ل: ترجمة صوتية متعددة اللغات مجانية مع تنويعات لهجات متعددة لكل لغة

حاول MeloTTS

GPT-SoVITSGPT-SoVITS

Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Slow 5/5 استنساخ الصوت

أفضل ل: استنساخ بضعة صور عبر الإنجليزية والصينية واليابانية والكورية

حاول GPT-SoVITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

أفضل ل: أكثر من 13 لغة مع التعبير العاطفي والتأثيرات الصوتية

حاول Bark

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

أفضل ل: توليد فائقة السرعة عبر 9 لغات بجودة استوديو

حاول Kokoro

كيفية توليد الكلام المتعدد اللغات

الكلام الطبيعي بأي لغة في ثوانٍ

1

اختر لغتك

اختار من أكثر من 30 لغة مدعومة. ويمكن للنظام أيضا أن يحدد تلقائيا لغة نص إدخالك لتيسير ذلك.

2

أدخل النص بأي لغة

دعم كامل لليونيكود يتعامل مع جميع الكتابات بما في ذلك CJK، ديفاناغاري، العربية، السيريلية، وأكثر.

3

اختار صوتاً أصلياً

انقر على صوت تم تحسينه للغة الخاصة بك. كل لغة توفر خيارات صوت متعددة مع تنوعات لهجة إقليمية حيثما كان متاحاً.

4

توليد وتحميل

توليد الكلام مع النطق الأصلي والتنزيل كMP3 أو WAV. استخدام API لتكوين دفعة عبر اللغات المتعددة.

اللغات المدعومة

اللغات المتاحة عبر نماذجنا المتعددة اللغات

الأمريكتان وأوروبا

  • الإنكليزية (الولايات المتحدة والمملكة المتحدة والاتحاد الأفريقي)
  • الإسبانية (إسبانيا، المكسيك)
  • البرتغالية (BR, PT)
  • الفرنسية (FR, CA)
  • ألمانيا
  • الإيطالية
  • الهولندية
  • بولندي

شرق آسيا

  • الصينية (الماندرين)
  • الصينية (كانتونية)
  • اليابانية
  • كورية
  • فييتنامية
  • التايلندية
  • إندونيسي
  • الملايو

جنوب آسيا والشرق الأوسط

  • الهندية
  • العربية
  • التركية
  • البنغالية
  • التاميل
  • الأوردو
  • فارسي
  • العبرية

المزيد من اللغات

  • الروسية
  • الأوكرانية
  • التشيكية
  • رومانيا
  • اليونانية
  • السويدية
  • فنلندية
  • الهنغارية

استنساخ الصوت عبر اللغات

تحدث بأي لغة بصوتك الخاص

استنسخ صوتك، وتكلم أي لغة

تسجيل عينة صوتية لمدة 10 ثوان في لغتك الأم، ثم توليد الكلام في أي من أكثر من 30 لغات مدعومة. الذكاء الاصطناعي يحافظ على خصائصك الصوتية الفريدة - النغمة، ودرجة، وأسلوب الكلام - في حين إنتاج النطق الصوتي الأصلي في اللغة المستهدفة. مثالية لمبدعي المحتوى الوصول إلى جمهور عالمي.

  • عينة صوتية لمدة 10 ثوان هي كل ما تحتاجه
  • حفظ خصائص صوتك عبر اللغات
  • النطق واللسان الأصليان
  • النماذج: CosyVoice2، OpenVoice، Fish Speech

1 - تحديد المضمون

جعل الفيديوهات والدورات الدراسية والمواد الصوتية متاحة بلغات متعددة مع الحفاظ على نفس صوت المتحدث. يمكن لمبدع يوتيوب نشر نفس الفيديو باللغات الإنجليزية والإسبانية والهندية واليابانية - كلها بصوته الخاص، ويبدو طبيعيا في كل لغة. لا توجد حاجة إلى استوديو للدبلجة.

  • ترجمة المحتوى إلى اللغة المحلية دون إعادة التسجيل
  • نفس الصوت في جميع النسخ اللغوية
  • تجهيز المشاريع الكبيرة على دفعات
  • تكامل واجهة برمجة التطبيقات لخطوط الأنابيب الآلية

دمج واجهة برمجة التطبيقات المتعددة اللغات

توليد الكلام بأي لغة باستدعاء واحد لبرنامج التواصل مع التطبيقات

بايثون - توليد الكلام المتعدد اللغات REST API
import requests

languages = {
    "en": "Hello, welcome to our service!",
    "es": "Hola, bienvenido a nuestro servicio!",
    "ja": "こんにちは、サービスへようこそ!",
    "hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
    "ar": "مرحبا، مرحبا بكم في خدمتنا!"
}

for lang, text in languages.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "cosyvoice2",
        "language": lang,
        "format": "mp3"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"welcome_{lang}.mp3", "wb") as f:
        f.write(response.content)

لا تسعير حسب اللغة

جميع اللغات الثلاثين + مشمولة في كل خطة. لا توجد رسوم إضافية للغات غير الإنجليزية.

المستوى المجاني

$0

000 15 حرف عند التسجيل

  • MeloTTS متعدد اللغات (مجاني)
  • 6+ لغات على المستوى المجاني
  • لا يلزم التسجيل

بدء التشغيل

$9

000 500 حرف/شهر

  • جميع اللغات الـ 30+
  • استنساخ الصوت عبر اللغات
  • جميع النماذج المتعددة اللغات

المؤيدون

$29

000 000 2 حرف/شهر

  • التجهيز المتعدد اللغات ذي الأولوية
  • ترجمة الدفعات إلى اللغة المحلية
  • الوصول إلى واجهة برمجة التطبيقات في المؤسسة
انظر التسعير الكامل

الأسئلة المتكررة

الأسئلة الشائعة بشأن تحويل النصوص إلى كلمة بلغات متعددة

يدعم TTS.ai أكثر من 30 لغة بما في ذلك الإنجليزية، الهندية، اليابانية، الإسبانية، الصينية (الماندرين)، العربية، الكورية، الفرنسية، الألمانية، الروسية، البرتغالية، الإيطالية، التركية، البولندية، الهولندية، السويدية، وغيرها الكثير.

ويدعم برنامج Bark اللغة الهندية بصورة أصلية مع جودة جيدة في النطق. ولنسخ الصوت باللغة الهندية، يوفر برنامج CosyVoice 2 توليفاً متعدد اللغات. كما يوفر برنامج Piper أصواتاً باللغة الهندية تعمل بكفاءة على وحدة المعالجة المركزية لتطبيقات الإنتاج.

نعم. دعمت كل من كوكورو، وميلوتيتس، وكوسيفويس 2، وجي بي تي-سوفيتس، وفيتس جميعها اللغة اليابانية مع النطق الأصلي. وتوفر كوكورو وكوسيفويس 2 أعلى جودة في الترجمة اليابانية مع لهجة الصوت المناسبة وأنماط النطق.

النماذج المدربة على بيانات المتحدثين الأصليين تنتج نطقا دقيقا للغات المدعومة. تحقق كوكورو وكوسي فويس 2 جودة قريبة من النطق الأصلي في لغاتهما المدعومة. تختلف الدقة حسب النموذج واللغة - تحقق من قائمة اللغات لكل نموذج للحصول على النتائج المثلى.

نعم، هذا ما يسمى بالاستنساخ الصوتي عبر اللغات. يمكن لـ CosyVoice 2 استنساخ صوت من عينة إنجليزية وتوليد حديث باللغات الصينية، اليابانية، الكورية، وخمس لغات أخرى مع الحفاظ على هوية وخصائص صوت المتحدث.

نعم، يتعامل خط معالجة النصوص الخاص بنا مع النصوص باللغات العربية والعبرية والأوردية والفارسية بشكل صحيح، ويجري معالجتها وتحويلها إلى لغة مع النطق المناسب، بما في ذلك معالجة العلامات المميزة وأشكال الحروف المتصلة.

بعض النماذج تتعامل مع تغيير الرموز (اللغات المختلطة) بصورة طبيعية.CosyVoice 2 و GPT-SoVITS يمكن أن تتعامل مع النص ثنائي اللغة مع النطق المناسب لكل قطاع لغة.لأفضل النتائج، إبقاء كل جيل في لغة واحدة.

يقدم MeloTTS لهجات إنجليزية أمريكية وبريطانية وهندية وأسترالية. وتقدم نماذج أخرى خيارات لهجات إنجليزية مختلفة من خلال اختيارات صوتية مختلفة. ولدى Piper أوسع تنوع من أصوات لهجات إنجليزية عبر كتالوجه الصوتي الذي يحتوي على أكثر من 100 صوت.

نعم. النماذج المجانية تدعم لغات متعددة: كوكورو (9 لغات)، بايبر (30+)، MeloTTS (6)، و VITS (4). يمكنك توليد الكلام المتعدد اللغات بتكلفة صفرية. النماذج المتميزة توفر لغات إضافية وخصائص مثل الاستنساخ عبر اللغات.

هناك نماذج متعددة تدعم لغة الماندرين الصينية: كوكورو، و CosyVoice 2، و MeloTTS، و GPT-SoVITS، و Fish Speech، و Bark. ويقدم CosyVoice 2 و GPT-SoVITS أفضل جودة للماندرين مع معالجة النبرة الصحيحة. ببساطة لصق النص الصيني واختيار صوت صيني.

نعم. Kokoro, CosyVoice 2, MeloTTS, GPT-SoVITS, and VITS support Korean. Kokoro provides the best balance of speed and quality for Korean TTS. CosyVoice 2 adds voice clone capability for Korean content.

يقوم خط معالجة النصوص الخاص بنا بتوحيد الأرقام والتواريخ والعملات والاختصارات الشائعة وفقا لاتفاقيات كل لغة. على سبيل المثال، "1000" تنطق بشكل مختلف في اللغة الإنجليزية مقابل الألمانية. ويقوم النظام بمعالجة هذه التحويلات تلقائيا بناء على اللغة المختارة.
5.0/5 (1)

ما الذي يمكننا تحسينه؟ تساعدنا تعليقاتكم على حل المشاكل.

تحدث كل لغة بالذكاء الاصطناعي

توليد الكلام الطبيعي في 30 + لغات. المستوى المجاني يشمل نماذج متعددة اللغات - لا حاجة للتسجيل.