النصوص المتعددة اللغات إلى حديث - أكثر من 30 لغة
تولد صوتاً طبيعياً في أكثر من 30 لغة مع النطق الأصلي. من الهندية واليابانية إلى العربية والإسبانية، تقدم نماذج الذكاء الاصطناعي لدينا تركيباً صوتياً أصلياً متعدد اللغات. مثالي للتوطين، وتعلم اللغات، والمحتوى الدولي، واستنساخ الصوت عبر اللغات.
جربها الآن
خصائص متعددة اللغات لترجمة النصوص
توليف الكلام على مستوى عالمي عبر اللغات واللغات
30+ لغة
توليد الكلام في أكثر من 30 لغة بما في ذلك الإنكليزية، الهندية، اليابانية، الإسبانية، الصينية، العربية، الكورية، الفرنسية، الألمانية، الروسية، البرتغالية، وأكثر.
النطق باللغة الأصلية
ويجري تدريب كل نموذج على تسجيلات للمتحدثين الأصليين، مما يكفل النطق الحقيقي، والنبرة، والإيقاع لكل لغة مدعومة.
الاستنساخ عبر اللغات
استنساخ صوت بلغة واحدة وتوليد الكلام بلغة أخرى - يحافظ برنامج CosyVoice 2 على الهوية الصوتية عبر 8 لغات للمحتوى العالمي.
دعم اللغات
الدعم الكامل للغات من اليمين إلى اليسار بما في ذلك العربية والعبرية والأوردية والفارسية مع معالجة النصوص الصحيحة ومخرج الكلام الطبيعي.
كشف اللغة
ويحدد الكشف التلقائي عن اللغة لغة النص المدخل ومسارات النموذج والصوت المناسبين لتحقيق أفضل جودة في النطق.
متغيرات النبرة
خيارات لهجات متعددة داخل اللغات - اﻻنكليزية اﻷمريكية والبريطانية والهندية واﻻسترالية؛ واﻻسبانية اﻷوروبية واﻻسبانية اﻷمريكية الﻻتينية؛ ومزيد من المتغيرات اﻹقليمية.
أفضل النماذج لترجمة النصوص الآلية المتعددة اللغات
النماذج التي تحظى بأوسع نطاق من الدعم اللغوي وأفضل نوعية متعددة اللغات
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
أفضل ل: أفضل نموذج متعدد اللغات - ٨ لغات مع استنساخ صوتي متعدد اللغات
حاول CosyVoice 2
MeloTTS
Free
High-quality multilingual text-to-speech that runs on CPU with minimal latency.
أفضل ل: ترجمة صوتية متعددة اللغات مجانية مع تنويعات لهجات متعددة لكل لغة
حاول MeloTTS
GPT-SoVITS
Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
أفضل ل: استنساخ بضعة صور عبر الإنجليزية والصينية واليابانية والكورية
حاول GPT-SoVITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
أفضل ل: أكثر من 13 لغة مع التعبير العاطفي والتأثيرات الصوتية
حاول Bark
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
أفضل ل: توليد فائقة السرعة عبر 9 لغات بجودة استوديو
حاول Kokoroكيفية توليد الكلام المتعدد اللغات
الكلام الطبيعي بأي لغة في ثوانٍ
اختر لغتك
اختار من أكثر من 30 لغة مدعومة. ويمكن للنظام أيضا أن يحدد تلقائيا لغة نص إدخالك لتيسير ذلك.
أدخل النص بأي لغة
دعم كامل لليونيكود يتعامل مع جميع الكتابات بما في ذلك CJK، ديفاناغاري، العربية، السيريلية، وأكثر.
اختار صوتاً أصلياً
انقر على صوت تم تحسينه للغة الخاصة بك. كل لغة توفر خيارات صوت متعددة مع تنوعات لهجة إقليمية حيثما كان متاحاً.
توليد وتحميل
توليد الكلام مع النطق الأصلي والتنزيل كMP3 أو WAV. استخدام API لتكوين دفعة عبر اللغات المتعددة.
اللغات المدعومة
اللغات المتاحة عبر نماذجنا المتعددة اللغات
الأمريكتان وأوروبا
- الإنكليزية (الولايات المتحدة والمملكة المتحدة والاتحاد الأفريقي)
- الإسبانية (إسبانيا، المكسيك)
- البرتغالية (BR, PT)
- الفرنسية (FR, CA)
- ألمانيا
- الإيطالية
- الهولندية
- بولندي
شرق آسيا
- الصينية (الماندرين)
- الصينية (كانتونية)
- اليابانية
- كورية
- فييتنامية
- التايلندية
- إندونيسي
- الملايو
جنوب آسيا والشرق الأوسط
- الهندية
- العربية
- التركية
- البنغالية
- التاميل
- الأوردو
- فارسي
- العبرية
المزيد من اللغات
- الروسية
- الأوكرانية
- التشيكية
- رومانيا
- اليونانية
- السويدية
- فنلندية
- الهنغارية
استنساخ الصوت عبر اللغات
تحدث بأي لغة بصوتك الخاص
استنسخ صوتك، وتكلم أي لغة
تسجيل عينة صوتية لمدة 10 ثوان في لغتك الأم، ثم توليد الكلام في أي من أكثر من 30 لغات مدعومة. الذكاء الاصطناعي يحافظ على خصائصك الصوتية الفريدة - النغمة، ودرجة، وأسلوب الكلام - في حين إنتاج النطق الصوتي الأصلي في اللغة المستهدفة. مثالية لمبدعي المحتوى الوصول إلى جمهور عالمي.
- عينة صوتية لمدة 10 ثوان هي كل ما تحتاجه
- حفظ خصائص صوتك عبر اللغات
- النطق واللسان الأصليان
- النماذج: CosyVoice2، OpenVoice، Fish Speech
1 - تحديد المضمون
جعل الفيديوهات والدورات الدراسية والمواد الصوتية متاحة بلغات متعددة مع الحفاظ على نفس صوت المتحدث. يمكن لمبدع يوتيوب نشر نفس الفيديو باللغات الإنجليزية والإسبانية والهندية واليابانية - كلها بصوته الخاص، ويبدو طبيعيا في كل لغة. لا توجد حاجة إلى استوديو للدبلجة.
- ترجمة المحتوى إلى اللغة المحلية دون إعادة التسجيل
- نفس الصوت في جميع النسخ اللغوية
- تجهيز المشاريع الكبيرة على دفعات
- تكامل واجهة برمجة التطبيقات لخطوط الأنابيب الآلية
دمج واجهة برمجة التطبيقات المتعددة اللغات
توليد الكلام بأي لغة باستدعاء واحد لبرنامج التواصل مع التطبيقات
import requests
languages = {
"en": "Hello, welcome to our service!",
"es": "Hola, bienvenido a nuestro servicio!",
"ja": "こんにちは、サービスへようこそ!",
"hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
"ar": "مرحبا، مرحبا بكم في خدمتنا!"
}
for lang, text in languages.items():
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": text,
"model": "cosyvoice2",
"language": lang,
"format": "mp3"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open(f"welcome_{lang}.mp3", "wb") as f:
f.write(response.content)
لا تسعير حسب اللغة
جميع اللغات الثلاثين + مشمولة في كل خطة. لا توجد رسوم إضافية للغات غير الإنجليزية.
المستوى المجاني
$0
000 15 حرف عند التسجيل
- MeloTTS متعدد اللغات (مجاني)
- 6+ لغات على المستوى المجاني
- لا يلزم التسجيل
بدء التشغيل
$9
000 500 حرف/شهر
- جميع اللغات الـ 30+
- استنساخ الصوت عبر اللغات
- جميع النماذج المتعددة اللغات
المؤيدون
$29
000 000 2 حرف/شهر
- التجهيز المتعدد اللغات ذي الأولوية
- ترجمة الدفعات إلى اللغة المحلية
- الوصول إلى واجهة برمجة التطبيقات في المؤسسة
الأسئلة المتكررة
الأسئلة الشائعة بشأن تحويل النصوص إلى كلمة بلغات متعددة
ما الذي يمكننا تحسينه؟ تساعدنا تعليقاتكم على حل المشاكل.
تحدث كل لغة بالذكاء الاصطناعي
توليد الكلام الطبيعي في 30 + لغات. المستوى المجاني يشمل نماذج متعددة اللغات - لا حاجة للتسجيل.