الذكاء الاصطناعي المجاني تحويل النص إلى كلمة
20+ :: نماذج المصدر المفتوح، 107+ الأصوات، 32+ لا يلزم إنشاء حساب.
كل ما تحتاجه للذكاء الاصطناعي الصوتي
أكثر من 30 أداة تعتمد على نماذج الذكاء الاصطناعي المفتوح المصدر
20+ نماذج صوت الذكاء الاصطناعي
أشمل مجموعة من نماذج تكنولوجيا المعلومات والاتصالات المفتوحة المصدر في منصة واحدة
Kokoro Free
كوكورو هو 82 مليون بارامترات النص إلى نموذج الكلام الذي يضرب بعيداً فوق فئة الوزن. وعلى الرغم من حجمه الصغير، فإنه ينتج خطاباً طبيعياً وتعبيرياً بشكل ملحوظ. كوكورو يدعم لغات متعددة بما في ذلك الإنجليزية، اليابانية، الصينية، والكورية مع مجموعة متنوعة من الأصوات التعبيرية. وهو يعمل بسرعة لا تصدق - توليد الصوت ما يقرب من 100 مرة أسرع من الوقت الحقيقي على وحدة المعالجة المركزية.
أفضل ل: تحويل النصوص إلى صوت عالي الجودة بأدنى حد من التأخير، وتطبيقات التدفق
تجربة مجانية
Piper Free
بايبِر هو محرك خفيف الوزن لتحويل النص إلى صوت طورته شركة راشسباي ويستخدم الهندسة المعمارية VITS و larynx ويعمل بالكامل على وحدة المعالجة المركزية مما يجعله مثاليا لأجهزة الحافة والتشغيل الآلي للمنازل والتطبيقات التي تتطلب تحويل النص إلى صوت خارج الشبكة وبأكثر من 100 صوت عبر 30 لغة، يقدم بايبِر صوت طبيعي بسرعة في الوقت الحقيقي حتى على أجهزة راببيري باي 4.
أفضل ل: الاستعراضات المسبقة السريعة، وإمكانية الوصول، والتطبيقات المدمجة
تجربة مجانية
VITS Free
VITS (الاستدلال المتباين مع التعلم المتنازع عليه لتحويل النص إلى كلام من البداية إلى النهاية) هو طريقة موازية لتحويل النص إلى كلام من البداية إلى النهاية تولد صوتاً أكثر طبيعية من النماذج الحالية ذات المرحلتين، وهي تعتمد الاستدلال المتباين مع تدفقات تطبيعية وعملية تدريب متنازع عليها، مما يحقق تحسناً كبيراً في الطبيعة.
أفضل ل: تحويل النصوص إلى كلام للأغراض العامة بصوت طبيعي
تجربة مجانية
MeloTTS Free
MeloTTS by MyShell.ai هي مكتبة متعددة اللغات لتحويل النص إلى صوت تدعم اللغة الإنجليزية (الأمريكية، البريطانية، الهندية، الأسترالية)، والإسبانية، والفرنسية، والصينية، واليابانية، والكورية. وهي سريعة للغاية، وتقوم بمعالجة النص بسرعة قريبة من الزمن الحقيقي على وحدة المعالجة المركزية وحدها.
أفضل ل: تطبيقات الإنتاج التي تحتاج إلى ترجمة تلقائية سريعة ومتعددة اللغات
تجربة مجانية
Bark Standard
نموذج تحويل النص إلى صوت قائم على المحول يولد تأثيرات واقعية للكلام والموسيقى والصوت.
مطوّر: Suno · الترخيص: MIT
جربها
Bark Small Standard
نسخة أخف من Bark مع استنتاج أسرع وانخفاض استخدام الذاكرة.
مطوّر: Suno · الترخيص: MIT
جربها
CosyVoice 2 Standard
صوت علي بابا القابل للتعديل مع تكافؤ طبيعية الإنسان والتأخير قريبة من الصفر.
مطوّر: Alibaba (Tongyi Lab) · الترخيص: Apache 2.0
جربها
Dia TTS Standard
نموذج توليد حوار متعدد المتكلمين يخلق محادثات طبيعية بين المتكلمين.
مطوّر: Nari Labs · الترخيص: Apache 2.0
جربها
Parler TTS Standard
وصف الصوت الذي تريده في اللغة الطبيعية وParler يولد الكلام المطابق.
مطوّر: Hugging Face · الترخيص: Apache 2.0
جربها
GLM-TTS Standard
يحقق أدنى معدل خطأ في الحروف بين نماذج TTS مفتوحة المصدر.
مطوّر: Zhipu AI · الترخيص: GLM-4 License
جربها
IndexTTS-2 Standard
صوت تلقائي من دون طلقة مع تحكم دقيق في العواطف وتعبير عالي
مطوّر: Index Team · الترخيص: Bilibili Model License
جربها
Spark TTS Standard
استنساخ الصوت TTS مع المشاعر القابلة للتحكم وأسلوب الكلام من خلال النداءات.
مطوّر: SparkAudio · الترخيص: CC BY-NC-SA 4.0
جربها
GPT-SoVITS Standard
صوت بضعة طلقات استنساخ TTS الذي يعيد إنتاج أي صوت من مجرد 5 ثوان من السمع.
مطوّر: RVC-Boss · الترخيص: MIT
جربها
Orpheus Standard
نموذج TTS عاطفي على المستوى البشري مدرب على 100 ألف ساعة من بيانات الكلام.
مطوّر: Canopy Labs · الترخيص: Llama 3.2 Community
جربها
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text. (باللغة الإنجليزية).
مطوّر: Alibaba (Qwen) · الترخيص: Apache 2.0
جربها
CosyVoice 2
صوت علي بابا القابل للتعديل مع تكافؤ طبيعية الإنسان والتأخير قريبة من الصفر.
اللغات: en, zh, ja, ko, fr, de, it, es
صوت مستنسخ
Spark TTS
استنساخ الصوت TTS مع المشاعر القابلة للتحكم وأسلوب الكلام من خلال النداءات.
اللغات: en, zh
صوت مستنسخ
GPT-SoVITS
صوت بضعة طلقات استنساخ TTS الذي يعيد إنتاج أي صوت من مجرد 5 ثوان من السمع.
اللغات: en, zh, ja, ko
صوت مستنسخ
Chatterbox
أحدث صيغة من استنساخ الصوت بدون طلقة مع التحكم العاطفي من (ريزيمبل آي)
اللغات: en
صوت مستنسخ
Tortoise TTS
3 - تحويل النصوص إلى كلمـة بأصوات متعددة يركـز على النوعية مع بنية ذاتية التراجع.
اللغات: en
صوت مستنسخ
OpenVoice
استنساخ الصوت الفوري مع التحكم الحبيبي على الأسلوب، العاطفة، والهجة.
اللغات: en, zh, ja, ko, fr, de, es, it
صوت مستنسخ
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text. (باللغة الإنجليزية).
اللغات: en, zh, ja, ko, de, fr, ru, pt, es, it
صوت مستنسخواجهة برمجة التطبيقات الموجهة للمطورين أولا
REST API متوافق مع OpenAI، نقطة نهاية واحدة، 22+ نماذج، دعم التدفق لتطبيقات الوقت الحقيقي.
- صيغة متوافقة مع OpenAI
- تحويل النصوص إلى صوت لتطبيقات الوقت الحقيقي
- التجهيز بالدفعات للأعمال الكبيرة
- إخطارات Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
التسعير البسيط والشفاف
ابدأ مجاناً وازداد حجمك مع نموك
مجاني
15 نقطة
- Kokoro, Piper, VITS, MeloTTS
- الحد الأقصى لعدد الحروف 500 كلمة
- ٣ مولدات/ساعة )ﻻ حساب(
المؤيدون
000 2 رصيد شهريا
- كل شيء في البداية
- الوصول إلى واجهة برمجة التطبيقات
- أولوية التجهيز
الأعمال التجارية
000 10 رصيد شهريا
- كل شيء في Pro
- تطبيقات برمجة التطبيقات بالجملة
- الطابور ذي الأولوية
الأسئلة المتكررة
ابدأ باستخدام صوت الذكاء الاصطناعي اليوم
انضم إلى المبدعين والمطورين والأعمال التجارية باستخدام TTS.ai