النماذج المفتوحة المصدر لتحويل النص إلى كلمة
كل نموذج من نماذج ترجمة النصوص إلى لغة على منصتنا مفتوح المصدر مع تراخيص تجارية صديقة. MIT, Apache 2.0 — لا قيود على الملكية، ولا قيود على الاستخدام، ولا رسوم ترخيص مفاجئة. استخدمها من خلال API المستضافة لدينا، أو استضافتها بنفسك على البنية التحتية الخاصة بك مع التحكم الكامل.
جربها الآن
فوائد المصادر المفتوحة لتكنولوجيا المعلومات والاتصالات
لماذا تمثل نماذج المصدر المفتوح أهمية لمشاريعك
جميع المصادر المفتوحة المرخصة
كل نموذج على TTS.ai يستخدم رخصة مفتوحة المصدر متساهلة. لا صناديق سوداء مسجلة الملكية، ولا قيد البائع، ولا رسوم ترخيص غير متوقعة.
معهد ماساتشوستس للتكنولوجيا/أباتشي 2.0
وترخَّص النماذج بموجب ترخيص معهد ماساتشوستس للتكنولوجيا أو ترخيص أباتشي 2.0، وهما أكثر تراخيص المصدر المفتوح تساهلاً.
المستضيف الذاتي
تحميل أي نموذج وتشغيله على معداتك الخاصة. التحكم الكامل على البيانات، التأخير، والبنية التحتية. لا يحتاج إلى الاعتماد على السحابة.
معالج رسوميات
النماذج هي الأمثل ل NVIDIA GPUs مع CUDA دعم. Piper يعمل على CPU فقط. معظم النماذج تحتاج 2-8GB VRAM للاستنتاج الكفؤ.
دعم المجتمع المحلي
وتقوم مجتمعات المصدر المفتوح النشطة بصيانة هذه النماذج وتحسينها. والمساهمات موضع ترحيب - تقدم الأخطاء، والتحسينات، والأصوات الجديدة على GitHub.
الاستخدام التجاري
وتسمح جميع النماذج بالاستخدام التجاري بموجب تراخيصها. وبناء المنتجات، وبيع الخدمات، وإنشاء المحتوى التجاري دون رسوم أو رسوم الاستخدام.
فهرسنا للنموذج المفتوح المصدر
كل نموذج، ترخيصه، وما يفعله أفضل
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
أفضل ل: Apache 2.0 - أفضل نوعية نموذج مجاني، 82M بارامترات، سهل الاستضافة الذاتية
حاول Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
أفضل ل: معهد ماساتشوستس للتكنولوجيا - وحدة المعالجة المركزية فقط، مثالية لأجهزة الحافة والاستضافة الذاتية المدمجة
حاول Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
أفضل ل: معهد ماساتشوستس للتكنولوجيا - البنية اﻷساسية المستخدمة في كثير من النماذج الﻻحقة
حاول VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
أفضل ل: معهد ماساتشوستس للتكنولوجيا - قدرات فريدة لتوليد الصوت تتجاوز الترجمة التحريرية التلقائية العادية
حاول Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
أفضل ل: Apache 2.0 - أقصى جودة، تنفيذ مرجعي درس على نطاق واسع
حاول Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
أفضل ل: معهد ماساتشوستس للتكنولوجيا - استنساخ صوتي مفتوح المصدر مع التحكم في اﻷسلوب الحبيبي
حاول OpenVoiceكيفية استخدام ترجمة النصوص إلى صوت مفتوحة المصدر
استخدم واجهة برمجة التطبيقات التي نستضيفها أو قم بتشغيل النماذج بنفسك
استكشاف نماذج المصدر المفتوح
تصفح كتالوجنا الذي يحتوي على أكثر من 20 نموذجاً مفتوح المصدر من نماذج ترجمة النصوص.
جرّب في متصفحك
اختبار أي نموذج مباشرة على TTS.ai دون تثبيت أي شيء. الخوادم GPU لدينا تتعامل مع المعالجة بحيث يمكنك تقييم الجودة قبل الالتزام بالاستضافة الذاتية.
استضافة ذاتية أو استخدام API
استنسخ مستودع النموذج من GitHub وتشغيله محليًا، أو استخدم تطبيق برمجة التطبيقات المستضاف الخاص بنا للإنتاج.
بنّي تطبيقك
دمج TTS في منتجك باستخدام نماذج ذاتية الاستضافة أو REST API.جميع النماذج قابلة للاستخدام التجاري دون رسوم ترخيص أو حقوق الملكية.
مقارنة التراخيص
جميع النماذج على TTS.ai تستخدم تراخيص المصدر المفتوح التجارية
| النموذج | الترخيص | الاستخدام التجاري | التعديل | الاستضافة الذاتية | إسناد المسؤولية |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | المطلوبة | |||
| Piper | MIT | اختياري | |||
| VITS | MIT | اختياري | |||
| MeloTTS | MIT | اختياري | |||
| Chatterbox | MIT | اختياري | |||
| Tortoise TTS | Apache 2.0 | المطلوبة | |||
| StyleTTS 2 | MIT | اختياري | |||
| OpenVoice | MIT | اختياري | |||
| Sesame CSM | Apache 2.0 | المطلوبة | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
الاستضافة الذاتية مقابل استضافة API
تشغيل النماذج بنفسك أو دعنا نتولى البنية التحتية
استضافة ذاتية على معداتك
كل نموذج على TTS.ai متاح كمشروع مفتوح المصدر على GitHub أو Hugging Face. قم بتنزيل الأوزان، وتثبيت التبعيات، وتشغيل الاستدلال على وحدات المعالجة الرسومية الخاصة بك. لديك السيطرة الكاملة على التأخير، والخصوصية، والقياس.
- الخصوصية الكاملة للبيانات - لا يغادر الصوت خادومك أبدا
- لا تكاليف لكل طلب بعد الإعداد الأولي
- تحسين البيانات الخاصة بك
- يتطلب معدات وحدة المعالجة الرسومية (موصى بها من NVIDIA)
- أنت تدير التحديثات، القياس، والتبعيات
استخدام TTS.ai API المستضاف
احصل على وصول فوري إلى جميع النماذج الـ 20+ من خلال واجهة برمجة تطبيقات REST واحدة. نحن نتولى توفير وحدة المعالجة الرسومية، وتحديثات النموذج، وإدارة الصفوف، والتوسع. مفتاح واجهة برمجة تطبيقات واحد يعطيك الوصول إلى كل نموذج - لا حاجة إلى إدارة نشرات منفصلة.
- لا توجد حاجة إلى معدات المعالجة الرسومية
- جميع النماذج الـ 20+ من خلال واجهة واحدة
- تحديثات وتحسينات نموذجية آلية
- 99.9 في المائة من وقت التشغيل مع وجود بنية تحتية زائدة
- لا تدفع إلا لما تستخدمه
البداية السريعة: API أو Self-Host
استخدم واجهة برمجة التطبيقات المستضافة لدينا أو قم بتركيب كوكورو محليا في دقائق
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
المصدر المفتوح، التسعير الميسور
API المستضافة لدينا تجعل المصدر المفتوح TTS متاحا دون إدارة GPUs.
المستوى المجاني
$0
50 نقطة عند التسجيل
- 4 نماذج مفتوحة المصدر مجانية
- لا يلزم التسجيل للاستخدام الأساسي
- الاستخدام التجاري المسموح به
بدء التشغيل
$9
000 500 حرف/شهر
- جميع النماذج المفتوحة المصدر البالغ عددها 20+
- استنساخ الصوت
- الوصول إلى برمجيات التطبيقات
المؤيدون
$29
000 000 2 حرف/شهر
- أولوية معالجة وحدة المعالجة المركزية
- جميع النماذج العالية الجودة
- دعم المؤسسات
الأسئلة المتكررة
الأسئلة الشائعة حول تحويل النصوص إلى صوت مفتوح المصدر
ما الذي يمكننا تحسينه؟ تساعدنا تعليقاتكم على حل المشاكل.
جرب ترجمة الصوت إلى لغة مكتوبة مفتوحة المصدر اليوم
20+ نماذج مفتوحة المصدر، كلها مرخصة تجاريا. استخدم API أو الاستضافة الذاتية - الاختيار لك.