عن

20+ نماذج، 100+ أصوات، كلها في مكان واحد.

أنشأه

TTS.ai أنشأه John Nader (nadermx), TTS.ai هي جزء من مهمة لجعل أفضل تكنولوجيا صوت الذكاء الاصطناعي في متناول الجميع - لا قيد على البائع، لا حصاد البيانات، فقط تكنولوجيا صوت قوية بأسعار عادلة.

مهمتنا

تم بناء TTS.ai على إيمان بسيط: ينبغي أن تكون أفضل تكنولوجيا صوت الذكاء الاصطناعي متاحة للجميع. وبينما تفرض الخدمات المسجلة الملكية أسعارا أعلى على تحويل النصوص الأساسية إلى كلام، أنشأ مجتمع المصدر المفتوح نماذج تساوي النوعية التجارية أو تتجاوزها.

نحن نجمع أفضل نماذج الذكاء الاصطناعي الصوتي مفتوح المصدر في منصة واحدة سهلة الاستخدام. لا تقيد بالبائع. لا جمع البيانات. مجرد تكنولوجيا صوت قوية بأسعار عادلة.

ما نقدمه

تحويل النص إلى كلمة

20+ نماذج بما في ذلك كوكورو، Chatterbox، Bark، وأكثر من ذلك. من التركيب الخفيف السرعة إلى الإنتاج جودة الاستوديو.

تحويل الكلام إلى نص

يدعمه Whisper، Faster-Whisper، و SenseVoice. نسخ الصوت في أكثر من 100 لغة مع الأختام الزمنية والكشف عن المتحدث.

استنساخ الصوت

استنساخ أي صوت من عينة 5 ثانية. Chatterbox، GPT-SoVITS، CosyVoice 2، وأكثر. إنشاء أصوات مخصصة لمشاريعك.

تجهيز الصوت

تحسين الصوت، وإزالة الأصوات، وتقسيم الجذور، وإزالة الصدى / الصدى، والكشف عن المفاتيح / BPM، وتحويل الصيغ.

الدردشة الصوتية

محادثات صوتية في الوقت الحقيقي مع الذكاء الاصطناعي. اختار نموذجك وصوتك لتجربة محادثة تفاعلية.

واجهة برمجة التطبيقات للمطورين

REST API متوافق مع OpenAI. Python SDK، أمثلة الشفرة، والتوثيق الشامل. بناء خصائص الصوت في تطبيقاتك.

المصدر المفتوح أولا

كل نموذج على TTS.ai مفتوح المصدر، مرخص تحت MIT أو Apache 2.0. ونحن نؤمن بالشفافية والابتكار المدفوع بالمجتمع.

نحن لا

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
وأكثر...

جميع أوزان النماذج يتم تنزيلها من مستودعاتها الرسمية. لا نضيف أي تعديلات مسجلة الملكية.

دال - الهياكل الأساسية

ويعمل TTS.ai على خوادم مخصصة لمعالجات الرسوميات مع وحدات معالجة رسومية NVIDIA Tesla P40 (مجموع ذاكرة VRAM 96 جيجا بايت).

  • مجموعات وحدة معالجة رسومية مخصصة للاستدلال - لا توجد موارد مشتركة
  • التخصيص الدينامي للوحدة المعالجة الرسومية استنادا إلى متطلبات ذاكرة الفيديو النموذجية
  • نظام أولوية 5 صفوف لتحقيق أقصى قدر من الإنتاجية
  • نماذج محملة مسبقاً في ذاكرة VRAM للاستدلال الفوري
  • التسليم السمعي المدعوم من CDN للتنزيل السريع

الخصوصية والأمن

  • لا يوجد تدريب على البيانات: نحن لا نستخدم الصوت أو النص لتدريب النماذج
  • الحذف التلقائي: تُحذف التسجيلات الصوتية المولدة تلقائيا بعد 24 ساعة
  • التشفير: جميع البيانات مشفرة أثناء النقل (TLS 1.2+) وفي حالة الاستراحة
  • لا تتبع: نحن لا
  • الامتثال للقواعد العامة لحماية البيانات طلب بياناتك أو حذفها في أي وقت

حول TTS.ai الأسئلة الشائعة

لقد تم إنشاء TTS.ai من قبل جون نادر (nadermx)، وهو مطور مستقل متحمس لجعل تكنولوجيا الصوت الذكي متاحة للجميع. ونحن نقوم بإدارة وخدمة أفضل نماذج المصدر المفتوح من المجتمع بدلا من تدريب نماذج مسجلة الملكية.

وتعمل بنيتنا الأساسية على خواديم مخصصة مزودة بمعالجات رسومية من طراز NVIDIA Tesla P40 توفر 96 جيجا بايت من ذاكرة الوصول العشوائي (VRAM). وتستضيف مراكز البيانات الآمنة الواجهة الأمامية لشبكة الإنترنت وخواديم الاستدلال الخاصة بمعالجات الرسوميات مع اتصال منخفض التأخير.

نحن نقلل إلى أدنى حد من تخزين البيانات. ويتم معالجة مدخلات النصوص في الوقت الحقيقي ولا يتم تخزينها بشكل دائم. ويتم حذف جميع الملفات الصوتية المرفوعة والمولدة تلقائيًا في غضون 24 ساعة. ونحن لا نستخدم أبدًا بياناتك لتدريب نماذج الذكاء الاصطناعي.

يخدم TTS.ai مجتمعاً متنامياً من المطورين، ومنشئي المحتوى، والشركات في جميع أنحاء العالم. وتتعامل منصتنا مع الآلاف من طلبات توليد الصوت يومياً عبر أكثر من 20 نموذجاً من نماذج الذكاء الاصطناعي.

ونحن نسعى جاهدين لتحقيق توفر عالي مع بنية تحتية مخصصة لمعالجة الرسوميات ونظام أولوية 5 صفوف. وفي حين أننا لا نقدم اتفاق خدمة رسمي للمستخدمين من المستوى المجاني، فإن الخطط المدفوعة تستفيد من معالجة ذات أولوية ودرجة أعلى من الموثوقية.

نعم، كل نموذج على TTS.ai مفتوح المصدر، مرخص تحت MIT أو Apache 2.0 ونحن ندعم بنشاط مجتمع الذكاء الاصطناعي الصوتي مفتوح المصدر ونسهم في التحسينات والتكاملات إلى النظام البيئي.

تشمل خريطة طريقنا إضافة نماذج جديدة متطورة كلما تم إطلاقها، وتوسيع دعم اللغات، وتحسين قدرات المحادثة الصوتية في الوقت الحقيقي، وبناء المزيد من أدوات معالجة الصوت. ونحن ندمج باستمرار أحدث التطورات في الذكاء الاصطناعي الصوتي المفتوح المصدر.

TTS.ai تم بناؤه وصيانته من قبل مطور وحيد، لذلك لا توجد وظائف مفتوحة. ومع ذلك، فإن المساهمات مفتوحة المصدر دائما موضع ترحيب - الاتصال من خلال صفحة الاتصال أو GitHub.

نعم، نرحب بالشراكات مع المطورين والشركات والمنظمات الراغبة في دمج الذكاء الاصطناعي الصوتي في منتجاتها. اتصل بنا لمناقشة دمج واجهة برمجة التطبيقات، أو تسعير الحجم، أو نشر نموذج مخصص.

نقوم بإجراء مراجعات أمنية منتظمة للبنية التحتية لدينا. وجميع البيانات مشفرة أثناء النقل باستخدام TLS 1.2 +، وكلمة المرور مقسمة باستخدام خوارزميات معيار الصناعة، ومفاتيح API تستخدم مقسمة في اتجاه واحد.

TTS.ai متوافق مع GDPR ويتبع مبادئ تقليل البيانات. نحن لا نخزن البيانات الصوتية الشخصية بعد 24 ساعة، ولا نستخدم بيانات العملاء للتدريب، وتوفير الوصول الكامل إلى البيانات، والتصحيح، وحقوق الحذف عند الطلب.

ونحن نرصد باستمرار مشهد الذكاء الاصطناعي الصوتي المفتوح المصدر ونضيف نماذج جديدة كلما أصبحت متاحة وأثبتت جودتها. وعادة ما تحدث تحديثات رئيسية للنماذج شهريا، مع نشر تحسينات طفيفة على أساس مستمر.

هل لديك أسئلة؟

اتصال بنا وثائق API