عن
20+ نماذج، 100+ أصوات، كلها في مكان واحد.
أنشأه
TTS.ai أنشأه John Nader (nadermx), TTS.ai هي جزء من مهمة لجعل أفضل تكنولوجيا صوت الذكاء الاصطناعي في متناول الجميع - لا قيد على البائع، لا حصاد البيانات، فقط تكنولوجيا صوت قوية بأسعار عادلة.
مهمتنا
تم بناء TTS.ai على إيمان بسيط: ينبغي أن تكون أفضل تكنولوجيا صوت الذكاء الاصطناعي متاحة للجميع. وبينما تفرض الخدمات المسجلة الملكية أسعارا أعلى على تحويل النصوص الأساسية إلى كلام، أنشأ مجتمع المصدر المفتوح نماذج تساوي النوعية التجارية أو تتجاوزها.
نحن نجمع أفضل نماذج الذكاء الاصطناعي الصوتي مفتوح المصدر في منصة واحدة سهلة الاستخدام. لا تقيد بالبائع. لا جمع البيانات. مجرد تكنولوجيا صوت قوية بأسعار عادلة.
ما نقدمه
تحويل النص إلى كلمة
20+ نماذج بما في ذلك كوكورو، Chatterbox، Bark، وأكثر من ذلك. من التركيب الخفيف السرعة إلى الإنتاج جودة الاستوديو.
تحويل الكلام إلى نص
يدعمه Whisper، Faster-Whisper، و SenseVoice. نسخ الصوت في أكثر من 100 لغة مع الأختام الزمنية والكشف عن المتحدث.
استنساخ الصوت
استنساخ أي صوت من عينة 5 ثانية. Chatterbox، GPT-SoVITS، CosyVoice 2، وأكثر. إنشاء أصوات مخصصة لمشاريعك.
تجهيز الصوت
تحسين الصوت، وإزالة الأصوات، وتقسيم الجذور، وإزالة الصدى / الصدى، والكشف عن المفاتيح / BPM، وتحويل الصيغ.
الدردشة الصوتية
محادثات صوتية في الوقت الحقيقي مع الذكاء الاصطناعي. اختار نموذجك وصوتك لتجربة محادثة تفاعلية.
واجهة برمجة التطبيقات للمطورين
REST API متوافق مع OpenAI. Python SDK، أمثلة الشفرة، والتوثيق الشامل. بناء خصائص الصوت في تطبيقاتك.
المصدر المفتوح أولا
كل نموذج على TTS.ai مفتوح المصدر، مرخص تحت MIT أو Apache 2.0. ونحن نؤمن بالشفافية والابتكار المدفوع بالمجتمع.
نحن لا
جميع أوزان النماذج يتم تنزيلها من مستودعاتها الرسمية. لا نضيف أي تعديلات مسجلة الملكية.
دال - الهياكل الأساسية
ويعمل TTS.ai على خوادم مخصصة لمعالجات الرسوميات مع وحدات معالجة رسومية NVIDIA Tesla P40 (مجموع ذاكرة VRAM 96 جيجا بايت).
- مجموعات وحدة معالجة رسومية مخصصة للاستدلال - لا توجد موارد مشتركة
- التخصيص الدينامي للوحدة المعالجة الرسومية استنادا إلى متطلبات ذاكرة الفيديو النموذجية
- نظام أولوية 5 صفوف لتحقيق أقصى قدر من الإنتاجية
- نماذج محملة مسبقاً في ذاكرة VRAM للاستدلال الفوري
- التسليم السمعي المدعوم من CDN للتنزيل السريع
الخصوصية والأمن
- لا يوجد تدريب على البيانات: نحن لا نستخدم الصوت أو النص لتدريب النماذج
- الحذف التلقائي: تُحذف التسجيلات الصوتية المولدة تلقائيا بعد 24 ساعة
- التشفير: جميع البيانات مشفرة أثناء النقل (TLS 1.2+) وفي حالة الاستراحة
- لا تتبع: نحن لا
- الامتثال للقواعد العامة لحماية البيانات طلب بياناتك أو حذفها في أي وقت