در مورد
20+ مدل، 100+ صدا، همه در يه جايي
ایجاد شده توسط
TTS.ai توسط John Nader (nadermx), TTS.ai بخشی از یک مأموریت است تا بهترین فناوری صدای هوش مصنوعی را برای همه در دسترس قرار دهد — بدون قفل فروشنده، بدون جمعآوری داده، فقط فناوری قدرتمند صدا با قیمتهای منصفانه.
مأموریت ما
TTS.ai بر اساس یک باور ساده ساخته شده است: بهترین فناوری صدای هوش مصنوعی باید برای همه در دسترس باشد. در حالی که سرویسهای انحصاری برای متن به گفتار پایه قیمتهای بالا را در نظر میگیرند، جامعهٔ متنباز مدلهایی را ایجاد کردهاست که با کیفیت تجاری مطابقت دارند یا از آن فراتر میروند.
ما بهترین مدل های هوش مصنوعی متن باز را در یک پلت فرم ساده برای استفاده قرار می دهیم. بدون قید و بندهای فروشنده. بدون جمع آوری داده ها. فقط فناوری قدرتمند صدا با قیمت های منصفانه.
ما چه ميخوايم
متن به گفتارName
20+ مدل از جمله Kokoro, Chatterbox, Bark, و بیشتر. از سنتز سبک و سریع تا خروجی با کیفیت استودیو.
تبدیل گفتار به متنComment
پشتیبانی از Whisper, Faster-Whisper, و SenseVoice. رونوشت صدا در بیش از ۱۰۰ زبان با علامت زمان و تشخیص سخنران.
شبیهسازی صدا
هر صدایی را از یک نمونه ۵ ثانیهای شبیهسازی کنید. Chatterbox، GPT-SoVITS، CosyVoice ۲ و بیشتر. صداهای سفارشی برای پروژههای خود ایجاد کنید.
پردازش صدا
تقویت صدا، حذف صدای خواننده، تقسیم نتها، حذف انعکاس/تغییر صدا، تشخیص کلید/BPM، و تبدیل قالبها. همه توسط هوش مصنوعی پشتیبانی میشوند.
گپ صوتی
مکالمات صوتی در زمان واقعی با هوش مصنوعی. مدل و صدای خود را برای تجربه گپ تعاملی انتخاب کنید.
رابط کاربری توسعهدهنده
OpenAI-compatible REST API. Python SDK, code examples, and comprehensive documentation. ویژگیهای صدا را در برنامههای خود بسازید.
متن باز اول
هر مدل در TTS.ai منبع باز است، تحت مجوز MIT یا آپاچی 2.0. ما به شفافیت و نوآوری مبتنی بر جامعه اعتقاد داریم.
ما اينکارو نميکنيم
تمام وزنهای مدل از مخزن رسمی آنها دانلود میشوند. ما هیچ تغییر مالکیتی اضافه نمیکنیم.
زیرساخت
TTS.ai روی سرورهای اختصاصی GPU با NVIDIA Tesla P40 GPUs (96GB VRAM total) اجرا میشود. زیرساخت ما برای تأخیر کم و کارایی بالا طراحی شدهاست:
- خوشههای اختصاصی GPU برای استنتاج - بدون منابع مشترک
- تخصیص پویا GPU بر اساس نیازهای مدل VRAM
- سیستم اولویت صف ۵ برای بهینهسازی کارایی
- مدلهای پیشبارگذاری شده در VRAM برای استنتاج فوری
- انتقال صوتی پشتیبانیشده توسط CDN برای بارگیریهای سریع
حریم خصوصی و امنیت
- بدون آموزش داده: ما هيچوقت از صدا يا متن شما براي آموزش مدل ها استفاده نمي کنيم
- حذف خودکار: صدای تولید شده به طور خودکار پس از ۲۴ ساعت حذف میشود
- رمزبندی: همۀ دادهها در انتقال (TLS 1. 2+) و در حالت استراحت رمزگذاری میشوند
- بدون ردیابی: ما اينکارو نميکنيم
- سازگار با GDPR: درخواست دادهها یا حذف آنها در هر زمان