About TTS.ai

24+ مدل، 100+ صدا، همه در يه جايي

ایجاد شده توسط

TTS.ai توسط

مأموریت ما

TTS.ai بر مبنای یک باور ساده ساخته شده است: بهترین فناوری صدای هوش مصنوعی باید برای همه در دسترس باشد. در حالی که خدمات انحصاری قیمت‌های بالا را برای متن به گفتار پایه در نظر می‌گیرند، جامعهٔ متن‌باز مدل‌هایی را ایجاد کرده‌است که با کیفیت تجاری مطابقت دارند یا از آن فراتر می‌روند.

ما بهترين مدل هاي هوش مصنوعي صداي متن باز رو تو يک پلتفرم ساده براي استفاده جمع مي کنيم بدون وابستگي به فروشنده بدون جمع آوري داده ها فقط فناوري قدرتمند صدا با قيمت هاي منصفانه

چي ميخوايم؟

متن به گفتارName

24+ مدل از جمله Kokoro, Chatterbox, Bark, و بیشتر. از سنتز سبک و سریع تا خروجی با کیفیت استودیو.

تبدیل گفتار به متنComment

پشتیبانی از Whisper, Faster-Whisper, و SenseVoice. رونوشت صدا در بیش از ۱۰۰ زبان با علامت زمان و تشخیص سخنران.

شبیه‌سازی صدا

هر صدایی را از یک نمونه ۵ ثانیه‌ای شبیه‌سازی کنید. Chatterbox، GPT-SoVITS، CosyVoice ۲ و بیشتر. صداهای سفارشی برای پروژه‌های خود ایجاد کنید.

پردازش صوتی

تقویت صدا، حذف صدای خواننده، تقسیم نت‌ها، حذف انعکاس/تغییر صدا، تشخیص کلید/BPM، و تبدیل قالب‌ها. همه توسط هوش مصنوعی پشتیبانی می‌شوند.

گپ صوتی

مکالمات صوتی در زمان واقعی با هوش مصنوعی. مدل و صدای خود را برای تجربه گپ تعاملی انتخاب کنید.

توسعه‌دهنده

OpenAI-compatible REST API. Python SDK, code examples, and comprehensive documentation. ویژگی‌های صدا را در برنامه‌های خود بسازید.

متن باز اول

هر مدل در TTS.ai منبع باز است، تحت مجوز MIT یا آپاچی 2.0. ما به شفافیت و نوآوری مبتنی بر جامعه اعتقاد داریم.

ما اينکارو نميکنيم

Kokoro
Chatterbox
CosyVoice 2
Bark
Fish Speech
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Whisper
Demucs
And more...

تمام وزن‌های مدل از مخزن رسمی آن‌ها دانلود می‌شوند. ما هیچ تغییر مالکیتی اضافه نمی‌کنیم.

زیرساخت

TTS.ai روی سرورهای اختصاصی GPU با NVIDIA Tesla P40 GPUs (96GB VRAM total) اجرا می‌شود. زیرساخت ما برای تأخیر کم و کارایی بالا طراحی شده‌است:

  • خوشه‌های اختصاصی GPU برای استنتاج - بدون منابع مشترک
  • تخصیص پویا GPU بر اساس نیازهای مدل VRAM
  • سیستم اولویت صف ۵ برای کارایی بهینه
  • مدل‌های پیش‌بارگذاری شده در VRAM برای استنتاج فوری
  • انتقال صوتی پشتیبانی‌شده توسط CDN برای بارگیری‌های سریع

حریم خصوصی و امنیت

  • ما هرگز از صدا یا متن شما برای آموزش مدل‌ها استفاده نمی‌کنیم
  • حذف خودکار: صدای تولید شده به صورت خودکار پس از ۲۴ ساعت حذف می‌شود
  • رمزگذاری: همۀ داده‌ها در انتقال (TLS 1.2+) و در حالت استراحت رمزگذاری می‌شوند
  • ما دنبال نمي کنيم
  • GDPR compliant: درخواست داده‌ها یا حذف آن‌ها در هر زمان

در مورد TTS.ai FAQ

TTS.ai توسط یک تیم مستقل از توسعه‌دهندگانی که مشتاق ساختن فناوری صدای هوش مصنوعی برای همه هستند، ساخته شده است. ما بهترین مدل‌های متن‌باز از جامعه را به جای آموزش مدل‌های انحصاری نگهداری و ارائه می‌کنیم.

زیرساخت ما بر روی سرورهای اختصاصی با پردازنده‌های گرافیکی NVIDIA Tesla P40 که ۹۶ گیگابایت VRAM را فراهم می‌کنند، اجرا می‌شود.

ما ذخیره‌سازی داده‌ها را به حداقل می‌رسانیم. ورودی‌های متنی در زمان واقعی پردازش می‌شوند و به‌طور دائم ذخیره نمی‌شوند. تمام پرونده‌های صوتی بارگذاری شده و تولید شده به‌طور خودکار طی ۲۴ ساعت حذف می‌شوند. ما هرگز از داده‌های شما برای آموزش مدل‌های هوش مصنوعی استفاده نمی‌کنیم.

TTS.ai به یک جامعه در حال رشد از توسعه دهندگان، تولیدکنندگان محتوا و کسب و کارها در سراسر جهان خدمت می‌کند.

ما با زیرساخت GPU اختصاصی خود و سیستم اولویت صف ۵ برای دسترسی بالا تلاش می‌کنیم. در حالی که ما یک SLA رسمی برای کاربران لایه رایگان ارائه نمی‌کنیم، برنامه‌های پرداختی از پردازش اولویت و قابل اطمینان بالاتر بهره می‌برند.

بله. هر مدل در TTS.ai منبع باز است، تحت مجوز MIT یا آپاچی 2.0. ما به طور فعال از جامعه هوش مصنوعی متن باز پشتیبانی می کنیم و بهینه سازی و ادغام را به اکوسیستم برمی گردانیم.

نقشه راه ما شامل اضافه کردن مدل‌های جدید به محض انتشار، گسترش پشتیبانی از زبان، بهبود قابلیت‌های گفتگوی صوتی در زمان واقعی، و ساخت ابزارهای پردازش صوتی بیشتر است.

ما همیشه به توسعه‌دهندگان با استعداد علاقه‌مند به هوش مصنوعی صدا و فناوری متن‌باز علاقه‌مند هستیم. اگر علاقه‌مند به مشارکت هستید، لطفاً از طریق صفحه تماس با ما تماس بگیرید.

بله، ما از همکاری با توسعه دهندگان، کسب و کارها و سازمان‌هایی که به دنبال ادغام هوش مصنوعی صدا در محصولات خود هستند، استقبال می‌کنیم.

We conduct regular security reviews of our infrastructure. All data is encrypted in transit with TLS 1.2+, passwords are hashed with industry-standard algorithms, and API keys use one-way hashing. Server access is restricted to authorized personnel via SSH keys.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

We continuously monitor the open-source voice AI landscape and add new models as they become available and prove their quality. Major model updates typically happen monthly, with minor optimizations deployed on an ongoing basis.