در مورد

20+ مدل، 100+ صدا، همه در يه جايي

ایجاد شده توسط

TTS.ai توسط John Nader (nadermx), TTS.ai بخشی از یک مأموریت است تا بهترین فناوری صدای هوش مصنوعی را برای همه در دسترس قرار دهد — بدون قفل فروشنده، بدون جمع‌آوری داده، فقط فناوری قدرتمند صدا با قیمت‌های منصفانه.

مأموریت ما

TTS.ai بر اساس یک باور ساده ساخته شده است: بهترین فناوری صدای هوش مصنوعی باید برای همه در دسترس باشد. در حالی که سرویس‌های انحصاری برای متن به گفتار پایه قیمت‌های بالا را در نظر می‌گیرند، جامعهٔ متن‌باز مدل‌هایی را ایجاد کرده‌است که با کیفیت تجاری مطابقت دارند یا از آن فراتر می‌روند.

ما بهترین مدل های هوش مصنوعی متن باز را در یک پلت فرم ساده برای استفاده قرار می دهیم. بدون قید و بندهای فروشنده. بدون جمع آوری داده ها. فقط فناوری قدرتمند صدا با قیمت های منصفانه.

ما چه ميخوايم

متن به گفتارName

20+ مدل از جمله Kokoro, Chatterbox, Bark, و بیشتر. از سنتز سبک و سریع تا خروجی با کیفیت استودیو.

تبدیل گفتار به متنComment

پشتیبانی از Whisper, Faster-Whisper, و SenseVoice. رونوشت صدا در بیش از ۱۰۰ زبان با علامت زمان و تشخیص سخنران.

شبیه‌سازی صدا

هر صدایی را از یک نمونه ۵ ثانیه‌ای شبیه‌سازی کنید. Chatterbox، GPT-SoVITS، CosyVoice ۲ و بیشتر. صداهای سفارشی برای پروژه‌های خود ایجاد کنید.

پردازش صدا

تقویت صدا، حذف صدای خواننده، تقسیم نت‌ها، حذف انعکاس/تغییر صدا، تشخیص کلید/BPM، و تبدیل قالب‌ها. همه توسط هوش مصنوعی پشتیبانی می‌شوند.

گپ صوتی

مکالمات صوتی در زمان واقعی با هوش مصنوعی. مدل و صدای خود را برای تجربه گپ تعاملی انتخاب کنید.

رابط کاربری توسعه‌دهنده

OpenAI-compatible REST API. Python SDK, code examples, and comprehensive documentation. ویژگی‌های صدا را در برنامه‌های خود بسازید.

متن باز اول

هر مدل در TTS.ai منبع باز است، تحت مجوز MIT یا آپاچی 2.0. ما به شفافیت و نوآوری مبتنی بر جامعه اعتقاد داریم.

ما اينکارو نميکنيم

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
و بيشتر...

تمام وزن‌های مدل از مخزن رسمی آن‌ها دانلود می‌شوند. ما هیچ تغییر مالکیتی اضافه نمی‌کنیم.

زیرساخت

TTS.ai روی سرورهای اختصاصی GPU با NVIDIA Tesla P40 GPUs (96GB VRAM total) اجرا می‌شود. زیرساخت ما برای تأخیر کم و کارایی بالا طراحی شده‌است:

  • خوشه‌های اختصاصی GPU برای استنتاج - بدون منابع مشترک
  • تخصیص پویا GPU بر اساس نیازهای مدل VRAM
  • سیستم اولویت صف ۵ برای بهینه‌سازی کارایی
  • مدل‌های پیش‌بارگذاری شده در VRAM برای استنتاج فوری
  • انتقال صوتی پشتیبانی‌شده توسط CDN برای بارگیری‌های سریع

حریم خصوصی و امنیت

  • بدون آموزش داده: ما هيچوقت از صدا يا متن شما براي آموزش مدل ها استفاده نمي کنيم
  • حذف خودکار: صدای تولید شده به طور خودکار پس از ۲۴ ساعت حذف می‌شود
  • رمزبندی: همۀ داده‌ها در انتقال (TLS 1. 2+) و در حالت استراحت رمزگذاری می‌شوند
  • بدون ردیابی: ما اينکارو نميکنيم
  • سازگار با GDPR: درخواست داده‌ها یا حذف آن‌ها در هر زمان

در مورد TTS.ai FAQ

TTS.ai was created by John Nader (nadermx), an independent developer passionate about making AI voice technology accessible to everyone. We curate and serve the best open-source models from the community rather than training proprietary ones.

زیرساخت ما بر روی سرورهای اختصاصی با پردازنده‌های گرافیکی NVIDIA Tesla P40 که ۹۶ گیگابایت VRAM را فراهم می‌کنند، اجرا می‌شود.

ما ذخیره‌سازی داده‌ها را به حداقل می‌رسانیم. ورودی‌های متنی در زمان واقعی پردازش می‌شوند و به‌طور دائم ذخیره نمی‌شوند. تمام پرونده‌های صوتی بارگذاری شده و تولید شده به‌طور خودکار طی ۲۴ ساعت حذف می‌شوند. ما هرگز از داده‌های شما برای آموزش مدل‌های هوش مصنوعی استفاده نمی‌کنیم.

TTS.ai به یک جامعه در حال رشد از توسعه دهندگان، سازنده‌های محتوا و کسب و کارها در سراسر جهان خدمت می‌کند.

ما برای دسترسی بالا با زیرساخت اختصاصی GPU و سیستم اولویت صف ۵ تلاش می‌کنیم. در حالی که ما یک SLA رسمی برای کاربران لایه رایگان ارائه نمی‌کنیم، برنامه‌های پرداختی از پردازش اولویت و قابل اعتمادتر بهره می‌برند.

بله، هر مدلي که روي TTS.ai هست منبع بازه، تحت مجوز ام آي تي يا آپاچي 2.0 ما فعالانه از جامعه آزاد هوش مصنوعی صدا پشتیبانی میکنیم و بهینه سازی و ادغام رو به اکوسیستم برمیگردونیم

نقشه راه ما شامل اضافه کردن مدل‌های جدید به محض انتشار، گسترش پشتیبانی زبان، بهبود قابلیت‌های چت صدای زمان واقعی و ساخت ابزارهای پردازش صوتی بیشتر است.

TTS.ai is built and maintained by a solo developer, so there are no open positions. However, open-source contributions are always welcome — if you have ideas, bug reports, or want to collaborate on voice AI technology, reach out via the contact page or GitHub.

بله، ما از همکاری با توسعه دهندگان، کسب و کارها و سازمان‌هایی که به دنبال ادغام هوش مصنوعی صدا در محصولات خود هستند، استقبال می‌کنیم.

ما بررسی‌های امنیتی منظمی از زیرساخت‌های خود انجام می‌دهیم. تمام داده‌ها در انتقال با TLS 1.2 + رمزگذاری می‌شوند، کلمات عبور با الگوریتم‌های استاندارد صنعتی درهم‌سازی می‌شوند، و کلیدهای API از درهم‌سازی یک‌طرفه استفاده می‌کنند. دسترسی سرور به کارکنان مجاز از طریق کلیدهای SSH محدود است.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

ما به‌طور مداوم چشم‌انداز هوش مصنوعی صدای متن‌باز را نظارت می‌کنیم و مدل‌های جدیدی را به محض اینکه در دسترس قرار می‌گیرند و کیفیت خود را ثابت می‌کنند، اضافه می‌کنیم.

سوالات؟ نظرات؟

تماس با ما مستندات API