مدلهای متن به گفتار متن باز
هر مدل TTS در پلتفرم ما منبع باز با مجوزهای تجاری دوستانه است. MIT, Apache 2.0 — بدون قفل انحصاری، بدون محدودیت استفاده، بدون هزینههای مجوز غیرمنتظره. از آنها از طریق API میزبان ما استفاده کنید، یا خودتان آنها را در زیرساخت خود با کنترل کامل میزبانی کنید.
حالا امتحانش کن
مزایای متن باز TTS
چرا مدلهای منبع باز برای پروژههای شما مهم هستند
همه با مجوز متنباز
هر مدل در TTS.ai از یک مجوز متن باز استفاده میکند. بدون جعبه سیاه انحصاری، بدون قفل فروشنده، بدون هزینه مجوز غیرمنتظره.
MIT / آپاچی ۲٫ ۰
مدلها تحت MIT یا Apache 2.0، مجوزهای آزادترین منبع آزاد، مجوز داده شدهاند.
خودمیزبان
هر مدلی را دانلود کنید و روی سختافزار خودتان اجرا کنید. کنترل کامل بر روی دادهها، تأخیر و زیرساخت خودتان. نیازی به وابستگی به ابر نیست.
بهینهسازی GPU
مدلها برای پردازندههای گرافیکی NVIDIA با پشتیبانی CUDA بهینه شدهاند. Piper تنها روی CPU اجرا میشود. بیشتر مدلها برای استنتاج کارآمد به ۲-۸ گیگابایت VRAM نیاز دارند.
نگهداری جامعه
انجمنهای فعال متنباز این مدلها را نگهداری و بهبود میدهند. مشارکتها مورد استقبال قرار میگیرند - اشکالات، بهبودها و صداهای جدید را در GitHub ارسال کنید.
استفاده تجاری
ساخت محصولات، فروش خدمات، و ایجاد محتوای تجاری بدون حق امتیاز یا هزینههای استفاده.
فهرست مدلهای منبع باز ما
هر مدل، مجوزش، و اونچه که بهتره
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
بهترین برای: آپاچی ۲٫۰ — بهترین کیفیت مدل آزاد، ۸۲ میلیون پارامتر، آسان برای خود میزبانی
سعي کن Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
بهترین برای: MIT — CPU-only، عالی برای دستگاههای کناری و self-hosting توکار
سعي کن Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
بهترین برای: MIT — معماری بنیادی که توسط بسیاری از مدلهای پاییندست استفاده میشود.
سعي کن VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
بهترین برای: MIT — قابلیتهای منحصر به فرد تولید صدا فراتر از استاندارد TTS
سعي کن Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
بهترین برای: آپاچی ۲٫۰ — کیفیت حداکثری، پیادهسازی مرجع مورد مطالعه گسترده
سعي کن Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
بهترین برای: MIT — کپی صدای متن باز با کنترل سبک دانه ای
سعي کن OpenVoiceچگونه از TTS متنباز استفاده کنیم
از API میزبان ما استفاده کنید یا خودتان مدلها را اجرا کنید
مدلهای متنباز را بررسی کنید
کاتالوگ ما از ۲۰+ مدل TTS متنباز را جستجو کنید. هر صفحه مدل مجوز، معماری، قابلیتها و نیازمندیهای خود میزبانی را نشان میدهد.
در مرورگرتان امتحان کنید
هر مدلی را مستقیماً روی TTS.ai بدون نصب هیچ چیز تست کنید. سرورهای GPU ما پردازش را انجام میدهند تا بتوانید کیفیت را قبل از تعهد به خود میزبانی ارزیابی کنید.
خود میزبان یا استفاده از API ما
کپی کردن مدل repo از GitHub و اجرا محلی، یا استفاده از API میزبان ما برای تولید. self-hosting میدهد کنترل کامل؛ API ما فراهم میکند زیرساخت مدیریت.
ساخت برنامهی کاربردی خود
TTS را با استفاده از مدلهای خود میزبانی شده یا API REST ما در محصول خود ادغام کنید. تمام مدلها قابل استفاده تجاری هستند و هیچ هزینه مجوز یا حق امتیازی ندارند.
مقایسه مجوزها
تمام مدلها در TTS.ai از مجوزهای آزاد تجاری استفاده میکنند.
| مدل | مجوز | استفاده تجاری | تغییر | خودمیزبان | تخصیص |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | لازم | |||
| Piper | MIT | گزینشی | |||
| VITS | MIT | گزینشی | |||
| MeloTTS | MIT | گزینشی | |||
| Chatterbox | MIT | گزینشی | |||
| Tortoise TTS | Apache 2.0 | لازم | |||
| StyleTTS 2 | MIT | گزینشی | |||
| OpenVoice | MIT | گزینشی | |||
| Sesame CSM | Apache 2.0 | لازم | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
وبگاه رسمی شرکت ایرباس
خودتون مدل ها رو اجرا کنين يا بذارين ما از پس زيرساخت ها بر بيايم
خودمیزبان در سختافزار شما
هر مدل در TTS.ai به عنوان یک پروژه متن باز در GitHub یا Hugging Face در دسترس است. وزنها را دانلود کنید، وابستگیها را نصب کنید، و استنتاج را بر روی GPU خود اجرا کنید. شما کنترل کاملی بر روی تأخیر، حریم خصوصی و مقیاسبندی دارید.
- حریم خصوصی کامل دادهها — صدا هرگز سرور شما را ترک نمیکند
- بدون هزینه برای هر درخواست پس از تنظیم اولیه
- تنظیمات دقیق سفارشی بر روی دادههای خودتان
- سختافزار GPU مورد نیاز است (NVIDIA توصیه میشود)
- شما بهروزرسانیها، مقیاسبندی و وابستگیها را مدیریت میکنید
استفاده از API میزبان TTS.ai
دسترسی فوری به تمامی ۲۰ مدل از طریق یک API REST واحد. ما از پیشبینی GPU، به روزرسانی مدل، مدیریت صف و مقیاسبندی پشتیبانی میکنیم. یک کلید API به شما دسترسی به هر مدل را میدهد - نیازی به مدیریت انتشارات جداگانه نیست.
- نیازی به سختافزار GPU نیست
- تمام ۲۰ مدل از طریق یک API
- به روزرسانی و بهبود مدل خودکار
- 99.9% زمان فعاليت با زيرساخت اضافي
- فقط براي چيزي که استفاده ميکني پول بده
آغاز سریع: API یا خود میزبان
از API میزبان ما استفاده کنید، یا Kokoro را به صورت محلی در چند دقیقه نصب کنید
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
منبع باز، قیمت مقرون به صرفه
API میزبان ما TTS منبع باز را بدون مدیریت GPUها قابل دسترسی میکند.
لایۀ آزاد
$0
50 کرون با ثبت نام
- 4 مدل متن باز رایگان
- ثبت نام برای استفادهٔ اساسی وجود ندارد
- استفاده تجاری مجاز است
آغازگر
$9
۵۰۰۰۰۰ کاراکتر/ماه
- تمام ۲۰+ مدل منبع باز
- شبیهسازی صدا
- دسترسی API
حرفهای
$29
۲٬۰۰۰٬۰۰۰ کاراکتر/ماه
- پردازش GPU اولویتدار
- همه مدلهاي پريميوم
- پشتیبانی شرکت
پرسشهای متداول
پرسشهای متداول درباره متن متن باز به گفتار
چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.
امروز متن باز TTS را امتحان کنید
20+ مدلهای متنباز، همگی با مجوز تجاری. از API ما استفاده کنید یا خودتان میزبانی کنید - انتخاب با شماست.