هوش مصنوعی آزاد متن به گفتارName
20+ مدل های منبع باز، 107+ صداها، 32+ هیچ حسابی نیاز نیست.
هر آنچه که برای هوش مصنوعی صوت نیاز دارید
بیش از ۳۰ ابزار که توسط مدلهای هوش مصنوعی متنباز پشتیبانی میشوند
20+ مدلهای صدای هوش مصنوعی
جامعترین مجموعه مدلهای TTS متنباز در یک پلتفرم
Kokoro Free
Kokoro یک مدل تبدیل متن به گفتار با ۸۲ میلیون پارامتر است که بسیار بالاتر از کلاس وزن خود عمل میکند. علیرغم اندازه کوچکش، سخنرانی بسیار طبیعی و بیانگر را تولید میکند. Kokoro از زبانهای متعددی از جمله انگلیسی، ژاپنی، چینی و کرهای با صداهای بیانگر متنوع پشتیبانی میکند. به طرز باورنکردنی سریع اجرا میشود — تولید صدا تقریباً ۱۰۰ برابر سریعتر از زمان واقعی در یک GPU است.
بهترین برای: TTS با کیفیت بالا با تأخیر کم، برنامههای کاربردی جریان
آزمون رایگان
Piper Free
پایپر یک موتور متن به گفتار سبک است که توسط راشسپی توسعه یافته و از معماریهای VITS و larynx استفاده میکند. این موتور بهطور کامل بر روی CPU اجرا میشود، که این باعث میشود برای دستگاههای کناری، اتوماسیون خانگی و برنامههایی که نیاز به TTS آفلاین دارند ایدهآل باشد. با بیش از ۱۰۰ صدا در ۳۰ زبان، پایپر حتی در یک Raspberry Pi 4 نیز گفتار طبیعی را با سرعت بیدرنگ ارائه میدهد.
بهترین برای: پیشنمایش سریع، دسترسیپذیری، و برنامههای کاربردی جاسازی شده
آزمون رایگان
VITS Free
VITS (استنتاج متغیر با یادگیری رقابتی برای متن-به-گفتار پایان به پایان) یک روش TTS موازی پایان به پایان است که صدای طبیعیتری نسبت به مدلهای دو مرحلهای فعلی تولید میکند.
بهترین برای: متن- به- گفتار کاربردی با نظم طبیعیName
آزمون رایگان
MeloTTS Free
MeloTTS توسط MyShell.ai یک کتابخانه چندزبانه TTS است که از انگلیسی (آمریکایی، بریتانیایی، هندی، استرالیایی)، اسپانیایی، فرانسوی، چینی، ژاپنی و کرهای پشتیبانی میکند. این کتابخانه بسیار سریع است و متن را با سرعت نزدیک به زمان واقعی بر روی CPU به تنهایی پردازش میکند. MeloTTS برای استفاده در تولید طراحی شده و از استنتاج CPU و GPU پشتیبانی میکند.
بهترین برای: برنامههای کاربردی تولید نیازمند TTS سریع و چندزبانه هستند
آزمون رایگان
Bark Standard
مدل متن-به-صدا مبتنی بر ترانسفورماتور که گفتار واقعی، موسیقی و جلوههای صوتی را تولید میکند.
توسعهدهنده: Suno · مجوز: MIT
سعي کن
Bark Small Standard
نسخه سبکتر Bark با استنتاج سریعتر و مصرف حافظه کمتر.
توسعهدهنده: Suno · مجوز: MIT
سعي کن
CosyVoice 2 Standard
TTS جریانی مقیاسپذیر علیبابا با طبیعیت انسانی و تأخیر نزدیک به صفر.
توسعهدهنده: Alibaba (Tongyi Lab) · مجوز: Apache 2.0
سعي کن
Dia TTS Standard
مدل تولید مکالمه چند بلندگو که مکالمات طبیعی را بین بلندگوها ایجاد میکند.
توسعهدهنده: Nari Labs · مجوز: Apache 2.0
سعي کن
Parler TTS Standard
زبانی که در آن سخن گفته میشود، زبانی است که در آن سخن گفته میشود و زبانی که در آن سخن گفته میشود زبانی است که در آن سخن گفته میشود.
توسعهدهنده: Hugging Face · مجوز: Apache 2.0
سعي کن
GLM-TTS Standard
کمترین میزان خطای کاراکتر را در بین مدلهای TTS منبع باز بدست میآورد.
توسعهدهنده: Zhipu AI · مجوز: GLM-4 License
سعي کن
IndexTTS-2 Standard
TTS Zero-shot با کنترل احساسات دقیق و بیان بالا.
توسعهدهنده: Index Team · مجوز: Bilibili Model License
سعي کن
Spark TTS Standard
شبیهسازی صدای TTS با احساسات قابل کنترل و سبک گفتار از طریق دستورات.
توسعهدهنده: SparkAudio · مجوز: CC BY-NC-SA 4.0
سعي کن
GPT-SoVITS Standard
صوت شبیه سازی چند شلیک TTS که هر صدا را از تنها ۵ ثانیه صدا تکرار میکند.
توسعهدهنده: RVC-Boss · مجوز: MIT
سعي کن
Orpheus Standard
مدل TTS سطح احساسی انسان که بر روی ۱۰۰K ساعت دادههای گفتاری آموزش دیده است.
توسعهدهنده: Canopy Labs · مجوز: Llama 3.2 Community
سعي کن
Qwen3 TTS Standard
TTS چندزبانه علیبابا با شبیهسازی صدا، صداهای پیشفرض و طراحی صدا از متن.
توسعهدهنده: Alibaba (Qwen) · مجوز: Apache 2.0
سعي کن
CosyVoice 2
TTS جریانی مقیاسپذیر علیبابا با طبیعیت انسانی و تأخیر نزدیک به صفر.
زبانها: en, zh, ja, ko, fr, de, it, es
صدای شبیه
GLM-TTS
کمترین میزان خطای کاراکتر را در بین مدلهای TTS منبع باز بدست میآورد.
زبانها: en, zh
صدای شبیه
Spark TTS
شبیهسازی صدای TTS با احساسات قابل کنترل و سبک گفتار از طریق دستورات.
زبانها: en, zh
صدای شبیه
GPT-SoVITS
صوت شبیه سازی چند شلیک TTS که هر صدا را از تنها ۵ ثانیه صدا تکرار میکند.
زبانها: en, zh, ja, ko
صدای شبیه
Chatterbox
نوعی از صوتشناسی است که با استفاده از صوتشناسی تصادفی و صوتشناسی تصادفی-مرتبط به بررسی صوت میپردازد.
زبانها: en
صدای شبیه
OpenVoice
شبیهسازی فوری صدا با کنترل دقیق بر روی سبک، احساسات و لهجه.
زبانها: en, zh, ja, ko, fr, de, es, it
صدای شبیه
Qwen3 TTS
TTS چندزبانه علیبابا با شبیهسازی صدا، صداهای پیشفرض و طراحی صدا از متن.
زبانها: en, zh, ja, ko, de, fr, ru, pt, es, it
صدای شبیهAPI توسعهدهنده اول
API REST سازگار با OpenAI. یک نقطه پایانی، ۲۲+ مدل. پشتیبانی جریانی برای برنامههای کاربردی زمان واقعی.
- قالب سازگار با OpenAI
- پخش TTS برای برنامههای زمان واقعی
- پردازش گروهی برای کارهای بزرگ
- اطلاعیههای Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
قیمتگذاری ساده و شفاف
آزاد شروع کنيد و با بزرگ شدن بزرگ تر بشينيد
حرفه اي
2000 کرون/ماه
- همه چیز در Starter
- دسترسی API
- پردازش اولویت
پرسشهای متداول
امروز شروع به استفاده از صدای هوش مصنوعی کنید
به خالقان، توسعه دهندگان و کسب و کارها با استفاده از TTS.ai بپیوندید