IndexTTS-2

Chinese Default

پیش‌فرض چینی Neutral IndexTTS-2

Chinese Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار IndexTTS-2 پشتیبانی می‌شود. این صدای سطح استاندارد به چینی صحبت می‌کند و ترکیب گفتار با کیفیت بالا را ارائه می‌دهد. با سرعت تولید متوسط و امتیاز کیفیت 4/۵، Chinese Default برای emotionally expressive content, audiobooks, virtual assistants مناسب است. این موتور توسط Index Team under the Bilibili Model License license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: emotion control, zero-shot, emotion vectors, expressive speech, fine-grained control. مدل IndexTTS-2 همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

IndexTTS-2اطلاعات مدل

مدل IndexTTS-2
توسعه‌دهنده Index Team
کیفیت
سرعت متوسط
مجوز Bilibili Model License
شبیه‌سازی پشتیبانی‌شده
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 300M
معماری Qwen2 + BigVGAN
سال 2025

بهترین موارد استفاده برای Chinese Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Chinese Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

آموزش و یادگیری الکترونیکی

ایجاد مواد آموزشی جذاب، دوره‌ها و محتوای آموزشی با روایت هوش مصنوعی واضح.

بيشتر IndexTTS-2 صداها

صداهای دیگر از همان مدل TTS

Default

انگلیسی Neutral

پرسشهای متداول

این سیستم می‌تواند بدون نیاز به داده‌های آموزشی خاص احساسی، گفتاری با نت‌های احساسی خاص مانند خوشحال، غمگین، عصبانی یا ترسیده را تولید کند. این مدل از بردارهای احساسی برای کنترل دقیق بیان احساسی گفتار تولید شده استفاده می‌کند.

IndexTTS-2 توسط Index Team توسعه داده شده و تحت مجوز Bilibili Model License منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

IndexTTS-2 از دو زبان پشتیبانی می‌کند: انگلیسی، چینی.

IndexTTS-2 در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای IndexTTS-2 را قبل از تولید صدای کامل رایگان مشاهده کنید.

IndexTTS- 2 سرعت تولید متوسطی دارد. تولید معمولاً چند ثانیه به طول متن بستگی دارد.

IndexTTS-2 is rated 4/5 for audio quality on TTS.ai. It produces high-quality, natural-sounding speech.

بله ، IndexTTS-2 از شبیه‌سازی صدای شلیک صفر پشتیبانی می‌کند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، IndexTTS-2 به ویژه برای محتوای احساسی ، کتاب صوتی ، دستیار مجازی توصیه می شود. کنترل احساسات ، شلیک صفر ، قابلیت های بردار احساسات آن را انتخاب عالی برای این مورد استفاده می کند.

بله، IndexTTS-2 تحت مجوز Bilibili Model License است که اجازه استفاده تجاری را می‌دهد. صدایی که با صداهای IndexTTS-2 تولید می‌شود می‌تواند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Chinese Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Chinese Default. آزاد برای استفاده.