Spark TTS

Chinese Default

پیش‌فرض چینی Neutral Spark TTS

Chinese Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار Spark TTS پشتیبانی می‌شود. این صدای سطح استاندارد به چینی صحبت می‌کند و ترکیب گفتار با کیفیت بالا را ارائه می‌دهد. با سرعت تولید متوسط و امتیاز کیفیت 4/۵، Chinese Default برای content creation with cloned voices and emotional control مناسب است. این موتور توسط SparkAudio under the CC BY-NC-SA 4.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: voice cloning, emotion control, style control, prompt-based, 5-second cloning. مدل Spark TTS همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

Spark TTSاطلاعات مدل

مدل Spark TTS
توسعه‌دهنده SparkAudio
کیفیت
سرعت متوسط
مجوز CC BY-NC-SA 4.0
شبیه‌سازی پشتیبانی‌شده
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 500M
معماری BiCodec + LLM + Flow Matching
سال 2025

بهترین موارد استفاده برای Chinese Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Chinese Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

آموزش و یادگیری الکترونیکی

ایجاد مواد آموزشی جذاب، دوره‌ها و محتوای آموزشی با روایت هوش مصنوعی واضح.

بيشتر Spark TTS صداها

صداهای دیگر از همان مدل TTS

Default

انگلیسی Neutral

پرسشهای متداول

Spark TTS توسط SparkAudio یک مدل متن به گفتار است که شبیه‌سازی صدا را با احساسات قابل کنترل و سبک گفتار ترکیب می‌کند. با استفاده از تنها ۵ ثانیه از صدای مرجع، می‌تواند یک صدا را شبیه‌سازی کند و سپس گفتاری با احساسات، سرعت‌ها و سبک‌های مختلف تولید کند در حالی که هویت صدای شبیه‌سازی شده را حفظ می‌کند. Spark TTS از یک سیستم کنترل مبتنی بر دستورالعمل استفاده می‌کند.

اسپارک TTS توسط اسپارک آدیو توسعه داده شده و تحت مجوز CC BY-NC-SA 4.0 منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

Spark TTS از دو زبان پشتیبانی می‌کند: انگلیسی، چینی.

Spark TTS در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای Spark TTS را قبل از تولید صدای کامل رایگان داشته باشید.

Spark TTS سرعت تولید متوسطی دارد. تولید معمولاً چند ثانیه به طول متن بستگی دارد.

Spark TTS is rated 4/5 for audio quality on TTS.ai. It produces high-quality, natural-sounding speech.

بله، Spark TTS از شبیه‌سازی صدای صفر-شلیک پشتیبانی می‌کند. برای ایجاد صدای سفارشی، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، Spark TTS به طور خاص برای ایجاد محتوا با صداهای شبیه سازی شده و کنترل احساسات توصیه می‌شود. شبیه سازی صدا ، کنترل احساسات ، قابلیت‌های کنترل سبک آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله، اسپارک TTS تحت مجوز CC BY-NC-SA 4.0 است که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای اسپارک TTS تولید می‌شود می‌تواند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Chinese Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Chinese Default. آزاد برای استفاده.