Tortoise TTS

Random

پریمیوم انگلیسی Neutral Tortoise TTS

Random یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار Tortoise TTS پشتیبانی می‌شود. این صدای درجه بالا به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید آهسته تر اما با دقتی بالا و امتیاز کیفیت 5/۵، Random برای audiobooks, premium content, quality-first applications مناسب است. این موتور توسط James Betker under the Apache 2.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: highest quality, multi-voice, dall-e architecture, voice cloning, autoregressive. مدل Tortoise TTS همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

Tortoise TTSاطلاعات مدل

مدل Tortoise TTS
توسعه‌دهنده James Betker
کیفیت
سرعت آهسته
مجوز Apache 2.0
شبیه‌سازی پشتیبانی‌شده
حيوان Premium) ۴ کرون / ۱K کاراکتر (
پارامترها 400M
معماری DALL-E Autoregressive
داده‌های آموزشی 50000 ساعت
سال 2022

بهترین موارد استفاده برای Random

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Random برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

پرسشهای متداول

Tortoise TTS یک سیستم متن به گفتار چند صدای خودبازگشتی است که کیفیت صدا را بر سرعت اولویت می‌دهد. از معماری الهام گرفته از DALL- E برای تولید گفتار بسیار طبیعی با شباهت عالی به صدا و سخنران استفاده می‌کند. در حالی که نسبت به بسیاری از جایگزین‌ها کندتر است ، Tortoise برخی از واقعی‌ترین گفتارهای ترکیبی را در اکوسیستم منبع باز تولید می‌کند.

لاک‌پشت TTS توسط جیمز بتکر توسعه داده شده و تحت مجوز آپاچی ۲٫۰ منتشر شده‌است که استفاده تجاری از صدای تولید شده را اجازه می‌دهد.

زبان تروجان از یک زبان پشتیبانی می‌کند: انگلیسی.

لاک‌پشت TTS در سطح Premium است — ۴ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای لاک‌پشت TTS را قبل از تولید صدای کامل رایگان داشته باشید.

TTS لاک‌پشت سرعت تولید کندتری دارد (به کیفیت اولویت می‌دهد). هر نسل زمان بیشتری می‌برد اما خروجی با صداقت بالاتری تولید می‌کند.

Tortoise TTS is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

بله ، Tortoise TTS از شبیه‌سازی صدای شلیک صفر پشتیبانی می‌کند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، Tortoise TTS به ویژه برای کتابهای صوتی ، محتوای پرمیوم ، برنامه‌های کاربردی اولویت با کیفیت توصیه می‌شود. بالاترین کیفیت ، چند صدا ، قابلیت‌های معماری dall- e آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله ، Tortoise TTS تحت مجوز آپاچی ۲٫۰ است ، که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای Tortoise TTS تولید می‌شود می‌تواند در ویدئوها ، پادکست‌ها ، برنامه‌ها ، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Random حالا

هر متنی را تایپ کنید و به آن گوش دهید Random. آزاد برای استفاده.