Pocket TTS

Azelma

آزاد انگلیسی Female Pocket TTS

Azelma یک صدای هوش مصنوعی زن است که توسط مدل تبدیل متن به گفتار Pocket TTS پشتیبانی می‌شود. این صدای لایۀ آزاد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت بالا را ارائه می‌دهد. با سرعت تولید نزدیک به لحظه و امتیاز کیفیت 4/۵، Azelma برای lightweight deployment, cpu-only environments, quick voice cloning مناسب است. این موتور توسط Kyutai under the MIT license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: 100m parameters, cpu inference, voice cloning, single-sample cloning, edge-ready. مدل Pocket TTS همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

Pocket TTSاطلاعات مدل

مدل Pocket TTS
توسعه‌دهنده Kyutai
کیفیت
سرعت سریع
مجوز MIT
شبیه‌سازی پشتیبانی‌شده
حيوان آزاد) هیچ نویسه‌ای استفاده نشده (
پارامترها 100M
معماری Transformer + Mimi Codec
داده‌های آموزشی 50000 ساعت
سال 2025

بهترین موارد استفاده برای Azelma

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Azelma برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

کاربردها و دسترسی‌پذیری

تولید سریع این صدا را برای برنامه‌های زمان واقعی، خوانندگان صفحه و ابزارهای دسترسی ایده‌آل می‌کند.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

بيشتر Pocket TTS صداها

صداهای دیگر از همان مدل TTS

Alba

انگلیسی Female

Cosette

انگلیسی Female

Eponine

انگلیسی Female

Fantine

انگلیسی Female

Javert

انگلیسی Male

Jean

انگلیسی Male

پرسشهای متداول

Pocket TTS توسط Kyutai (سازندگان Moshi) یک مدل فشرده ۱۰۰M پارامتر متن به گفتار است که بسیار بالاتر از وزن خود عمل می‌کند. این به صورت کارآمد بر روی CPU اجرا می‌شود، از شبیه‌سازی صدای شلیک صفر از یک نمونه صوتی پشتیبانی می‌کند، و گفتاری با صدای طبیعی تولید می‌کند. اندازه کوچک مدل آن را برای گسترش لبه و محیط‌های کم منابع ایده‌آل می‌کند.

Pocket TTS توسط Kyutai توسعه داده شده و تحت مجوز MIT منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

Pocket TTS از دو زبان پشتیبانی می‌کند: انگلیسی، فرانسوی.

Pocket TTS در سطح رایگان است — رایگان — هیچ اعتباری لازم نیست. می‌توانید پیش‌نمایش هر صدای Pocket TTS را قبل از تولید صدای کامل رایگان داشته باشید.

Pocket TTS سرعت تولید بسیار سریعی دارد. در زمان نزدیک به واقعی اجرا می‌شود، که آن را برای برنامه‌های کاربردی جریانی و تعاملی مناسب می‌کند.

Pocket TTS is rated 4/5 for audio quality on TTS.ai. It produces high-quality, natural-sounding speech.

بله، Pocket TTS از شبیه‌سازی صدای صفر-تیر پشتیبانی می‌کند. برای ایجاد صدای سفارشی، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، Pocket TTS به ویژه برای گسترش سبک ، محیط‌های فقط CPU ، شبیه‌سازی سریع صدا توصیه می‌شود. پارامترهای ۱۰۰m ، استنتاج CPU ، قابلیت‌های شبیه‌سازی صدا آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله، Pocket TTS تحت مجوز MIT است که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای Pocket TTS تولید می‌شود می‌تواند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Azelma حالا

هر متنی را تایپ کنید و به آن گوش دهید Azelma. آزاد برای استفاده بدون نیاز به نویسه‌ها.