مولد موسیقی AI

تولید موسیقی اصلی از توضیحات متنی. یک سبک، حال یا سبک را توصیف کنید و بگذارید هوش مصنوعی آن را برای شما بنویسد.

هنوز صداهای TTS برای زبان شما نداریم. به ما کمک کنید تا صداهای خودتان را اضافه کنیم! فروش صدای خود
ثبت نام برای تولید موسیقی
در حال تولید موسیقی...

... آهنگسازي

ممکن است تولید موسیقی مدتی طول بکشد. صدای شما در تاریخچه تولید وقتي آماده شدي
موسیقی با موفقیت ایجاد شد
0:00 0:00

مدل

ACE-Step v1 یک مدل انتشار ۳٫۵B-parameter است که موسیقی استریو ۴۸ kHz را از متن در ۱۷ زبان تولید می‌کند.

مدت

5s 30s 30s
طول عمر طولانی‌تر از کاراکترهای بیشتری استفاده می‌کند و زمان بیشتری برای تولید نیاز دارد.

متن (گزینشی)

برای موسیقی سازهای موسیقی خالی بگذارید. ACE- Step از ۱۷ زبان پشتیبانی می‌کند.

دما

خلاقیت / تصادفی 1.0
۰٫ ۵) متمرکز ( ۱٫ ۵) خلاقانه (

راهنمایی

  • مشخص کردن سبک: \
  • ...
  • حالت را توصیف کنید: \
  • تنظیم زمان:
  • سبک مرجع:

مثالهای هشدار

برای امتحان کردن کلیک کنید:

چگونه تولید موسیقی هوش مصنوعی کار می‌کند

ایجاد موسیقی اصلی در سه گام ساده. هیچ دانش موسیقی مورد نیاز نیست.

گام ۱

توصیف

یک پیام متنی برای توصیف موسیقی مورد نظر بنویسید. ژانر ، حال ، ساز ، تمپو و سبک را ذکر کنید. از برچسب‌های انتخاب سریع برای ساخت سریعتر پیام خود استفاده کنید.

گام دوم

ترکیب‌کننده‌های هوش مصنوعی

مدل هوش مصنوعی درخواست شما را تجزیه و تحلیل می‌کند و موسیقی اصلی را تولید می‌کند. پردازش شتاب‌دار GPU نتایج سریع را تضمین می‌کند، معمولاً ۱۰ تا ۳۰ ثانیه بسته به مدت زمان.

گام ۳

بارگیری

پیش‌نمایش موسیقی تولید شده خود را با پخش‌کننده صوتی درونی. برای کیفیت بیشینه ، به قالب WAV بارگیری کنید. تا زمانی که شیار کامل را بدست آورید ، با تنظیمات مختلف دوباره تولید کنید.

مدل‌های موسیقی هوش مصنوعی

مقایسه مدل‌های هوش مصنوعی موجود برای تولید موسیقی. هر مدل دارای نقاط قوت، قابلیت‌ها و سبک‌های خروجی متفاوتی است.

ACE-Step v1

در دسترس
توسعه‌دهنده:
StepFun & ACE Studio
مجوز:
Apache 2.0

تبدیل‌کننده پراکندگی پارامتر ۳٫۵B برای آهنگ‌های کامل. وزن‌دهی آپاچی ۲٫۰ بدون وابستگی‌های گیت‌شده. متن‌های انتخابی در ۱۷ زبان. یک آهنگ ۴ دقیقه‌ای را در حدود ۲۰ ثانیه بر روی A100 تولید می‌کند.

آهنگهای کامل متن زبانهای ۱۷. 48kHz Stereo

YuE

به زودی
توسعه‌دهنده:
Tencent
مجوز:
Apache 2.0

مدل تولید آهنگ کامل قادر به تولید آهنگ‌های کامل با صداها، اشعار و همراهی سازها از پیام‌های متنی است.

آهنگهای کامل خواننده + آهنگساز چند شیار 44.1kHz Audio

DiffRhythm

به زودی
توسعه‌دهنده:
ASLP@NPU
مجوز:
Apache 2.0

مدل تولید آهنگ کامل بر اساس انتشار. ترکیبات موسیقی کامل را با صداقت بالا با استفاده از یک معماری غیر خودبازگشتی تولید می‌کند.

برپایه انتشار آهنگ‌های تمام‌طول صداقت بالا 48kHz Audio

برنامه‌های تولید موسیقی

شروع مجانی، ارتقاء وقتی که بیشتر نیاز دارید

حساب آزاد
  • تا ۳۰ ثانیه
  • ACE- Step v1 (آپاچی ۲٫ ۰)
  • ترجمه کتاب به ۱۷ زبان.
  • 15000 کاراکتر در ثبت نام
  • WAV استریو ۴۸ کیلوهرتز
ارتقا
محبوب‌ترین
آغازگر / سبک
  • تا ۳۰ ثانیه
  • مجوز نویسۀ ماهانه بالاتر
  • انتخاب سریع سبک + حال
  • استفاده تجاری بدون حق امتیاز
ثبت نام
حرفه اي
  • تا ۴ دقیقه کلیپ (۲۴۰ ثانیه)
  • تولید دسته
  • تولید دسته
  • دسترسی به API REST
ارتقا

پرسشهای متداول

تولید موسیقی هوش مصنوعی از مدل‌های یادگیری عمیق برای ایجاد موسیقی اصلی از توضیحات متنی استفاده می‌کند. سبک، حالت، سازها و تمپویی که می‌خواهید را توصیف کنید و هوش مصنوعی یک قطعه موسیقی منحصربه‌فرد را می‌سازد. هیچ دانش موسیقی مورد نیاز نیست.

TTS.ai Bark (Suno, MIT license) را برای موسیقی، جلوه‌های صوتی و تولید صدا ارائه می‌دهد. مدل‌های آینده شامل YuE (Apache 2.0) برای تولید آهنگ کامل با اشعار و DiffRhythm برای آهنگ‌های کامل تا ۲۸۵ ثانیه است.

بله. تمام موسیقی تولید شده از طریق TTS.ai برای استفاده تجاری شماست. Bark از مجوز MIT استفاده می‌کند. شما می‌توانید از موسیقی تولید شده در ویدئوهای یوتیوب، پادکست‌ها، بازی‌ها، آگهی‌ها و هر پروژه تجاری بدون حق تکثیر یا تخصیص استفاده کنید.

مدل‌های آینده مانند YuE و DiffRhythm از آهنگ‌های کامل تا ۲۸۵ ثانیه (تقریباً ۵ دقیقه) پشتیبانی می‌کنند.

بله. ژانر مورد نظر خود را (راک، الکترونیک، جاز، کلاسیک، لو-فای، امبیج)، حالت (خوشحال، غمگین، پرانرژی، آرام)، ساز (پیانو، گیتار، سینث، درام) و تمپو را در متن هشدار توصیف کنید. مدل توصیف شما را برای تولید موسیقی تطابقی تفسیر می‌کند.

بله. ACE-Step v1 از یک حوزه متن گزینشی پشتیبانی می‌کند. متن خود را (تا ۴۰۰۰ کاراکتر) همراه با یک توصیف سبک ارائه دهید و مدل یک آهنگ کامل با صدا تولید می‌کند. متن در ۱۷ زبان پشتیبانی می‌شود ، از جمله انگلیسی ، اسپانیایی ، فرانسوی ، آلمانی ، چینی ، ژاپنی و بیشتر.

موسیقی تولید شده برای کیفیت بیشینه در قالب WAV ۴۸ کیلوهرتز خروجی می‌شود. رابط کاربری همچنین از خروجی OGG پشتیبانی می‌کند. می‌توانید با استفاده از ابزار تبدیل‌کننده صوتی رایگان ما، آن را به MP3، FLAC یا M4A تبدیل کنید.

مدل‌های موسیقی هوش مصنوعی از معماری‌های تبدیل‌کننده استفاده می‌کنند که بر روی داده‌های موسیقی آموزش دیده اند. مدل الگوهای ملودی، هارمونی، ریتم و طنین را یاد می‌گیرد، سپس صدای جدید را به صورت خودبازگشتی از یک توصیف متنی تولید می‌کند. این شبیه به روشی است که مدل‌های زبانی متن را تولید می‌کنند، اما برای نشانه‌های صوتی.

بله. موسیقی تولید شده توسط هوش مصنوعی از TTS.ai محتوای اصلی است که بر اساس تقاضا ایجاد شده است. به دلیل اینکه رونوشت موسیقی موجود نیست، ادعاهای هویت محتوا را ایجاد نمی‌کند. می‌توانید ویدئوها را با استفاده از این موسیقی بدون مشکلات کپی رایت به پول تبدیل کنید.

Bark در سطح استاندارد در دسترس است (۲ کرید در هر نسل). حساب‌های رایگان ۱۵ کرید دریافت می‌کنند. برنامه‌های پرداختی با ۹ دلار در ماه برای ۵۰۰ کرید شروع می‌شوند.

بله. رابط کاربری REST ما /api/v1/music/ را برای کاربران با هویت احراز شده نمایش می‌دهد. یک بدنه JSON با درخواست، مدت زمان و اشعار اختیاری ارسال کنید؛ یک UUID کار را دریافت کنید تا برای نشانی وب تولید شده صدا را بررسی کنید. در دسترس در تمام برنامه‌های پرداختی.
5.0/5 (1)

چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.

شروع تولید موسیقی با هوش مصنوعی

موسیقی اصلی را از توضیحات متنی ایجاد کنید. مجانی ثبت نام کنید و ۵۰ امتیاز برای شروع آهنگسازی دریافت کنید.