Alábòójútó àwọn ìṣàmúlò-ètò

Ṣẹ̀dà àwọn ìṣàfihàn àwọn àkọlé. Ṣàfihàn àwọn ìṣàfihàn, àwọn ìrànwọ́, tàbí àwọn ìṣàfihàn àti láti jẹ́ pe AI láti kọ̀ọ̀kan rẹ̀ fún ọ.

A kò ní àwọn ìrànwọ́ TTS nínú ìtàn rẹ̀. Yọ̀ọ̀kan rán wà láti fàyè gba àwọn rẹ̀! Fi Ojú Rẹ̀ pamọ́
Ṣẹ̀dà to generate music
Ń ṣẹ̀dà ìṣàfarawé àwọn ìtàn...

Ń kọ̀ọ̀kan àwọn àkọlé rẹ̀...

Music generation can take a while. Your audio will appear in your generation history Tí a bá tì ṣẹ̀dà.
Àwọn àwọn àkọlé
0:00 0:00

Àwọn ìṣàmúlò-ètò

ACE-Step v1 is a 3.5B-parameter diffusion model that generates 48 kHz stereo music from text in 17 languages. Apache 2.0 licensed — fully royalty-free.

Ìgbà ìtàn

5s 30s 30s
Àwọn ìgbà pínpẹ jù lo àwọn àmì-àṣírí mìíràn láti lò láti mú àwọn ìṣàfarawé.

Lyrics (optional)

Leave blank for instrumental music. ACE-Step supports 17 languages.

Àwọn Ìjánu-ìsún

Àwọn àwọn àwọn àwọn àwọn àwọn àwọn 1.0
0.5 (Ìfokansí) 1.5 (Àwọn àwọn àwọn àwọn àwọn àwọn)

Àwọn Àlàyé

  • Àwọn àwọn àwọn àwọn àwọn àwọn àwọn
  • Àwọn àwọn ìṣàmúlò-ètò àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
  • Àwọn àwọn ààyè-iṣẹ́
  • Àtòjọ àwọn ààyè-iṣẹ́
  • Àwọn ìṣàmúlò-ètò àwọn ìṣàmúlò-ètò

Àwọn Àwọn Àkọ́gbégbé

Tẹ̀ láti àwáyé:

Bií a ṣe lè Ṣẹ̀dá Àwọn Àkọsílẹ̀ AI

Ṣẹ̀dà kọ̀ǹpútà ìṣàfarawé kọ̀ǹpútà nínú àwọn ìṣàmúlò-ètò mẹ́tà. Kò nilò ìmọ̀ kọ̀ǹpútà.

Àkóónú 1

Ṣàfihàn

Ṣẹ̀dà àgbèkalẹ̀ àyọkà láti ṣàfihàn orin náà tí o fẹ́. Ṣàfihàn àwọn ìṣàmúlò-ètò, ààyè-iṣẹ́, àwọn ìṣàmúlò-ètò, ààyè-iṣẹ́, àti àwọn ìṣàmúlò-ètò. Ló àwọn táàbù ìṣàfihàn láàyè-iṣẹ́ láti kọ́ àgbèkalẹ̀ náà láàyè-iṣẹ́.

Àkóónú 2

Àwọn Àkọlé

Àwọn ìṣàmúlò-ètò AI ṣàfihàn àgbékalẹ̀ rẹ̀ àti ìṣàmúlò-ètò ìṣàfihàn. Àwọn ìṣàmúlò-ètò GPU-ìṣàmúlò-ètò gbá àwọn ìrísí-lẹ́tà láàrin àwọn ìṣàmúlò-ètò.

Àkóónú ààyè-iṣẹ́

_Ṣàfikún

Àwọn àwọn àkọlé àwòrán

Àwọn àwòrán pẹ̀lú àwọn àwọn àwọn àwòrán

Ṣàfikún àwọn àwọn ìṣàmúlò-ètò AI tí a lè lò fún ìṣàfilọ́lẹ̀ ìranṣẹ́ orin. Àwọn ìṣàmúlò-ètò ní àwọn ìrísí-lẹ́tà, àwọn ìṣẹ̀dá, àti àwọn ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀.

ACE-Step v1

Àtòjọ-ẹ̀yàn
Àwọn Àkọlé
StepFun & ACE Studio
Àwọn Àmì-ìwé:
Apache 2.0

3.5B-parameter diffusion transformer for full songs. Apache 2.0 weights with no gated dependencies. Optional lyrics in 17 languages. Generates a 4-minute song in roughly 20 seconds on an A100.

Àwọn Àkọsílẹ̀ Lyrics 17 Languages 48kHz Stereo

YuE

Tí a Bá Fi
Àwọn Àkọlé
Tencent
Àwọn Àmì-ìwé:
Apache 2.0

Full-song music generation model capable of producing complete songs with vocals, lyrics, and instrumental accompaniment from text prompts.

Àwọn Àkọsílẹ̀ Àwọn àyọkà àkọlé Àwọn Àkọlé-òkè 44.1kHz Audio

DiffRhythm

Tí a Bá Fi
Àwọn Àkọlé
ASLP@NPU
Àwọn Àmì-ìwé:
Apache 2.0

Àwọn ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀

Àwọn Ìṣàmúlò-ètò Àwọn Àkọlé Ìgbà Ìpẹ́ High Fidelity 48kHz Audio

Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn

Ṣílẹ̀ ọ̀fẹ́, ṣíṣàfihàn tí o bà fẹ́ diẹ́ sii

Àìfẹ́
  • Àwọn àyọkà ìsàlẹ̀-ilà 5-sekúndẹ̀
  • Àwọn ìṣàmúlò-ètò
  • Àwọn àgbéwọlé àkọlé
  • Àwòrán
  • 48 kHz stereo WAV
_Ṣàfikún
Àwọn Àkọ́gbégbé
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn
  • 15-second clipes + 15,000 characters
  • Gbogbo àwọn ìṣàmúlò-ètò ìranṣẹ́
  • Àwọn ìṣàfihàn ìgúnrégé tí o gà
  • Ìlò fún iṣẹ́ ọ̀fẹ́
Ṣẹ̀dà
Àwọn Àwọn Àwọn
  • Àwọn àyọkà ìsàlẹ̀-ilà 30-sekúǹdù
  • Àwọn àwọn àgbékalẹ̀
  • Àwọn Ìṣàmúlò-ètò
  • Àwọn ìṣàmúlò-ètò ìṣàfarawé
_Ṣàfikún

Àwọn Àtòjọ-ẹ̀yàn

AI music generation uses deep learning models to create original music from text descriptions. Describe the style, mood, instruments, and tempo you want, and the AI composes a unique piece of music. No musical knowledge required.

TTS.ai is powered by ACE-Step v1, a 3.5-billion-parameter diffusion-transformer model released under Apache 2.0 with no gated dependencies. It generates 48 kHz stereo audio in 17 languages from text prompts and optional lyrics. We chose it because it's the only fully permissive music model that ships today without a Llama or Gemma backbone restriction.

Yes. ACE-Step is Apache 2.0 — both the model code and weights — so all music generated through TTS.ai is yours to use commercially. You can use generated music in YouTube videos, podcasts, games, ads, and any commercial project without royalties or attribution.

Ṣẹ̀dà kọ́lọ̀pútà lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́.

Ya. Ṣàfihàn ìṣàmúlò-ètò tí o fẹ́ (rókì, ìṣàfihàn, jazz, classical, lo-fi, ambient), ìfẹ́ (ìfẹ́, ìfẹ́, ìfẹ́, ìfẹ́), àwọn ìṣàmúlò-ètò (piano, gitara, sinti, àwọn kọ̀rọ̀mù), àti àwọn ìṣàfihàn nínú àgbèkalẹ̀ àkọlé. Módè́ẹ̀lì náà ń sọ ìṣàfihàn rẹ̀ láti mú ìṣàfihàn ìranlọwọ̀ kọ̀ọ̀kan.

YuE (tí a tí n bọ́) tí n kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ̀ọ̀kan kọ

Àwọn ìṣàfilọ́lẹ̀ ìtàn tí a kọ̀ ní ìwọ̀n WAV fún ìdáràn tí o ga jù lọ. O lè yipada sí MP3, FLAC, OGG, tàbí M4A láti ló àtòjọ-ẹ̀yàn Àwọn Àyipada Àwòrán ọ̀fẹ́ wa. API náà ń gbọ́ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìtàn rẹ̀ tí o fẹ́.

ACE-Step is a diffusion transformer that uses Sana's Deep Compression AutoEncoder (DCAE) for audio encoding and a lightweight linear transformer for conditioning. It generates audio in roughly 27 diffusion steps, achieving 27x real-time on an A100 — a 4-minute song renders in about 20 seconds.

Òyà. Àwọn àyọkà tí a kọ̀ nípa AI láti inú TTS.ai ní àwọn àyọkà ìṣàfilọ́lẹ̀ tí a kọ̀ nípa ìṣàfilọ́lẹ̀. Ó kò bá jẹ́ pé a kò lè fi àwọn àyọkà ID àwọn àyọkà pamọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́ lọ́wọ́lọ́wọ́. O lè fi àwọn àwòrán pamọ́ lórí àwọn àyọkà yìí tí kò bá jẹ́ àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn ààyè-iṣẹ́.

Bark wa ni ti o wa ni ti o dara ju ti o dara ju (2 credits fun gbogbo ìgbàgbó̀). Free iroyin gba 15 credits lori ìforúkọsílẹ. Paid plans start at $9/month for 500 credits.

Ya. REST API wa n ṣe atilẹyin ifilọlẹ orin nipasẹ Bark. Fi ọrọ-ọrọ kan ranṣẹ ati gba ohun ti a ṣe. Wa ni Pro ($29/mo) ati Enterprise ($99/mo) awọn eto pẹlu ilana ibẹrẹ.
5.0/5 (1)

Àwọn àwọn àgbéwọlé rẹ̀ lè jẹ́ ìrànwọ́ fún wa.

Ṣẹ̀dà ìṣàmúlò-ètò náà láti inú AI

Ṣẹ̀dà kọ̀ǹpútà orílẹ̀ẹ̀tì láti inú àwọn ìṣàfihàn àyọkà. Ṣẹ̀dà láti inú ọ̀fẹ́ ki o si gba àwọn kọ̀ǹpútà 50 láti bẹrẹ ìṣàfihàn.