AI аудионы бояу

Аудио бөлігін айналадағы дыбыспен сәйкес келетін ДК синтезделген сөйлеуімен алмастыру. Жақсы қабылданбаған дыбыстарды толық қайта жазусыз түзету.

Аудио файлды Inpaint- ке жүктеп беру

Аудару жылдамдығы:

Файлды мұнда сүйреп апарыңыз, не шолу

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл.mp3

0 MB

Аудио көзі — қате түскенін табу үшін тазалау

0.00s / 0.00s

Бояу параметрлері

0 / 500 таңбалар
Сұйықтау нүктелерінің аралығы. Әдетте 80 мс - сәйкесті кесу табиғи болып көрінеді, екі рет басу дауыссыз.
Аудио сызу үшін тегін тіркеліңіз
Аудио түсірілуде...

Дыбысты клондап, орнын алмастыруды синтездеу...

Сілтеу → айналадағы дыбыстарды клондау → аралықпен қосу
Біраз уақытты алады ма? Нәтижелеріңіз сіздің % 1 дегенді құру дайын болғанда.
Аудио дайын

Алдыңғы (басты)

Соңы (бояу)

Аудио файлды жүктеп алу

Аудио сызу қалай жұмыс істейді

Инпайнтинг - бұл Photoshop-тың мазмұнды ескере отырып толтыруының аудио эквиваленті. Біз таңдауыңыздың айналасындағы аудиодан дыбысты клондап, осы дыбыста жаңа жолды синтездеп, қысқаша араластыру арқылы қайта қосамыз.

Ең жақсы нәтижесі: клондауыш жақсы сілтеме материалдарын алу үшін, түзету нүктесінің алдында кемінде 3 секунд таза сөйлем қалдырыңыз.

Ең жақсы нәтижелер үшін кеңестер

  • Таңдалған ауқымды мүмкіндігінше тар ұстау - тек қате түскендері ғана
  • Алмастыру мәтінінің ұзындығы алмастыруға тиіс мәтіннің ұзындығымен шамалас болуы керек
  • Аудио көзіне сәйкес келетін тілді орнату, дыбыс сәйкестігін жақсарту үшін
  • 80 мсек- те өтпелі жылжу әдетте көрінбейді; егер түрткілеу естілсе, 150 мсек- ке дейін көтеріледі
  • Ұзақ өзгертулер үшін (>10с), оның орнына бүкіл фрагментті қайта жазуды қарастырыңыз

AI аудионы бояу қалай жұмыс істейді

Хирургиялық түзетулер, дауыс сәйкестігі, қайта жазу сеансы жоқ.

1- қадам

Жүктеу + Аумақты белгілеу

Аудио файлды жүктеп алып, алмастыруды қалаған бөлімнің басталу/ аяқталуын белгілеу үшін тегістеуіш белгісін қолданыңыз. Алмастыратын мәтінін келтіріңіз.

2- қадам

Дыбысын клондау және синтездеуName

Біз таңдаған аудиторияңызға 12 секундқа дейін таза сілтемелік дыбыс шығарамыз, сөйлеушінің дауысын клондап, сол дауыста жаңа жолды синтездейміз.

3- қадам

Түстермен араластыру

Синтезделген клип бастапқы жазбаға қосылады, екі өңдеу нүктесінде тең күшті аралықпен. Шектері естілмейді.

Аудио бояу жоспарлары

Тегін бастаңыз, қажет болғанда жаңартыңыз

Бос
  • 10 минутқа дейінгі бастапқы файлдар
  • 500 таңбадан тұратын алмастыру мәтін
  • Бір сұраныс үшін 4 секунд
  • 80 мсек- те аралық ыдырауы
  • OpenVoice + CosyVoice 2 тетігіName
Ең танымалы
Бос тіркелгі
  • 10 минутқа дейінгі бастапқы файлдар
  • 5000 таңбадан тұратын алмастыру мәтін
  • Түзетуге болатын діріл (0- 250 мсек)
  • Дыбыс үлгісін ауыстыру
  • Жіберу журналы + қайта өңдеу
Тегін тіркелу
Про
  • 30 минутқа дейінгі бастапқы файлдар
  • 100, 000 таңбадан тұратын алмастыру мәтін
  • Артықшылықты GPU кезегі
  • API қатынау (/v1/audio-inpaint/)
  • Бірнеше аумақты бірден бояу
Жаңарту

Жиі қойылатын сұрақтар

Аудио толтыру (аудио толтыру немесе сөйлеу үстінен жазу деп те аталады) бар аудиожазбаның бір бөлігін бастапқы дыбыспен сәйкес келетін жаңа ДНҚ синтезделген сөйлеумен алмастыруға мүмкіндік береді. Бұл Photoshop-тың мазмұнды ескере отырып толтыруының аудио эквиваленті - қаламаған бөлігін бояп, орнына керектісін енгізіңіз, ДНҚ біртіндеп алмастыруды жасайды.

Ауыстыратын уақыт аралығын белгілеп, диалогтың жаңа жолын келтіріп, "Қосу" дегенді басыңыз. Біздің ДНҚ таңдаған аудио файлдан дауысты клондап, жаңа жолды синтездеп, қысқаша дірілмен қайтадан жазбаңызға қосады, сондықтан өзгертулер естілмейді.

Бір ғана жаман сөз, дұрыс айтылмаған сөз, лақап ат, лақап сөз немесе басқа да дұрыс жазылмаған сөздер болса, оны қолданыңыз. Тікелей қайта жазу көбінесе жобаның қалған бөлігімен тоналды сәйкессіздік туғызады - ендіру тек түзету қажет болған жерлерді түзейді, ал басқа буындарды өзгеріссіз қалдырады.

Тегін пайдаланушы файлдарды 10 минутқа дейін бояп шығара алады. Жазылушы файлдарды 30 минутқа дейін бояп шығара алады. Алмастырғыш мәтіннің ұзындығы тегін пайдаланушыларда 500 таңбаға, тегін тіркелгілерде 5000 таңбаға, төлемді тіркелгілерде 100000 таңбаға шектеледі.

Өте жақын. ДК өңдеудің айналасындағы 12 секундтық дыбыстарды дыбыс сілтемесі ретінде пайдаланады, бұл біздің клондауға қабілетті кез келген үлгілерімізге (OpenVoice, CosyVoice 2) сөйлеушінің тембрін, дыбысын және сөйлеу стилін анықтауға жеткілікті. Ең жақсы нәтижеге жету үшін өңдеу нүктесінен бұрын кемінде 3 секундтық таза сөйлеуді қалдырыңыз.

Әдетте, екі қосылу нүктесінде де (басты→алмастыру және алмастыру→аяқ) 80 мс- те тең күшті аралықпен жылжу қолданылады. Бұл аралықты 0 мс- тан (қатты кесу) 250 мс- ке дейін жылжыту үшін "Жылжу" батырмасын басыңыз. Ұзақ жылжулар өңдеуді тереңірек жасырады, бірақ шекарадағы ауысып жатқан сөздерді дауыспен араластыруға мүмкіндік береді.

Аудио ендіру дыбыстарды клондау сияқты тілдерді қамтиды. Көбінесе OpenVoice, қытай, жапон және корей тілдерінде CosyVoice 2 таңдалады. Қосымша параметрлерінде осы үлгіні өзгертуге болады.

Аударылған дыбыс секундына 500 таңбаға есептеледі. 4 секундтық түзету 2000 таңбаға түседі. Бұл ақы алмастыру мәтінінің ұзындығына тәуелді емес, себебі клон синтезі мәтін ұзындығына емес, жаңа клипке байланысты.

Қызмет көрсету шарттарына сәйкес, тек өзіңіздің немесе өзгертуге рұқсатыңыз бар дыбыстарды ғана бояуыңызға болады. Жалған дәйексөздер, алдау мазмұны немесе өзіңізді басқа адам ретінде көрсетуге тыйым салынады. Біз жасалған дыбыстарды сулы белгімен белгілейміз және барлық бояу жұмыстарын журналға жазамыз.

Клипті қысқартуда дыбыс жылдамдығы мен тыныс алуында елеулі айырмашылықтар болады; екі клипке бір- біріне ұқсамайтын дыбыстарды қосу кезінде тондық сәйкессіздік пайда болады. Аудио ішіне бояу қосу кезінде ауыспалы дыбыстармен ауыспалы дыбыстар арасындағы айырмашылықты толтырады, сондықтан тыңдаушылар біртіндеп, табиғи дыбыстарды естиді.

Иә — POST /v1/audio-inpaint/ дегенге аудио файл, start_sec, end_sec және replacement_text дегендерді қоса. Соңғы нүкте тапсырманың UUID-ін қайтарады; дайын болғанда боялған аудионы алу үшін /v1/speech/results/?uuid= дегенге сұрау салады. Егжей-тегжейлі API құжаттамасын қараңыз.

ElevenLabs Сөзден- Сөзге деген функциясы барлық дыбыс жолын жаңадан құрады. Аудио сызуымыз хирургиялық: тек белгіленген ауқымды өңдейді, бастапқы жазбаның барлық басқа байттарын өзгертпейді, және жаңа клипти бөлек дыбыс жиынына емес, айналасындағы дыбыстарға сәйкестендіреді.
5.0/5 (1)

Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.

Аудиоңызды секундтар ішінде түзету

Жазбаның кез келген бөлігін бастапқы дыбыспен сәйкес келетін ДНҚ синтезделген сөйлеумен алмастыру. Бастау үшін тегін тіркеліңіз.