AI аудио рәсем ясау

Аудио өлешен әйләнә-тирә тавыш белән туры килгән ДНК синтезы белән сөйләм белән алыштыру. Юк булганны бөтенләй кабат яздырмыйча төзәтү.

Аудиоларны Inpaint'ка күчерү

Бер секундта 500 символ алмаштырылган аудио

Файлды монда күчереп куегыз яки карау

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл.mp3

0 MB

Аудио чыганагы — начар төшерүне табу өчен чистарту

0.00s / 0.00s

Инварк параметрлары

0 / 500 символлар
Сплайсинг нокталарын кушу вакыты. Әдәттәгечә 80 мс — туры килү-кисүләр табигый тоела, тавышлы ике тапкыр ычкындырма юк.
Аудио рәсемләүне куллану өчен бушлай теркәлегез
Аудио сурәтләнә...

Сүз клонлана һәм алмашын синтезлана...

Кронштадт — Кронштадт өлкәсенең Кронштадт шәһәр бүлгесе составына керүче авыл.
Сезнең нәтиҗәләрегез сезнең генерация тарихы Әгәр син хәзерләнгән булсаң.
Инпринтинг аудио әзер

Башта (ачык)

Соңыннан (яңадан)

Инквизициянең рәсми сайты

Аудио рәсем төшерү ничек эшли

Инпайнтинг - бу Photoshopның эчтәлеккә бәйле тутыруның аудио эквиваленты. Без сайлаган урынны әйләндереп алган аудиодан тавышны клонлыйбыз, бу тавышта яңа юлны синтезлыйбыз, һәм аны кыска сузылу белән кире кушабыз.

3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң, 3000 елдан соң

Иң яхшы нәтиҗәләр өчен киңәшләр

  • Маркировкаланган аралыкны мөмкин кадәр тар тоту — бары тик начар төшерү генә
  • Алмаштырылган җөмлә озынлыгы аның урынына куелган җөмлә озынлыгы белән тигез булырга тиеш
  • Иң яхшы тавыш туры килү өчен, чыганак аудиога туры килерлек телне билгеләгез
  • 80 мс сузылган сузылу гадәттә күренә алмый; тыкылдау ишетелсә, 150 мс сузылуга күчерелә
  • Озын төзәтүләр өчен (>10с), аның урынына бөтен җөмләне кабат яздыруны карагыз

Азатлык радиосы хәбәрчесе

Операцияләр, операциядән соң реабилитация, реабилитациядән соң реабилитация.

1 нче адым

Юк

Аудио файлыгызны куегыз һәм алыштырырга теләгән өлешнең баш/аягын билгеләү өчен җепне кулланыгыз. Алга таба алмаштыру мәтине кертегез.

2 нче адым

Сүзне клоналаштыру һәм синтезатор

We extract up to 12 seconds of clean reference audio surrounding your selection, clone the speaker's voice, and synthesize the new line in that voice.

3 нче адым

Сплит

Синтезланган клип ике төзәтү ноктасында да тигез көчле сузылу белән оригиналь язуга кушыла. Сыртлары ишетелми.

Аудио рәсемләү планнары

Бушлай башлагыз, күбрәк кирәк булганда яңартыгыз

Бушлай
  • 10 минутка кадәр булган чыганак файллары
  • 500-әр хәрефлек алмаштыру мәтине
  • Һәр сорау өчен 4 секундлык рәсем ясау
  • 80 мс сузылган җепләү
  • OpenVoice + CosyVoice 2 нигезе
Иң популяр
Акчасыз исәп
  • 10 минутка кадәр булган чыганак файллары
  • 5000-әр хәрефлек алмаштыру мәтине
  • Тизләнешле җепләр (0-250 мс)
  • Сүз моделен өстен куярга
  • Төзү тарихын + яңадан төзәтү
Бушлай теркәлү
Про
  • 30 минутка кадәр булган чыганак файллары
  • 100 000 символдан торган алмаштыру мәтине
  • Графика процессоры чираты
  • API керү (/v1/audio-inpaint/)
  • Баталь рәсем ясау (берничә аралык)
Яңарту

Кайвакыт бирелә торган сораулар

Аудио яздыру (audio fill яки speech overdub дип тә атала) сезгә аудио яздыруның бер өлешен оригиналь тавышка туры килгән яңа AI-синтезланган сөйләм белән алмаштырырга мөмкинлек бирә. Бу Photoshopның эчтәлеккә бәйле тутыруның аудио эквиваленты - сез теләгән өлешне буягыз, аның урынына кирәклесен языгыз, һәм AI бернинди үзгәрешсез алмаштыруны барлыкка китерә.

Алга таба алмаштыру өчен вакыт аралыгын билгеләгез, диалогның яңа юлын языгыз һәм "Язу" төймәсен басыгыз. Безнең уйлап табучы уен уенчы сайлаган аудиодан тавышны клонлый, бу тавышта яңа юлны синтезлый һәм аны кыскача сузылган сузылу белән яздыруыгызга кире куша, шуңа күрә үзгәртү ишетелмәс.

Бу ысулны бер генә начар сүз, дөрес әйтелмәгән сүз, исемне дөрес әйтмәү, үпкәләү сүзе яки башкача яхшы төшерелгән язмада факт хатасы булганда кулланыгыз. Барлык җөмләне кабат яздыру проектның калган өлешенә тональ туры килмәүне китереп чыгара - бу ысул төзәтергә кирәк булган сүзләрне генә төзәтә, ә калган сүзләрне үзгәрмичә калдыра.

Бушлай кулланучылар 10 минутка кадәр файлларны рәсем ясарга мөмкин. Абонентлар 30 минутка кадәр файлларны рәсем ясарга мөмкин. Язу урынына күчерү 500 символга кадәр чикләнгән бушлай кулланучылар өчен, 5000 символга кадәр - бушлай исәп-хисап өчен, һәм 100 000 символга кадәр - түләүле планнар өчен.

Бик якын. Хайван акылы 12 секундка кадәр иҗат итүне әйләндереп алган аудионы тавыш күрсәткечләре буларак куллана, бу безнең клонлауга сәләтле модельләребез (OpenVoice, CosyVoice 2) өчен тавыш бирүченең тембры, тавышы һәм сөйләү стилен тоту өчен җитә. Иң яхшы нәтиҗәләр өчен, иҗат итүдән алда кимендә 3 секундка чиста сөйләм калдырыгыз.

Без ике кушу ноктасында (баш→алыштыру һәм алмаштыру→авыру) 80 мс тигез көчле сузылуны кулланабыз. Сез аны 0 мс (тиз кисеп алу) һәм 250 мс аралыгына кадәр сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны сузылуны суз

Аудио язу тавыш клонлаштыру белән бер үк телне куллана. Без OpenVoice'ны телләрнең күбесе өчен һәм CosyVoice 2'не кытай, япон һәм корей телләре өчен автоматик сайлыйбыз. Моны өстәмә параметрларда үзгәртә аласыз.

Сезгә секундына 500 символга кадәр звук алмаштыру өчен түләү алына. 4 секундка кадәр төзәтү 2000 символга төшә. Бу бәя алмаштырылган мәтенең озынлыгыннан бәйсез, чөнки клон синтезы яңа клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка клипка кли

Безнең хезмәт күрсәтү шартлары буенча, сез үзегезнеке булган яки үзгәртү өчен рөхсәте булган аудионы гына рәсемгә төшерә аласыз. Ялган цитатлар, алдау өчен эчтәлек яки үзегезне башка кеше итеп күрсәтү тыела. Без барлыкка килгән аудиога су билгесен куябыз һәм бөтен рәсем төшерү эшләрен куллану кагыйдәләрен бозуларны тикшерү өчен журналга язабыз.

Клипны кисеп алу темп һәм сулыш арасында сизелерлек аерма калдыра; ике клипка аерма ясау тональ аерма калдыра. Инпайн бу аерманы тирә-яктагы тавыш белән туры килгән сүз белән тутырачак, шуңа күрә тыңлаучылар дәвамлы, табигый тавышлы тавыш ишетәчәкләр.

Әйе — аудиофайл, start_sec, end_sec һәм replacement_text белән /v1/audio-inpaint/ адресына POST җибәрү. Ачыклау пункты UUID тапшырмасын кайтара; әзер булганда рәсемләнгән аудионы алу өчен /v1/speech/results/?uuid= сораштыруын үтә. Ешрак мәгълүмат өчен API документациясен карагыз.

ElevenLabs Сөйләү-сөйләүгә бөтен тавыш сызыгын максат тавышына яңадан төзи. Безнең аудио рәсемләү хирургик: ул билгеләнгән арауны гына төзи, оригиналь язуыгызның һәр башка байтларын тоташтырмыйча калдыра, һәм яңа клипка аерым тавыш китапханәсе урынына тирә-яктагы тавышны туры китерә.
5.0/5 (1)

Без нәрсәне яхшыртырга мөмкин? Сезнең фикерләрегез безгә проблемаларны чишәргә ярдәм итә.

Аудиогызны секундлар эчендә төзәтегез

Яздыруның теләсә кайсы өлешен оригиналь тавышка туры килгән синтетик сөйләм белән алыштыру. Башларга теләсәгез, бушлай теркәлегез.