AI аудио бојадисување

Замени го делот од звукот со AI- синтезираниот говор кој се совпаѓа со околниот глас.

Сеуште немаме ТТС гласови на твојот јазик. Продај го гласот

Качи го аудиото во Inslikate

500 знаци во секунда на аудио заменета

Довлечи и пушти ја тука вашата датотека, или прегледај

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file. mp3

0 MB

Изворно аудио — чистење за да го најдеш лошиот погодок

0.00s / 0.00s

Поставувања за за боја

0 / 500 знаци
Колку долго да се измешат точките за фрлање. 80ms е стандардно — се чувствуваат природни, не се слушнуваат двојно тригери.
Слободно се пријавувајте за користење на аудио ина сликање
Бојадирам аудио...

Го клонирам гласот и ја синтезирам замената...

Сечење → клонирање на околниот глас → крштавање со крстосување
Твоите резултати ќе се појават во тебе. историја на генерацијата Кога ќе биде подготвен.
Неофарбано аудио подготвено

Претходно (почетен)

По (офарбано)

Како функционира оцртавање на аудио

Инфаргирањето е аудио еквивалент на пополнувањето на содржината на Photoshop. Го клонираме гласот од звукот што го опкружува вашиот избор, ја синтезираме новата линија во тој глас и ја враќаме со краток крстос.

Најдобри резултати: оставете најмалку 3 секунди чист говор веднаш пред точката за уредување, така што клонерот има добар референтен материјал.

Совети за најдобри резултати

  • Држете го обележаниот опсег што е можно поцврсто — само лошото сфаќање
  • Текстот за замена треба да биде приближно иста должина како она што го заменува
  • Постави го јазикот за поклопување со изворниот звук за најдобро поклопување на гласот
  • 80м кросфајд е обично невидлив; скокнете на 150 м ако чуете клик
  • За долги уредувања (>10s), размисли за повторно снимање на целиот пасус

Како работи ВИ аудио слики

Хируршки уредувања, гласови соодветни, без повторно снимање сесија.

Чекор 1

Качувај + Маркирај опсег

Ставете го вашиот аудио и користете го бришачот за да го обележите почеток/ крајот на делот што сакате да го замените. Внесете го текстот за замена.

Чекор 2

Гласовен клон + синтетиза

Ќе извадиме до 12 секунди чист референтен звук околу вашиот избор, ќе го клонираме гласот на звучникот и ќе ја синтетизираме новата линија во тој глас.

Чекор 3

Крстофаден сплеш

Синтетизираниот клип е вклучен во оригиналната снимка со еднаква моќ на двете точки за уредување. Границите се нечујни.

Планови за оцртавање на аудио

Стартувај бесплатно, надоградете кога ќе ви треба повеќе

Слободен
  • До 10 минути изворни датотеки
  • Текст за замена од 500 знаци
  • 4 секунди боја на барање
  • 80м кросфајд сплеш
  • Отворен глас + CosyVoice 2 позадини
Најпопуларно
Слободна сметка
  • До 10 минути изворни датотеки
  • Текст за замена од 5.000 знаци
  • Тензибилен крстонос (0-250ms)
  • Премостување на гласовниот модел
  • Историја на генерирање + повторно уредување
Слободно потпиши се
Проф.
  • До 30 минути изворни датотеки
  • Текст за замена од 100.000 знаци
  • Приоритетна GPU- редица
  • API пристап (/v1/audio- inpaint /)
  • Пакетно бојадисување (многу опсегови)
Надоградба

Често поставувани прашања

Замена на дел од постојната аудио снимка со новиот AI-синтезиран говор кој се совпаѓа со оригиналниот глас. Тоа е аудио еквивалентот на пополнувањето на содржината на Photoshop — боја над делот што не го сакате, наместо тоа внесете што треба да биде таму, а АI генерира безпрекорна замена.

Означи го временскиот опсег за замена, напиши ја новата линија на дијалогот и кликни на Inslikance. Нашиот ВИ го клонира гласот од аудиото околу вашиот избор, ја синтетизира новата линија во тој глас и ја врти назад во вашата снимка со краток крстоносец, така што уредувањето не е звучно.

Користете го кога имате еден лош збор, погрешно изговорување, лизгање на името, заколнување на зборот или грешка на фактот во спротивно доброто снимање. Повторното снимање на целиот пасус честопати воведува тонално несовпаѓање со остатокот од проектот — бојавањето поправа само она што е потребно да се поправи додека секој друг слог не е допрен.

Слободните корисници можат да ги бојадисуваат датотеките до 10 минути. Претплатниците можат да ги бојадисуваат датотеките до 30 минути. Самиот текст за замена е ограничен на 500 знаци за слободни корисници, 5.000 за слободни сметки и 100.000 за платени планови.

Многу блиску. АИ користи до 12 секунди аудио за уредувањето како референца за глас, што е доволно за некој од нашите модели за клонирање (OpenVoice, CosyVoice 2) за да го сними тембрето, теренот и стилот на говор. За најдобри резултати, оставете најмалку 3 секунди чист говор веднаш пред точката за уредување.

Стандардно применуваме крстоносност од 80ms со еднаква моќ на двете точки (глава →замена и замена →тајл). Ова може да се подесува од 0ms (тврдо исечено) до 250ms преку лизгачот на Crossfade. Подолго се крие уредувањето потешко, но може да се измешаат гласно зборовите што се преклопуваат на границата.

Го следиме истото покривање на јазикот како клонирањето на гласот. Автоматски го избираме OpenVoice за повеќето јазици и CosyVoice 2 за Кинески, Јапонски и Корејски. Може да го премостите моделот во напредни поставувања.

Наплаќате 500 знаци во секунда на аудио заменета. 4- секундна фиксирана цена чини 2.000 знаци. Цената е независна од тоа колку долго е заменет текстот, бидејќи синтезата на основниот клон е затворена со времето на извршување на новиот клип, а не должината на текстот.

Според Условите на сервисот, можете само да зафарбате аудио што го поседувате или да имате експлицитна дозвола за уредување. Забрането е создавање лажни цитати, измамни содржини или имитации.

Сечењето на клип остава забележлив јаз во пацеирање и здив; крстоносниот два зема листа на тонал несовпаѓање.

Да — POST до / v1/ audio- inpaint/ со аудио датотеката, start_ sec, end_ sec и замена_ текст. Крајната точка ја враќа задачата UUID; анкета / v1/ Speech/ results /?uiid= за да го преземе инфарктираниот аудио кога е подготвен. Видете API документи за детали.

Единаесет Лабови говорот ја регенерира целата гласна линија од нулата во гласот на целта. Нашата аудио слика е хируршка: го уредува само маркираниот опсег, го чува секој друг бајт од вашата оригинална снимка недопрена, и се совпаѓа со новиот клип со околниот глас, наместо со одделна гласна библиотека.
5.0/5 (1)

Твоите повратни информации ни помагаат да ги решиме проблемите.

Поправете го вашиот аудио во секунди

Замени било кој дел од секоја снимка со AI- синтезација говор кој одговара на оригиналниот глас.