Pranešti apie klaidą / funkcijų užklausą

AI garso dažymas

Pakeisti garso skyrių AI sintezuota kalba, kuri atitinka aplinkinį balsą. Nustatyti blogas imtis neperrašant visą dalyką.

Užsiregistruoti nemokamai

Mes dar neturime TTS balsų jūsų kalba. Padėk mums pridėti savo! Parduoti savo balsą

Išsiųsti garsą į nepatogumą

500 ženklų per sekundę pakeisto garso

Vilkite ir meskite failą čia, arba naršyti

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Nedažymo nustatymai

Pradėti (sekundėmis)

Pabaiga (sekundėmis)

Pakaitinis tekstas – ką reikėtų pasakyti spragoje 0 / 500 simboliai

Kalba

Kryžiaus žarna 80 ms Kaip ilgai maišyti splite taškų. 80 ms yra numatytasis — rungtynių-cuts jaustis natūralus, be garso dvigubos trigger.

Užsiregistruoti nemokamai naudotis garso nutapymu

Kaip garso dažymas veikia

Dažymas yra Photoshop turinio užpildo garso ekvivalentas. Mes klonuojame balsą iš jūsų pasirinkimą supančio garso, sintezuojame naują liniją tame balse ir suspaudžiame jį su trumpu kryželiu.

Geriausi rezultatai: ne mažiau kaip 3 sekundžių švarios kalbos palikite prieš pat redagavimo tašką, kad klonas turi gerą etaloninę medžiagą.

Patarimai geriausiems rezultatams

Palaikyti pažymėtą diapazoną kuo siauresnį – tik blogas imtis
Pakaitinis tekstas turėtų būti maždaug tokio pat ilgio kaip ir tas, kurį jis pakeičia
Nustatykite kalbą, kuri atitiks šaltinio garsą, kad garsas atitiktų geriausius balsus
80ms crossfade paprastai yra nematomas; guzas iki 150ms, jei išgirsite spragtelėjimą
Jei redaguojama ilgai (> 10s), apsvarstykite galimybę iš naujo įrašyti visą ištrauką

Kaip AI garso dažymas veikia

Chirurginiai redagavimai, suderinti su balsu, be pakartotinio įrašymo seanso.

1 veiksmas

Išsiuntimo intervalas + žymėjimo intervalas

Įkelkite garsą ir naudokite skruberį, kad pažymėtumėte skyriaus, kurį norite pakeisti, pradžią/galą. Įveskite atsarginį tekstą.

2 veiksmas

Balso klonas + sinchronizuoti

Mes ištraukiame iki 12 sekundžių švarios nuorodos garso aplink jūsų pasirinkimą, klonuoti garsiakalbio balsas, ir sintezuojame naują liniją tame balso.

3 veiksmas

Name

Sintetinis klipas yra įspaudžiamas į originalą su vienodos galios kryželiu abiejuose redagavimo taškuose. Ribos yra negirdimos.

Garso dažymo planai

Pradėti nemokamai, atnaujinti, kai jums reikia daugiau

Neapmuitinama

Iki 10 minučių pradinio kodo failai
500 ženklų pakaitinis tekstas
4 sekundžių nutapymas pagal užklausą
80 m kryžminio suspaudimo
OpenVoice + jaukusVoice 2 programinės sąsajos

Populiariausi

Nemokama paskyra

Iki 10 minučių pradinio kodo failai
5000 ženklų pakaitinis tekstas
Išlygintina kryžkelė (0–250 ms)
Balso modelio perjungimas
Generacijos istorija + re-edit

Užsiregistruoti nemokamai

Pro

Iki 30 minučių pradinio kodo failų
100 000 ženklų pakaitinis tekstas
Prioritetinis GPU eilė
API prieiga (/v1/audio-inpaint/)
Partijos dažymas (daugi intervalai)

Atnaujinti

Dažnai užduodami klausimai

Garso įdegis (taip pat vadinamas garso užpildu arba kalbos overdub) leidžia pakeisti esamo garso įrašo sekciją nauja AI sintezuota kalba, atitinkančia originalų balsą. Tai Photoshop turinio-aware užpildo garso ekvivalentas – dažai virš dalies, kurios nenorite, įveskite, kas ten turėtų būti, ir AI generuoja vientisą pakeitimą.

Pažymėkite laiko diapazoną, kurį reikia pakeisti, įveskite naują dialogo eilutę, ir spustelėkite Inpaint. Mūsų AI klonuoja garsą iš jūsų pasirinkimą supančio garso, sintezuoja naują eilutę tame balse ir suspaudžia jį atgal su trumpu kryželiu, kad redagavimas būtų negirdimas.

Naudokite jį, kai turite vieną blogą žodį, klaidingas tarimas, vardas slydimas, keiksmažodžis, ar faktas klaida kitaip gera imtis. Iš naujo įrašyti visą ištrauką dažnai pristato toninį neatitikimą su likusiu projekto – dažymas nustatyti tik tai, ką reikia nustatyti, o išlaikyti visas kitas skiemenų nepažeistas.

Nemokami vartotojai gali apsvaiginti failus iki 10 minučių. Abonentai gali apsvaiginti failus iki 30 minučių. Pats pakaitinis tekstas yra apribotas iki 500 simbolių nemokamai vartotojams, 5000 nemokamai paskyroms ir 100 000 apmokamų planų.

Labai arti. AI naudoja iki 12 sekundžių garso aplink redaguoti kaip balso nuoroda, kuri yra pakankamai bet mūsų klonavimo-apsaugoti modeliai (OpenVoice, CosyVoice 2) užfiksuoti garsiakalbio timbre, pikio, ir kalbėjimo stilius. Dėl geriausių rezultatų, ne mažiau kaip 3 sekundžių švarios kalbos prieš redagavimo tašką.

Mes pagal nutylėjimą pritaikome 80 ms vienodos galios kryžminį filtrą abiejuose šypsniuose taškuose (galva→ pakeitimas ir keitimas→mazutas). Tai galite nustatyti nuo 0 ms (sunkus sukirpimas) iki 250 ms per Crossfade slankiklį. Ilgesni kryžkelės slepia redagavimą tiksliau, bet gali garsiai sulieti žodžius ant ribos.

Garso indažavimas atitinka tą pačią kalbos aprėptį, kaip balso klonavimas. Auto-pick OpenVoice daugumai kalbų ir CosyVoice 2 kinų, japonų ir korėjiečių. Galite pakeisti modelį sudėtingesniuose nustatymuose.

Jums taikoma 500 simbolių už sekundę garso pakeisto. 4 sekundžių nustatyti išlaidas 2000 simbolių. Kaina nepriklauso nuo to, kiek laiko yra pakeitimo tekstas, nes pagrindinė klono sintezė yra gated pagal paleidimo laiką naujam klipui, o ne nuo teksto ilgio.

Pagal mūsų paslaugų teikimo sąlygas, jūs galite tik nutapyti garsą jūs turite arba turite aiškų leidimą redaguoti. Generuoti netikras citatas, apgaulingas turinys, ar tapatybes yra draudžiama. Mes vandens ženklas generuoja garso ir prisijungti visus nutapymo darbus piktnaudžiavimui peržiūrėti.

Pjovimo klipas palieka pastebimą atotrūkį pozicionavimo ir kvapo; kryžminis blaškymas du palieka toninį neatitikimą. Dažymas užpildo atotrūkį kalba, kuri atitinka aplinkinį balsą, todėl klausytojai girdi nepertraukiamą, natūralų garsą.

Taip — Post to /v1/audio-inspaint/ with audio file, start_sec, end_sec, and replace_ text. Tikslas grąžina darbą UUID; apklausa /v1/speech/results/?uid= gauti nepatogą garsą, kai paruoštas. Žiūrėti API dok. detales.

Vienuolika darbo vietų Kalba į speechą visą balso liniją regeneruoja nuo nulio į tikslinį balsą. Mūsų garso nudažymas yra chirurginis: jis redaguoja tik pažymėtą diapazoną, saugo kiekvieną kitą savo originalaus įrašo baitą ir atitinka naująjį klipą į aplinkinį balsą, o ne atskirą balso biblioteką.

5.0/5 (1)

Pataisyti savo garsą sekundėmis

Pakeisti bet kokią įrašo dalį AI sintezuota kalba, atitinkančia originalų balsą. Užsiregistruoti laisvai pradėti.

Užsiregistruoti nemokamai Rodymo kaina

AI garso dažymas

Išsiųsti garsą į nepatogumą

Šaltinis garso — šveitimas rasti blogas imtis

Nedažymo nustatymai

Prieš (Original)

Po (nedažytas)

Kaip garso dažymas veikia

Patarimai geriausiems rezultatams

Kaip AI garso dažymas veikia

Išsiuntimo intervalas + žymėjimo intervalas

Balso klonas + sinchronizuoti

Name

Garso dažymo planai

Dažnai užduodami klausimai

Pataisyti savo garsą sekundėmis

AI garso dažymas

Išsiųsti garsą į nepatogumą

Šaltinis garso — šveitimas rasti blogas imtis

Nedažymo nustatymai

Prieš (Original)

Po (nedažytas)

Kaip garso dažymas veikia

Patarimai geriausiems rezultatams

Kaip AI garso dažymas veikia

Išsiuntimo intervalas + žymėjimo intervalas

Balso klonas + sinchronizuoti

Name

Garso dažymo planai

Dažnai užduodami klausimai

Kas yra garso negraužimas?

Kaip tai veikia?

Kada turėčiau naudoti garso nutapymas, o ne iš naujo įrašyti?

Kiek laiko gali būti garso šaltinis?

Ar įdegusi kalba skamba lygiai taip, kaip ir originalus kalbėtojas?

Kas atsitinka redagavimo ribose?

Kokios kalbos remiamos?

Kiek kainuoja garso nutapymas?

Ar galiu tai panaudoti tam, kad įdėti žodžius į ką nors, ko jie niekada nesakė?

Kodėl, užuot tiesiog išbraukus blogą dalį, naudokite indažą?

Ar yra garso nutapymo API prieinamas?

Kaip tai palyginti su vienuolika darbo vietų Kalba į speech?

Pataisyti savo garsą sekundėmis