AI garso dažymas

Pakeisti garso skyrių AI sintezuota kalba, kuri atitinka aplinkinį balsą. Nustatyti blogas imtis neperrašant visą dalyką.

Mes dar neturime TTS balsų jūsų kalba. Padėk mums pridėti savo! Parduoti savo balsą

Išsiųsti garsą į nepatogumą

500 ženklų per sekundę pakeisto garso

Vilkite ir meskite failą čia, arba naršyti

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Šaltinis garso — šveitimas rasti blogas imtis

0.00s / 0.00s

Nedažymo nustatymai

0 / 500 simboliai
Kaip ilgai maišyti splite taškų. 80 ms yra numatytasis — rungtynių-cuts jaustis natūralus, be garso dvigubos trigger.
Užsiregistruoti nemokamai naudotis garso nutapymu
Dažantis garsas...

Klonavimas balso ir sintezavimas pakeitimo...

Šlifavimas → klonavimas aplink balsą → šlifavimas su kryželiu
Jūsų rezultatas bus rodomas jūsų generacijos istorija kai pasiruošęs.
Garso neparuoštas

Prieš (Original)

Po (nedažytas)

Atsiųsti nedažytą garsą

Kaip garso dažymas veikia

Dažymas yra Photoshop turinio užpildo garso ekvivalentas. Mes klonuojame balsą iš jūsų pasirinkimą supančio garso, sintezuojame naują liniją tame balse ir suspaudžiame jį su trumpu kryželiu.

Geriausi rezultatai: ne mažiau kaip 3 sekundžių švarios kalbos palikite prieš pat redagavimo tašką, kad klonas turi gerą etaloninę medžiagą.

Patarimai geriausiems rezultatams

  • Palaikyti pažymėtą diapazoną kuo siauresnį – tik blogas imtis
  • Pakaitinis tekstas turėtų būti maždaug tokio pat ilgio kaip ir tas, kurį jis pakeičia
  • Nustatykite kalbą, kuri atitiks šaltinio garsą, kad garsas atitiktų geriausius balsus
  • 80ms crossfade paprastai yra nematomas; guzas iki 150ms, jei išgirsite spragtelėjimą
  • Jei redaguojama ilgai (> 10s), apsvarstykite galimybę iš naujo įrašyti visą ištrauką

Kaip AI garso dažymas veikia

Chirurginiai redagavimai, suderinti su balsu, be pakartotinio įrašymo seanso.

1 veiksmas

Išsiuntimo intervalas + žymėjimo intervalas

Įkelkite garsą ir naudokite skruberį, kad pažymėtumėte skyriaus, kurį norite pakeisti, pradžią/galą. Įveskite atsarginį tekstą.

2 veiksmas

Balso klonas + sinchronizuoti

Mes ištraukiame iki 12 sekundžių švarios nuorodos garso aplink jūsų pasirinkimą, klonuoti garsiakalbio balsas, ir sintezuojame naują liniją tame balso.

3 veiksmas

Name

Sintetinis klipas yra įspaudžiamas į originalą su vienodos galios kryželiu abiejuose redagavimo taškuose. Ribos yra negirdimos.

Garso dažymo planai

Pradėti nemokamai, atnaujinti, kai jums reikia daugiau

Neapmuitinama
  • Iki 10 minučių pradinio kodo failai
  • 500 ženklų pakaitinis tekstas
  • 4 sekundžių nutapymas pagal užklausą
  • 80 m kryžminio suspaudimo
  • OpenVoice + jaukusVoice 2 programinės sąsajos
Populiariausi
Nemokama paskyra
  • Iki 10 minučių pradinio kodo failai
  • 5000 ženklų pakaitinis tekstas
  • Išlygintina kryžkelė (0–250 ms)
  • Balso modelio perjungimas
  • Generacijos istorija + re-edit
Užsiregistruoti nemokamai
Pro
  • Iki 30 minučių pradinio kodo failų
  • 100 000 ženklų pakaitinis tekstas
  • Prioritetinis GPU eilė
  • API prieiga (/v1/audio-inpaint/)
  • Partijos dažymas (daugi intervalai)
Atnaujinti

Dažnai užduodami klausimai

Garso įdegis (taip pat vadinamas garso užpildu arba kalbos overdub) leidžia pakeisti esamo garso įrašo sekciją nauja AI sintezuota kalba, atitinkančia originalų balsą. Tai Photoshop turinio-aware užpildo garso ekvivalentas – dažai virš dalies, kurios nenorite, įveskite, kas ten turėtų būti, ir AI generuoja vientisą pakeitimą.

Pažymėkite laiko diapazoną, kurį reikia pakeisti, įveskite naują dialogo eilutę, ir spustelėkite Inpaint. Mūsų AI klonuoja garsą iš jūsų pasirinkimą supančio garso, sintezuoja naują eilutę tame balse ir suspaudžia jį atgal su trumpu kryželiu, kad redagavimas būtų negirdimas.

Naudokite jį, kai turite vieną blogą žodį, klaidingas tarimas, vardas slydimas, keiksmažodžis, ar faktas klaida kitaip gera imtis. Iš naujo įrašyti visą ištrauką dažnai pristato toninį neatitikimą su likusiu projekto – dažymas nustatyti tik tai, ką reikia nustatyti, o išlaikyti visas kitas skiemenų nepažeistas.

Nemokami vartotojai gali apsvaiginti failus iki 10 minučių. Abonentai gali apsvaiginti failus iki 30 minučių. Pats pakaitinis tekstas yra apribotas iki 500 simbolių nemokamai vartotojams, 5000 nemokamai paskyroms ir 100 000 apmokamų planų.

Labai arti. AI naudoja iki 12 sekundžių garso aplink redaguoti kaip balso nuoroda, kuri yra pakankamai bet mūsų klonavimo-apsaugoti modeliai (OpenVoice, CosyVoice 2) užfiksuoti garsiakalbio timbre, pikio, ir kalbėjimo stilius. Dėl geriausių rezultatų, ne mažiau kaip 3 sekundžių švarios kalbos prieš redagavimo tašką.

Mes pagal nutylėjimą pritaikome 80 ms vienodos galios kryžminį filtrą abiejuose šypsniuose taškuose (galva→ pakeitimas ir keitimas→mazutas). Tai galite nustatyti nuo 0 ms (sunkus sukirpimas) iki 250 ms per Crossfade slankiklį. Ilgesni kryžkelės slepia redagavimą tiksliau, bet gali garsiai sulieti žodžius ant ribos.

Garso indažavimas atitinka tą pačią kalbos aprėptį, kaip balso klonavimas. Auto-pick OpenVoice daugumai kalbų ir CosyVoice 2 kinų, japonų ir korėjiečių. Galite pakeisti modelį sudėtingesniuose nustatymuose.

Jums taikoma 500 simbolių už sekundę garso pakeisto. 4 sekundžių nustatyti išlaidas 2000 simbolių. Kaina nepriklauso nuo to, kiek laiko yra pakeitimo tekstas, nes pagrindinė klono sintezė yra gated pagal paleidimo laiką naujam klipui, o ne nuo teksto ilgio.

Pagal mūsų paslaugų teikimo sąlygas, jūs galite tik nutapyti garsą jūs turite arba turite aiškų leidimą redaguoti. Generuoti netikras citatas, apgaulingas turinys, ar tapatybes yra draudžiama. Mes vandens ženklas generuoja garso ir prisijungti visus nutapymo darbus piktnaudžiavimui peržiūrėti.

Pjovimo klipas palieka pastebimą atotrūkį pozicionavimo ir kvapo; kryžminis blaškymas du palieka toninį neatitikimą. Dažymas užpildo atotrūkį kalba, kuri atitinka aplinkinį balsą, todėl klausytojai girdi nepertraukiamą, natūralų garsą.

Taip — Post to /v1/audio-inspaint/ with audio file, start_sec, end_sec, and replace_ text. Tikslas grąžina darbą UUID; apklausa /v1/speech/results/?uid= gauti nepatogą garsą, kai paruoštas. Žiūrėti API dok. detales.

Vienuolika darbo vietų Kalba į speechą visą balso liniją regeneruoja nuo nulio į tikslinį balsą. Mūsų garso nudažymas yra chirurginis: jis redaguoja tik pažymėtą diapazoną, saugo kiekvieną kitą savo originalaus įrašo baitą ir atitinka naująjį klipą į aplinkinį balsą, o ne atskirą balso biblioteką.
5.0/5 (1)

Ką mes galėtume pagerinti? Jūsų atsiliepimai padeda mums išspręsti problemas.

Pataisyti savo garsą sekundėmis

Pakeisti bet kokią įrašo dalį AI sintezuota kalba, atitinkančia originalų balsą. Užsiregistruoti laisvai pradėti.