AI аудио сүрөттөө

Аудио бөлүгүнүн ордуна айланадагы үн менен дал келген AI-синтезделген сүйлөмдү коюу. Жакшы эмес кабыл алууну бүттү кайра жаздырбай оңдоо.

Сиздин тилиңиз үчүн TTS үндөрү азырынча жок. Бизге өзүңүздүн үндөрүңүздү кошуп берүүңүздү сурайбыз! Сиздин үнүңүздү сатуу

Аудиону Inpaintке жүктөп алуу

Аудио алмаштыруу ылдамдыгы секундасына 500 символ

Файлды бул жакка сүйрөп алып коюңуз же кароо

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл.mp3

0 MB

Аудио булагы — каталуу кабыл алууну табуу үчүн тазалоо

0.00s / 0.00s

Сүрөттүн параметрлери

0 / 500 символ
Сплайсинг пункттарын аралаштыруунун узактыгы. Ачкычтуу 80 мс - окшоштук кесүү табигый көрүнөт, эки жолу басуу үнсүз.
Аудио сүрөттөп берүү кызматын колдонуу үчүн акысыз катталуу
Аудио сүрөттөлүүдө...

Сөз клондоо жана алмаштыруу синтези...

Слипинг → окружающий голос клонирования → сплиттер с переходным эффектом
Бир аз убакытты талап кылат? Жыйынтыгыңыздын сүрөтү сиздин generation history даярдалганда.
Аудио даярдалды

Алдыда (Башталгыч)

Андан кийин (боёлуп)

Инпинс аудиосун жүктөп алуу

Аудио сүрөттөмөсүн кантип иштетүү керек

Инпайнтинг - бул Photoshopтун мазмун-багытталган толтурууунун аудио эквиваленти. Биз тандалган объектти курчаган аудиодон үндү клондойбуз, жаңы сапты ошол үн менен синтездейбиз жана аны кыска кросс-файдинг менен кайра бириктиребиз.

Эң мыкты натыйжа: клонердин жакшы булак материалдары бар болушу үчүн, түзөтүү пунктунан бир аз мурда 3 секунда таза сүйлөм калтырыңыз.

Эң мыкты натыйжалар үчүн кеңештер

  • Белгиленген диапазондорду мүмкүн болушунча чектелген кылып сактоо — жөн гана катаал сүрөттөр
  • Текст, который будет заменен, должен быть примерно такой же длины, как и текст, который будет заменен
  • Тилди аудио булагына ылайыкташтыруу, эң мыкты үн тандоо үчүн
  • 80 мсек. өтмөктөгү ылдый түшүү адаттагыдай көрүнбөйт; тыкылдаган үн чыкса, 150 мсек.ге чейин көтөрүлөт
  • Узак өзгөртүүлөр үчүн (>10с), анын ордуна бүт текстти кайра жазуу керек

AI аудио сүрөттөмөсүнүн иштөөсү

Операциялык оңдоо, үн менен шайкештик, кайра жаздыруу сессиясы жок.

1-кадам

Жүктөө + диапазону белгилөө

Аудио файлды жүктөп алыңыз жана алмаштыргыңыз келген бөлүмдүн башталышын/аялын белгилөө үчүн скотчту колдонуңуз. Текст алмаштыруу үчүн киргизиңиз.

2-кадам

Сөздү клондоо жана синтездөө

Биз сиздин тандооңузду курчаган 12 секундга чейинки таза аудиону алып, сүйлөгөн адамдын үнүн клондоп, жаңы сапты ошол үндүн ичинде синтездейбиз.

3-кадам

Кроссфайдинг

Синтезделген клип оригиналдуу жазууга эки түзөтүү пунктунда тең күчтүү окшоштуруу менен кошулат. Сыяктар угулбайт.

Аудио сүрөттөлүш пландары

Акысыз баштаңыз, керек болсо жаңыртыңыз

Акысыз
  • 10 мүнөткө чейинки файлдар
  • 500 символдук алмаштыруучу текст
  • 4-секундалык сүрөт тартуу бир сурам үчүн
  • 80ms кроссфейд сплейс
  • OpenVoice + CosyVoice 2 программалык камсыздоосу
Эң популярдуу
Акысыз эсеп-кысап
  • 10 мүнөткө чейинки файлдар
  • 5000 символдук алмаштыруучу текст
  • Түздөтүлүүчү ылдый түшүрмө (0-250 мс)
  • Сөз моделинин алмаштыруусу
  • Жаңылоо тарыхы + кайра түзүү
Акысыз каттоо
Про
  • 30 мүнөткө чейинки файлдар
  • 100 000 символдук алмаштыруучу текст
  • GPU кезектери
  • API (/v1/audio-inpaint/) кирүү
  • Партиялык сүрөт тартуу (бир нече диапазондор)
Жаңылоо

Көп берилүүчү суроолор

Аудио-инпринтинг (аудио-заполнение же речи наддуб) - бул аудио-записьтин бир бөлүгүн жаңы, AI-синтезделген, оригиналдуу үнү менен алмаштырууга мүмкүндүк берет. Бул Photoshopтун мазмун-аярдуу толтуруу функциясынын аудио эквиваленти - каалабаган бөлүктү боёп, анын ордуна керектүү нерсени жазып, AI бир калыпта алмаштырууну жаратат.

Заменить времявой интервал, введите новую строку диалога и нажмите кнопку "Вставить". Наш искусственный интеллект клонирует голос из окружающего аудио, синтезирует новую строку в этом голосе и соединяет его с записью коротким переходным эффектом, чтобы редактирование не слышалось.

Эгерде сизде бир гана жаман сөз, туура эмес сүйлөм, ысымдын туура эмес жазылышы, катаал сөз же башкача айтканда, жакшы кабыл алынган бир факты болсо, анда аны колдонуп көрүңүз. Бардык фрагментти кайра жаздыруу көп учурда долбоордун калган бөлүгү менен тоналдык дал келбестиктерди жаратат - монтаждоо оңдоо керек болгон нерселерди гана оңдойт, калган сөздөр бузулбай калат.

Бесплатные пользователи могут вставлять файлы длиной до 10 минут. Абоненты могут вставлять файлы длиной до 30 минут. Текст замены ограничен 500 символами для бесплатных пользователей, 5000 символами для бесплатных учетных записей и 100 000 символами для платных планов.

Очень близко. AI использует до 12 секунд аудио из окружающей среды как голосовую ссылку, что достаточно для любого из наших клонирующих моделей (OpenVoice, CosyVoice 2) для захвата тембра, высоты и стиля речи. Лучшие результаты получатся, если оставить не менее 3 секунд чистого речи перед точкой редактирования.

Биз эки сплескилүү пунктуна (баш→алмашуу жана алмаштыруу→аягы) 80 мсек тең күчтүү ысык-суук аралаштырууну колдонобуз. Аны 0 мсектен (түз кесүү) 250 мсекке чейин өзгөртө аласыз. Бул үчүн Слайдердин Салыштыруу баскычын басыңыз. Узак убакытка созулган аралаштыруу текстти толук жашырат, бирок бир-биринен бөлүнүп калган сөздөрдү үнүнөн ажырата алат.

Аудио-интерфейс үн клондоосунда колдонулган тилдерге ылайык иштелип чыккан. Биз көпчүлүк тилдер үчүн OpenVoice, ал эми кытай, япон жана корей тилдери үчүн CosyVoice 2 тандап алабыз. Бул моделди жогорудагы параметрлерде өзгөртө аласыз.

Сизге секундасына 500 символдук аудио алмаштыруу үчүн төлөм алынат. 4 секунддук оңдоо 2000 символдук текстти алмаштырууга туура келет. Бул сумма тексттин узундугуна жараша болот, анткени клондоо синтези жаңы клиптин аткаруу убактысына, тексттин узундугуна эмес, көз каранды.

Биздин кызмат көрсөтүү шарттарына ылайык, сиз өзүңүздүн же түзөтүү укугуңуз бар аудиону гана киргизе аласыз. Жалган цитаталарды, алдамчылык мазмунду же башка адамдын ысымын колдонууга тыюу салынат. Биз генерацияланган аудиону суу белгиси менен белгилейбиз жана бардык киргизүү тапшырмаларын журналга жазабыз.

Клипти кесүү темпте жана дем алууда көрүнүктүү ката кетирет; эки тасманы бирдей убакытта бирдей ыргакта ойнотуу тоналдык ката кетирет. Сүрөткө түшүрүү катаны айланадагы үн менен дал келген сөз менен толтуруп, угуучуларга бир калыпта, табигый угулган аудиону берет.

Да — POST /v1/audio-inpaint/ менен аудио файл, start_sec, end_sec, жана replacement_text. Endpoint returns a job UUID; poll /v1/speech/results/?uuid= to retrieve the painted audio when ready. More details in the API documentation.

ElevenLabs Слов-к-слова регенерирует всю голосовую строку в целевой голос. Наша аудио-инпиляция хирургическая: она только редактирует отмеченный диапазон, оставляет все остальные байт оригинального записи нетронутыми, и соответствует новому клипу окружающему голосу, а не отдельной голосовой библиотеке.
5.0/5 (1)

Биз эмнени жакшыртсак болот? Сиздин пикириңиз бизге көйгөйлөрдү чечүүгө жардам берет.

Аудиону секундаларда оңдоо

Запись любого раздела заменяется искусственным синтезом речи, соответствующей оригинальному голосу. Начать бесплатно.