Катаны / мүмкүнчүлүктү билдирүү

AI аудио сүрөттөө

Аудио бөлүгүнүн ордуна айланадагы үн менен дал келген AI-синтезделген сүйлөмдү коюу. Жакшы эмес кабыл алууну бүттү кайра жаздырбай оңдоо.

Акысыз катталуу

Сиздин тилиңиз үчүн TTS үндөрү азырынча жок. Бизге өзүңүздүн үндөрүңүздү кошуп берүүңүздү сурайбыз! Сиздин үнүңүздү сатуу

Аудиону Inpaintке жүктөп алуу

Аудио алмаштыруу ылдамдыгы секундасына 500 символ

Файлды бул жакка сүйрөп алып коюңуз же кароо

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Сүрөттүн параметрлери

Баштоо (секундалар)

Акыры (секундалар)

Текст замены — что должно быть сказано в пробеле 0 / 500 символ

Тил

Кроссфейд 80 ms Сплайсинг пункттарын аралаштыруунун узактыгы. Ачкычтуу 80 мс - окшоштук кесүү табигый көрүнөт, эки жолу басуу үнсүз.

Аудио сүрөттөп берүү кызматын колдонуу үчүн акысыз катталуу

Аудио сүрөттөмөсүн кантип иштетүү керек

Инпайнтинг - бул Photoshopтун мазмун-багытталган толтурууунун аудио эквиваленти. Биз тандалган объектти курчаган аудиодон үндү клондойбуз, жаңы сапты ошол үн менен синтездейбиз жана аны кыска кросс-файдинг менен кайра бириктиребиз.

Эң мыкты натыйжа: клонердин жакшы булак материалдары бар болушу үчүн, түзөтүү пунктунан бир аз мурда 3 секунда таза сүйлөм калтырыңыз.

Эң мыкты натыйжалар үчүн кеңештер

Белгиленген диапазондорду мүмкүн болушунча чектелген кылып сактоо — жөн гана катаал сүрөттөр
Текст, который будет заменен, должен быть примерно такой же длины, как и текст, который будет заменен
Тилди аудио булагына ылайыкташтыруу, эң мыкты үн тандоо үчүн
80 мсек. өтмөктөгү ылдый түшүү адаттагыдай көрүнбөйт; тыкылдаган үн чыкса, 150 мсек.ге чейин көтөрүлөт
Узак өзгөртүүлөр үчүн (>10с), анын ордуна бүт текстти кайра жазуу керек

AI аудио сүрөттөмөсүнүн иштөөсү

Операциялык оңдоо, үн менен шайкештик, кайра жаздыруу сессиясы жок.

1-кадам

Жүктөө + диапазону белгилөө

Аудио файлды жүктөп алыңыз жана алмаштыргыңыз келген бөлүмдүн башталышын/аялын белгилөө үчүн скотчту колдонуңуз. Текст алмаштыруу үчүн киргизиңиз.

2-кадам

Сөздү клондоо жана синтездөө

Биз сиздин тандооңузду курчаган 12 секундга чейинки таза аудиону алып, сүйлөгөн адамдын үнүн клондоп, жаңы сапты ошол үндүн ичинде синтездейбиз.

3-кадам

Кроссфайдинг

Синтезделген клип оригиналдуу жазууга эки түзөтүү пунктунда тең күчтүү окшоштуруу менен кошулат. Сыяктар угулбайт.

Аудио сүрөттөлүш пландары

Акысыз баштаңыз, керек болсо жаңыртыңыз

Акысыз

10 мүнөткө чейинки файлдар
500 символдук алмаштыруучу текст
4-секундалык сүрөт тартуу бир сурам үчүн
80ms кроссфейд сплейс
OpenVoice + CosyVoice 2 программалык камсыздоосу

Эң популярдуу

Акысыз эсеп-кысап

10 мүнөткө чейинки файлдар
5000 символдук алмаштыруучу текст
Түздөтүлүүчү ылдый түшүрмө (0-250 мс)
Сөз моделинин алмаштыруусу
Жаңылоо тарыхы + кайра түзүү

Акысыз каттоо

Про

30 мүнөткө чейинки файлдар
100 000 символдук алмаштыруучу текст
GPU кезектери
API (/v1/audio-inpaint/) кирүү
Партиялык сүрөт тартуу (бир нече диапазондор)

Жаңылоо

Көп берилүүчү суроолор

Аудио-инпринтинг (аудио-заполнение же речи наддуб) - бул аудио-записьтин бир бөлүгүн жаңы, AI-синтезделген, оригиналдуу үнү менен алмаштырууга мүмкүндүк берет. Бул Photoshopтун мазмун-аярдуу толтуруу функциясынын аудио эквиваленти - каалабаган бөлүктү боёп, анын ордуна керектүү нерсени жазып, AI бир калыпта алмаштырууну жаратат.

Заменить времявой интервал, введите новую строку диалога и нажмите кнопку "Вставить". Наш искусственный интеллект клонирует голос из окружающего аудио, синтезирует новую строку в этом голосе и соединяет его с записью коротким переходным эффектом, чтобы редактирование не слышалось.

Эгерде сизде бир гана жаман сөз, туура эмес сүйлөм, ысымдын туура эмес жазылышы, катаал сөз же башкача айтканда, жакшы кабыл алынган бир факты болсо, анда аны колдонуп көрүңүз. Бардык фрагментти кайра жаздыруу көп учурда долбоордун калган бөлүгү менен тоналдык дал келбестиктерди жаратат - монтаждоо оңдоо керек болгон нерселерди гана оңдойт, калган сөздөр бузулбай калат.

Бесплатные пользователи могут вставлять файлы длиной до 10 минут. Абоненты могут вставлять файлы длиной до 30 минут. Текст замены ограничен 500 символами для бесплатных пользователей, 5000 символами для бесплатных учетных записей и 100 000 символами для платных планов.

Очень близко. AI использует до 12 секунд аудио из окружающей среды как голосовую ссылку, что достаточно для любого из наших клонирующих моделей (OpenVoice, CosyVoice 2) для захвата тембра, высоты и стиля речи. Лучшие результаты получатся, если оставить не менее 3 секунд чистого речи перед точкой редактирования.

Биз эки сплескилүү пунктуна (баш→алмашуу жана алмаштыруу→аягы) 80 мсек тең күчтүү ысык-суук аралаштырууну колдонобуз. Аны 0 мсектен (түз кесүү) 250 мсекке чейин өзгөртө аласыз. Бул үчүн Слайдердин Салыштыруу баскычын басыңыз. Узак убакытка созулган аралаштыруу текстти толук жашырат, бирок бир-биринен бөлүнүп калган сөздөрдү үнүнөн ажырата алат.

Аудио-интерфейс үн клондоосунда колдонулган тилдерге ылайык иштелип чыккан. Биз көпчүлүк тилдер үчүн OpenVoice, ал эми кытай, япон жана корей тилдери үчүн CosyVoice 2 тандап алабыз. Бул моделди жогорудагы параметрлерде өзгөртө аласыз.

Сизге секундасына 500 символдук аудио алмаштыруу үчүн төлөм алынат. 4 секунддук оңдоо 2000 символдук текстти алмаштырууга туура келет. Бул сумма тексттин узундугуна жараша болот, анткени клондоо синтези жаңы клиптин аткаруу убактысына, тексттин узундугуна эмес, көз каранды.

Биздин кызмат көрсөтүү шарттарына ылайык, сиз өзүңүздүн же түзөтүү укугуңуз бар аудиону гана киргизе аласыз. Жалган цитаталарды, алдамчылык мазмунду же башка адамдын ысымын колдонууга тыюу салынат. Биз генерацияланган аудиону суу белгиси менен белгилейбиз жана бардык киргизүү тапшырмаларын журналга жазабыз.

Клипти кесүү темпте жана дем алууда көрүнүктүү ката кетирет; эки тасманы бирдей убакытта бирдей ыргакта ойнотуу тоналдык ката кетирет. Сүрөткө түшүрүү катаны айланадагы үн менен дал келген сөз менен толтуруп, угуучуларга бир калыпта, табигый угулган аудиону берет.

Да — POST /v1/audio-inpaint/ менен аудио файл, start_sec, end_sec, жана replacement_text. Endpoint returns a job UUID; poll /v1/speech/results/?uuid= to retrieve the painted audio when ready. More details in the API documentation.

ElevenLabs Слов-к-слова регенерирует всю голосовую строку в целевой голос. Наша аудио-инпиляция хирургическая: она только редактирует отмеченный диапазон, оставляет все остальные байт оригинального записи нетронутыми, и соответствует новому клипу окружающему голосу, а не отдельной голосовой библиотеке.

5.0/5 (1)

Аудиону секундаларда оңдоо

Запись любого раздела заменяется искусственным синтезом речи, соответствующей оригинальному голосу. Начать бесплатно.

Акысыз катталуу Бааны көрүү

AI аудио сүрөттөө

Аудиону Inpaintке жүктөп алуу

Аудио булагы — каталуу кабыл алууну табуу үчүн тазалоо

Сүрөттүн параметрлери

Алдыда (Башталгыч)

Андан кийин (боёлуп)

Аудио сүрөттөмөсүн кантип иштетүү керек

Эң мыкты натыйжалар үчүн кеңештер

AI аудио сүрөттөмөсүнүн иштөөсү

Жүктөө + диапазону белгилөө

Сөздү клондоо жана синтездөө

Кроссфайдинг

Аудио сүрөттөлүш пландары

Көп берилүүчү суроолор

Аудиону секундаларда оңдоо

AI аудио сүрөттөө

Аудиону Inpaintке жүктөп алуу

Аудио булагы — каталуу кабыл алууну табуу үчүн тазалоо

Сүрөттүн параметрлери

Алдыда (Башталгыч)

Андан кийин (боёлуп)

Аудио сүрөттөмөсүн кантип иштетүү керек

Эң мыкты натыйжалар үчүн кеңештер

AI аудио сүрөттөмөсүнүн иштөөсү

Жүктөө + диапазону белгилөө

Сөздү клондоо жана синтездөө

Кроссфайдинг

Аудио сүрөттөлүш пландары

Көп берилүүчү суроолор

Аудио сүрөттөө деген эмне?

Бул кандайча иштейт?

Кайсы учурда аудиону кайра жазуу ордуна аудиону сүрөттөө керек?

Аудио булагы канчалык узак болушу мүмкүн?

Сүрөттөлгөн сүйлөмдүн үнү оригиналдуу сүйлөгөн адамга окшош болобу?

Редакциялоо чекиттеринде эмне болот?

Кайсы тилдер колдоого алынат?

Аудио сүрөттөмө канча турат?

Мен бул менен кимдир бирөөнүн оозуна алар айткан эмес сөздөрдү салып бере аламынбы?

Эмне үчүн туура эмес бөлүктөрдү жок кылуудан көрө, аларды сүрөткө тартуу керек?

Аудио сүрөттөө API барбы?

Бул ElevenLabs Сплит-Сплит менен кандайча салыштырылат?

Аудиону секундаларда оңдоо