AI аудио тасвирлаш

Аудионинг бир қисмини атрофдаги овозга мос AI-синтезланган сўз билан алмаштириш. Ёмон олинганни бутунлай қайта ёзмасдан тузатиш.

Бизда сизнинг тилингизда TTS овозлари ҳали йўқ. Бизга ўзингизникини қўшишимизга ёрдам беринг! Ўз овозингизни сотинг

Инпайнтга аудио юклаш

Ҳар секундда 500 та аудио ҳарф алмаштирилди

Файлингизни бу ерга кўчириб қўйинг ёки кўриш

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл.mp3

0 MB

Манба аудиоси — ёмон олинганини топиш учун тозалаш

0.00s / 0.00s

Инристинг параметрлари

0 / 500 белгилар
Сплайс нуқталарини аралаштириш учун қанча вақт керак. 80мс - бу аввалдан белгиланган - мослашган кесиш табиий кўринади, эшитиладиган икки марта ишга туширувчи йўқ.
Аудио тасвирлашни фойдаланиш учун бепул рўйхатдан ўтинг
Аудио тасвирланмоқда...

Овоз клон қилинмоқда ва алмаштирувчи синтез қилинмоқда...

Қисқартириш → атрофдаги овозни клонлаш → ўчириш билан боғлаш
Бироз вақт кетадими? Натижалар сизнинг ҳисоботингизда кўринади яратиш тарихи Қачонки у тайёр бўлса.
Инпринтинг аудио тайёр

Олдинги (Орижий)

Сўнг (Расмда)

Инкрин аудиони юклаб олиш

Аудио тасвирлаш қандай ишлайди

Инпайнтинг Photoshopнинг мазмунга қараб тўлдиришнинг аудио эквивалентидир. Биз танланган жой атрофидаги аудиодан овозни клонлаймиз, бу овозда янги сатрни синтезлаймиз ва уни қисқа ўчиш билан қайта боғлаймиз.

Энг яхши натижалар: клонловчи яхши манба материалига эга бўлиши учун таҳрирлаш нуқтаси олдидан камида 3 сониялик тоза сўзлашув қолдиринг.

Энг яхши натижалар учун маслаҳатлар

  • Танланган диапазони имкон қадар тор тутиш - фақат ёмон суратлар
  • Мавзу алмаштирилганда, у алмаштирилган матннинг узунлигига тенг бўлиши керак
  • Энг яхши овоз мослиги учун манба аудиосига мос келадиган тилни танланг
  • 80ms crossfade одатда кўринмайди; агар сиз тугмачани эшитсангиз 150ms га туширинг
  • Умумий ўзгартиришлар учун (>10с), бутун фрагментни қайта ёзишни ўйлаб кўринг

AI аудио тасвирлаши қандай ишлайди

Операциядан кейинги таҳрир, овозга мослашган, қайта ёзиш сеанси йўқ.

1-қадам

Юклаш + диапазони белгилаш

Аудио файлингизни юклаб олинг ва алмаштирмоқчи бўлган бўлимнинг бошланиши/охири учун тегирмондан фойдаланинг. Алоҳида матнни киритинг.

2-босқич

Товушни клонлаш + синтезлаш

Биз танланган жой атрофидаги 12 сониягача бўлган тоза аудиони ажратамиз, сўзловчи овозини клонлаймиз ва бу овозда янги сатрни синтезлаймиз.

3-босқич

Ўтиш ёпишқоқлиги

Синтезланган клип иккита таҳрирлаш нуқтасида тенг кучли ўчиши билан асл ёзувга қўшилади. Соҳиллари эшитилмайди.

Аудио тасвирлаш режалари

Бепул бошланг, яна кўпроқ керак бўлса янгиланг

Оқ
  • 10 дақиқагача бўлган манба файллари
  • 500-каратли алмаштирувчи матн
  • Ҳар бир талаб учун 4-секундлик чизма
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 оқовлари
Энг машҳур
Бепул ҳисоб
  • 10 дақиқагача бўлган манба файллари
  • 5000-аломатли алмаштирувчи матн
  • Тузилувчи ўчириш (0-250ms)
  • Товуш моделини ўзгартириш
  • Юклаш тарихи + қайта-таҳрирлаш
Бепул рўйхатдан ўтиш
Про
  • 30 дақиқагача бўлган манба файллари
  • 100,000-каратли алмаштирувчи матн
  • Авваллик GPU навбати
  • API кириши (/v1/audio-inpaint/)
  • Партиядаги чизиш (кўп диапазонлар)
Янгилаш

Кўп бериладиган саволлар

Аудио тўлдириш (аудио тўлдириш ёки сўзлашув устидан ёзиш деб ҳам аталади) мавжуд аудио ёзувнинг бир қисмини асл овозга мос келадиган янги AI-синтезланган сўзлашув билан алмаштиришга имкон беради. Бу Photoshop'нинг мазмунга қараб тўлдиришнинг аудио эквивалентидир - сиз хоҳламаган қисмини бўяш, ўрнига нима бўлиши кераклигини ёзиш ва AI бир текис алмаштиришни яратиш.

Ўрнатиладиган вақт оралиғини белгиланг, диалогнинг янги сатрини ёзинг ва "Расмга олиш" тугмасини босинг. Бизнинг AI овозни танланган аудиодан клонлайди, овоздаги янги сатрни синтезлайди ва уни ёзувингизга қисқача ўчириш билан қайта боғлайди, шунинг учун таҳрирлаш эшитилмайди.

Буни бирор ёмон сўз, нотўғри талаффуз, исм-шариф, лақаб сўзи ёки бошқача яхши олинганда факт хатоси бўлганда ишлатинг. Барча парчани қайта ёзиш кўпинча лойиҳанинг қолган қисми билан тонал мос келмаслигига олиб келади - тасвирлаш фақатгина тузатиш керак бўлган жойларни тузатади, бошқа ҳар бир ҳарфни эса ўзгартирмай қўяди.

Бепул фойдаланувчилар файлларни 10 дақиқагача чизиши мумкин. Абонентлар файлларни 30 дақиқагача чизиши мумкин. Ўзига хос алмаштирилган матн бепул фойдаланувчилар учун 500 та, бепул ҳисоблар учун 5000 та ва тўловли ҳисоблар учун 100000 та белгидан иборат бўлиши мумкин.

Жуда яқин. AI овоз манбаи сифатида таҳрирлашни 12 сониягача тинглайди, бу бизнинг клонлаш қобилиятига эга бўлган моделларимиз (OpenVoice, CosyVoice 2) учун сўзловчининг товуши, овоз баландлиги ва сўзлаш услубини олиш учун етарли. Энг яхши натижа учун таҳрирлаш нуқтасидан олдин камида 3 сония очиқ сўзлашни қолдиринг.

Биз иккита боғлаш нуқтасида (бош→ўрин алмаштириш ва ўрнини босиш→оёқ) 80мс тенг кучли ўчиш-қўниш режимини қўллаймиз. Сиз буни 0мс (қаттиқ кесиш) дан 250мс гача Crossfade слайдери орқали созлашингиз мумкин. Умумий ўчиш-қўниш режимида таҳрирлаш янада тўлиқроқ яширилса, аммо чегарада бир-бирига ўхшаш сўзлар эшитилиши мумкин.

Аудио тасвирлаш овозни клонлаш каби тил қамровини қўллаб-қувватлайди. Биз кўпгина тиллар учун OpenVoice ва Хитой, Япон ва Корея учун CosyVoice 2'ни автоматик равишда танлаймиз. Сиз бу моделни юқоридаги параметрларда ўзгартиришингиз мумкин.

Сизга ҳар бир секундда 500 та аломат ўрнатилиши учун ҳақ тўланади. 4 сониялик тузатиш 2000 та аломатга тушади. Бу ҳақ алмаштирилган матннинг узунлигидан қатъи назар, чунки остидаги клон синтези матн узунлиги эмас, янги клипнинг ишлаш вақтига қараб белгиланади.

Бизнинг хизмат шартларимизга кўра, сиз фақат ўзингизга тегишли ёки таҳрирлаш учун аниқ рухсатингиз бор аудиони чизишингиз мумкин. Ёлғон иқтибослар, алдамчи мазмун ёки ўзингизни бошқаларга ўхшатиш тақиқланган. Биз яратилган аудиога сув белгисини қўйамиз ва барча чизиш ишларини хатоларни текшириш учун ёзиб оламиз.

Клипни кесиш ритм ва нафас олишда сезиларли бўшлиқ қолдиради; иккита клипти бир-бирига ўхшатиш эса тоник нотекисликни қолдиради. Инпичмент бўшлиқни атрофдаги овозга мос келадиган сўз билан тўлдиради, шунинг учун эшитувчилар доимий, табиий товушли аудиони эшитадилар.

Ҳа — аудио файли, start_sec, end_sec ва replacement_text билан /v1/audio-inpaint/га POST. Охири UUID вазифасини қайтаради; тайёр бўлганда ёпиштирилган аудиони олиш учун /v1/speech/results/?uuid= сўровини ўтказади. Тезкор маълумотлар учун API ҳужжатлигини кўринг.

ElevenLabs Speech-to-Speech бутун овоз линиясини мақсад овозида янгидан яратади. Бизнинг аудио тасвирлашимиз хирургик: у фақат белгиланган диапазони ўзгартиради, оригинал ёзувингизнинг ҳар бир байтини ўзгартирмай сақлайди ва янги клипни алоҳида овоз китобхонаси ўрнига атрофдаги овозга мослаштиради.
5.0/5 (1)

Биз нимани яхшилашимиз мумкин? Сизнинг фикрингиз бизга муаммоларни ҳал қилишга ёрдам беради.

Аудионгизни сонияларда тузатинг

Ҳар қандай ёзувнинг ҳар қандай қисмини асл овозга мос AI-синтезланган сўзлашув билан алмаштиринг. Бошлашга бепул рўйхатдан ўтинг.