Намоиши овози AI

Ҷойивазкунии қисмати аудио бо суханронии синтезишудаи AI, ки бо овози атроф мувофиқат мекунад. Таъмир кардани гирифтани бад бе бознависии ҳама чиз.

Мо ҳанӯз овозҳои TTS-ро ба забони шумо надорем. Ба мо дар илова кардани овозҳои худ кӯмак кунед! Садои шуморо фурӯшед

Боркунии аудио ба Inpaint

500 аломат дар як сония барои ивазкунии аудио

Файли худро ба ин ҷо кашола кунед ва гузоред ё Намоиш

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл.mp3

0 MB

Манбаъи аудиоӣ — барои ёфтани гирифтани нодуруст шуста мешавад

0.00s / 0.00s

Танзимоти рангкунӣ

0 / 500 Аломатҳо
Вақти омехта кардани нуқтаҳои пайвастшавӣ. Пешфарз 80 мс аст - буридани мувофиқ ба таври табиӣ ба назар мерасад, бе садои дубораи садо.
Барои истифодаи рангкунии аудиоӣ ройгон сабти ном шавед
Намоиши аудио...

Тасвири овоз ва синтези ивазкунӣ...

Тақсимкунӣ → дубора сохтани овози атроф → пайвасткунӣ бо омехташавӣ
Як муддат вақт мегирад? Натиҷаи шумо дар панели худ пайдо мешавад Таърихи генератсия вақте ки омода аст.
Интихоби аудио

Пеш аз (Оригинали)

Баъд аз (Рангкардашуда)

Боргирии аудиои рангшуда

Чӣ тавр ранг кардани аудио кор мекунад

Инпитинг эквиваленти аудиоии пуркунии Photoshop мебошад. Мо овозро аз овозе, ки атрофи интихоби шуморо дар бар мегирад, клон мекунем, сатри навро дар ин овоз синтез мекунем ва онро бо як омехтаи кӯтоҳ ба ҳам мепайвандем.

Натиҷаҳои беҳтарин: ҳадди аққал 3 сония суханронии тозаро пеш аз нуқтаи таҳриркунӣ гузоред, то ки клонер маводи истинодро хуб дошта бошад.

Маслиҳатҳо барои натиҷаҳои беҳтарин

  • Диапазони нишондодашударо то ҳадди имкон маҳдуд нигоҳ доред - танҳо гирифтани нодуруст
  • Матни ҷойгузин бояд ба андозаи ҳамоне, ки он ҷойгузин мешавад, дароз бошад
  • Танзими забон барои мувофиқат бо аудиои манбаъи барои мувофиқати беҳтарини овоз
  • 80 мс омехташавӣ одатан ноаён аст; агар шумо пахшро шунидед, ба 150 мс гузаред
  • Барои таҳриркуниҳои дароз (>10 сония), ба ҷои ин, аз нав сабт кардани тамоми гузаришро дар назар гиред

Чӣ тавр AI Audio Inpainting кор мекунад

Дар ин ҷо барои гузаронидани амалиёти ҷарроҳӣ, барои гузаронидани амалиёти ҷарроҳӣ, барои гузаронидани амалиёти ҷарроҳӣ.

Қадами 1

Боркунӣ + Ишора намудани диапазони

Боркунии аудио ва истифодаи лағжанда барои нишон додани оғоз/охири қисме, ки шумо мехоҳед иваз кунед. Матни ивазкуниро ворид кунед.

Қадами 2

Синтезатори овозName

Мо то 12 сония аз аудиои истинодӣ тозаро дар атрофи интихоби шумо бармегирем, овози сухангӯро клон мекунем ва сатри навро дар он овоз синтез мекунем.

Қадами 3

Пайвастшавӣ

Клипи синтезшуда ба сабти аслӣ бо якҷоякунии гузариш бо қувваи баробар дар ҳарду нуқтаи таҳриркунӣ пайваст карда мешавад. Сарҳадҳо шунида намешаванд.

Нақшаҳои рангкунии аудиоӣ

Бепул оғоз кунед, вақте ки ба шумо бештар лозим аст, навсозӣ кунед

Озод
  • Файлҳои сарчашма то 10 дақиқа
  • Матни ҷойгузини 500- аломат
  • 4- сония дархост барои рангкунӣ
  • 80ms омехтани гузариш
  • Comment=Системаи иттилоотии KDEName
Беҳтарин
Ҳисоби озод
  • Файлҳои сарчашма то 10 дақиқа
  • Матни ҷойгузини 5000 аломат
  • Тағйирёбии гузариш (0- 250 мс)
  • Тағйири намунаи овоз
  • Таърихи эҷодкунӣ + таҳрири дубора
Бақайдгирӣ
Про
  • Файлҳои сарчашма то 30 дақиқа
  • Матни ивазкунии 100, 000 аломат
  • Навбати GPU- и пешрафта
  • Дастрасии API (/v1/audio-inpaint/)
  • Рангкунии гурӯҳӣ (диапазонҳои зиёд)
Навсозӣ

Саволҳои пурсидашаванда

Ранги аудиоӣ (бо номи пуркунии аудиоӣ ё барҳамдиҳии сухан) ба шумо имкон медиҳад, ки қисмати сабти аудиоии мавҷударо бо сухани нав, ки бо овози аслӣ мувофиқат мекунад, иваз кунед. Ин эквиваленти аудиоии пуркунии бо мазмуни Photoshop аст - қисмеро, ки шумо намехоҳед, ранг кунед, дар ҷои он он чиро, ки бояд бошад, нависед, ва AI ивазкунии беназирро эҷод мекунад.

Диапазони вақтро барои ивазкунӣ нишон диҳед, сатри нави диалогро ворид кунед ва Интихоб кунед. ДИИ мо овозро аз аудиои атрофи интихоби шумо клон мекунад, сатри навро дар ин овоз синтез мекунад ва онро ба сабти шумо бо як омехтаи кӯтоҳ пайваст мекунад, то ки таҳриркунӣ шунида нашавад.

Инро барои як калимаи нодуруст, талаффузи нодуруст, номҳои нодуруст, калимаҳои дашномӣ ё хатои фактӣ дар як сабти хуб истифода баред. Бознависии тамоми иқтибосҳо аксар вақт ба нобаробарии тоналӣ бо дигар қисмҳои лоиҳа оварда мерасонад - инпринтинг танҳо он чиро, ки бояд ислоҳ шавад, ислоҳ мекунад ва ҳар як сутунро бе тағйир мегузорад.

Истифодабарандагони ройгон метавонанд файлҳоро то 10 дақиқа ранг кунанд. Истифодабарандагони обунашуда метавонанд файлҳоро то 30 дақиқа ранг кунанд. Матни ҷойгузин барои истифодабарандагони ройгон то 500 аломат, барои истифодабарандагони ройгон то 5000 аломат ва барои истифодабарандагони пардохташуда то 100000 аломат маҳдуд аст.

Ба таври хеле наздик. AI то 12 сонияҳои аудиоро дар атрофи таҳриркунӣ ҳамчун истиноди овоз истифода мебарад, ки барои ҳар як намунаи мо (OpenVoice, CosyVoice 2) барои гирифтани садои овоздиҳанда, баландӣ ва услуби суханронӣ кофист. Барои натиҷаҳои беҳтарин, ҳадди аққал 3 сония суханронии тозаро пеш аз нуқтаи таҳриркунӣ гузоред.

Мо бо пешфарз 80 мс- и равшаншавии якхеларо дар ҳар ду нуқтаи пайвасткунӣ (сар→ ҷойгузин ва ҷойгузин→ поён) истифода мебарем. Шумо метавонед инро аз 0 мс (буридани сахт) то 250 мс бо ёрии чархзанандаи равшаншавии якхела танзим кунед. Равшаншавии якхелаи дарозтар таҳриркуниро пурратар пинҳон мекунад, аммо метавонад калимаҳои дар сарҳад якҷояшударо ба таври шунавоӣ омехта кунад.

Интихоби забон

Шумо барои ҳар як сонияи ивазкунии аудио 500 аломат пардохт мекунед. Ивазкунии 4 сония 2000 аломатро талаб мекунад. Ин нархи аз дарозии матни ивазшаванда вобаста нест, чунки синтези клони асосӣ аз вақти иҷрои клипҳои нав, на аз дарозии матн, вобаста аст.

Мувофиқи шартҳои хизматрасонии мо, шумо метавонед танҳо аудиоро, ки ба шумо тааллуқ дорад ё иҷозатномаи равшан барои таҳрир карданро доред, ранг кунед. Эҷоди иқтибосҳои қалбакӣ, мундариҷаи фиребгар ё импровизатсияҳо манъ аст. Мо аудиои эҷодшударо бо нишони обӣ нишон медиҳем ва ҳамаи корҳои рангкуниро барои баррасии истифодаи нодуруст сабт мекунем.

Тақсимкунии як клип дар суръат ва нафас як фосилаи мушоҳидашавандаро мегузорад; дубора якҷоя кардани ду иқтибос як нобаробарии садоро ба вуҷуд меорад. Интихоби рангкунӣ фосиларо бо сухане пур мекунад, ки бо овози атроф мувофиқ аст, то шунавандагон садои доимиро мешунаванд.

Бале — POST ба /v1/audio-inpaint/ бо файли аудио, start_sec, end_sec ва replacement_text. Нуқтаи охирин UUID-и вазифаро бармегардонад; барои гирифтани аудиои рангшуда, вақте ки омода аст, /v1/speech/results/?uuid=-ро пурсид. Барои тафсилот ҳуҷҷати API-ро бинед.

ElevenLabs Speech- to- Speech тамоми сатри овозро аз нав аз саросари овози ҳадаф. Инъикоси аудиоии мо ҷарроҳӣ аст: он танҳо диапазони нишондодашударо таҳрир мекунад, ҳар як байтҳои дигари сабти аслӣ бе тағйир мемонад ва клипҳои нав ба овози атроф мувофиқат мекунад, на ба китобхонаи овозии алоҳида.
5.0/5 (1)

Чӣ чизро метавонем беҳтар кунем? Бозгашти шумо ба мо дар ислоҳи мушкилиҳо кӯмак мекунад.

Таъмир кардани аудиои шумо дар якчанд сония

Ҷойивазкунии ҳар як қисми ҳар як сабт бо суханронии синтезишудаи AI, ки ба овози аслӣ мувофиқат мекунад. Барои оғози кор, ройгон сабти ном шавед.