AI ऑडिओ इनपेंटिंग

ऑडिओचे एक भाग AI-संश्लेषित वक्तव्याने बदलवा जे आसपासच्या आवाजाशी जुळते. संपूर्ण गोष्टीला पुन्हा रेकॉर्ड न करता वाईट रेकॉर्डिंग सुधारा.

आम्हाला अद्याप तुमच्या भाषेतील TTS आवाज उपलब्ध नाही. आम्हाला तुमचे जोडण्यास मदत करा! Sell Your Voice

Inpaint करीता ऑडिओ अपलोड करा

प्रति सेकंद 500 अक्षरे ऑडिओ बदलविले

फाइल इथे ढकलून टाका, किंवा संचारन

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

फाइल.mp3

0 MB

स्त्रोत ऑडिओ — वाईट रेकॉर्ड शोधण्याकरीता स्क्रब करा

0.00s / 0.00s

इनपेंट संयोजना

0 / 500 अक्षरे
स्प्लाईस बिंदू किती काळासाठी ब्लेंड करावे. 80ms हे मुलभूत आहे - जुळवणी-काटे नैसर्गिक वाटतात, ऐकू येणारा दुहेरी-ट्रिगर नाही.
ऑडिओ इनपेइंटिंग वापरण्यासाठी मोफत नोंदणी करा
ऑडिओ इनपेइंट करत आहे...

आवाज क्लोन करीत आहे व प्रतिस्थापन संश्लेषित करत आहे...

गडावर जाण्यासाठी पायर्‍या आहेत, गडावर जाण्यासाठी पायर्‍या आहेत
थोडा वेळ लागतो का? तुमचे परिणाम तुमच्या यादीमध्ये दिसेल इतिहास तयार झाल्यावर.
इनपेंटेड ऑडिओ तयार

आधी (मूल)

नंतर (रंगविलेले)

डाउनलोड

ऑडिओ इंपेइंटिंग कसे कार्य करते

इंपेइंटिंग हे फोटोशॉपच्या संदर्भ-जागृत भरणाचे ऑडिओ समकक्ष आहे. आपण निवडाभोवतीच्या ऑडिओपासून आवाजाचे क्लोन बनवतो, त्या आवाजात नवीन ओळी संश्लेषित करतो, आणि छोट्या क्रॉसफेडसह परत स्प्लिट करतो.

सर्वात जास्त गुण: ३ गुण सर्वात कमी गुण: २ गुण सर्वात जास्त गुण: १ गुण सर्वात कमी गुण: १ गुण

सर्वोत्तम परिणाम करीता टिप

  • मार्क केलेल्या क्षेत्र शक्य तितके घट्ट ठेवा - फक्त वाईट टक
  • प्रतिस्थापीत पाठ्य बदलविण्याजोगी पाठ्यपेक्षा जवळजवळ समान लांबीचे असावे
  • सर्वोत्तम आवाज जुळवणी करीता स्त्रोत ऑडिओशी जुळवणी करीता भाषा निश्चित करा
  • 80ms क्रॉसफेड सामान्यतः अदृश्य आहे; क्लिक ऐकल्यास 150ms वर बम्प करा
  • लांब संपादन (>10s) करीता, त्याऐवजी संपूर्ण भाग पुन्हा-रेकॉर्ड करण्याबद्दल विचार करा

ॲडव्हान्स्ड ऑडिओ प्लेयर

शस्त्रक्रिया, आवाज-मापन, पुनरावृत्ती सत्र नाही.

चरण 1

अपलोड + मार्क क्षेत्र

तुमचे ऑडिओ अपलोड करा व बदलवायचे असणाऱ्या विभागाच्या सुरुवात/अंत चिन्हांकन करण्यासाठी स्क्रबचा वापर करा. बदलविण्याकरीता पाठ्य टाइप करा.

चरण २

आवाज क्लोन + सिंथेसाइझName

या वेळी प्रेक्षकांच्या मनात निर्माण झालेली भावना, त्यातील भाव, त्यातील भावभावना व्यक्त करणारे शब्द, त्यातील शब्दांचे अर्थ, त्यातील शब्दांचे अर्थ व्यक्त करणारे शब्द असे विविध प्रकारचे शब्द वापरले जातात.

चरण ३

क्रॉसफेड स्प्लाईस

सिंथेसाइज्ड क्लिप दोन्ही संपादन बिंदूंवर समान-शक्ती क्रॉसफेड सह मूळ रेकाॅर्डिंग मध्ये स्प्लिट केले जाते. सीमा ऐकू येत नाही.

ऑडिओ इन्पेइंटिंग प्लॅन

मोफत सुरू करा, तुम्हाला जास्त हवे असल्यास अद्ययावत करा

मोकळे
  • 10 मिनिट पर्यंतचे स्त्रोत फाइल
  • 500-अक्षर प्रतिस्थापीत पाठ्य
  • प्रति विनंती 4- सेकंद इनपेंट
  • 80ms क्रॉसफेड स्प्लाइस
  • ओपनवॉइस + कॉसीवॉइस2बैकएण्डName
सर्वात लोकप्रिय
मोकळे खाते
  • 10 मिनिट पर्यंतचे स्त्रोत फाइल
  • 5,000-अक्षर प्रतिस्थापीत पाठ्य
  • ट्युनेबल क्रॉसफेड (0- 250ms)
  • आवाज-नमूना ओव्हरराइड
  • इतिहास बनवा + पुन्हा संपादीत करा
नोंदणी करा
प्रो
  • 30 मिनिट पर्यंतचे स्त्रोत फाइल
  • 100,000-अक्षर प्रतिस्थापीत पाठ्य
  • प्राधान्यता GPU कतार
  • API प्रवेश (/v1/audio-inpaint/)
  • बॅच इनपेंटिंग (बहुविध क्षेत्र)
अद्ययावत करा

वारंवार विचारले जाणारे प्रश्न

ऑडिओ इनपेइंटिंग (ऑडिओ भरणी किंवा भाषण ओवरडब असेही म्हणतात) तुम्हाला अस्तित्वात असलेल्या ऑडिओ रेकॉर्डिंगच्या भागाची बदलणी करण्यास परवानगी देतो ज्यात नवीन AI-संश्लेषित भाषण आहे जे मूळ आवाजाशी जुळते. ते फोटोशॉपच्या संदर्भ-जागृत भरणीचे ऑडिओ समकक्ष आहे - तुम्हाला न हवे त्या भागावर रंग लावा, त्याऐवजी जे तिथे असायला हवे ते टाइप करा, आणि AI ने एक सुलभ बदलणी निर्माण केली.

बदलविण्याकरीता वेळ सीमा चिन्हांकित करा, संवादाची नवीन ओळ टाइप करा, आणि इंपेंट वर क्लिक करा. आमचे AI तुमच्या निवडीभोवतीच्या ऑडिओपासून आवाज क्लोन करते, त्या आवाजात नवीन ओळ संश्लेषित करते, आणि ते तुमच्या रेकार्डमध्ये पुन्हा संलग्न करते, त्यामुळे संपादन ऐकू येत नाही.

एकच वाईट शब्द, चुकीचे उच्चार, नावाच्या स्लिप, स्तुतीपर शब्द, किंवा इतरथा चांगल्या रेकॉर्डमध्ये तथ्याची चूक असल्यास याचा वापर करा. संपूर्ण खंड पुन्हा-रेकॉर्ड केल्यास बहुतेक वेळा प्रकल्पाच्या उर्वरित भागाशी टोन मिसमेच येतो - इंपेइटिंग केवळ जे सुधारणा करण्याची गरज आहे ते सुधारणा करते तर इतर सर्व अक्षरे अखंड ठेवते.

मोफत वापरकर्ते 10 मिनिटांपर्यंत फाइल इंपेंड करू शकतात. सदस्य 30 मिनिटांपर्यंत फाइल इंपेंड करू शकतात. प्रतिस्थापन पाठ्य स्वतःच मोफत वापरकर्त्यांसाठी 500 अक्षरे, मोफत खात्यांसाठी 5,000 आणि मोफत योजनांसाठी 100,000 पर्यंत मर्यादित आहे.

खूप जवळ. AI आवाज संदर्भ म्हणून संपादनासभोवती १२ सेकंद ऑडिओ वापरते, जे आमच्या क्लोन-सक्षम मॉडेल (ओपनव्हॉईस, कॉसीव्हॉईस २) साठी पुरेसे आहे जे वक्त्याचा टिंबर, पिच, आणि बोलण्याची शैली रेकॉर्ड करते. सर्वोत्तम परिणामासाठी, संपादन बिंदू पूर्वी किमान ३ सेकंद स्वच्छ भाषण सोडा.

आम्ही दोन्ही splice बिंदूवर (head→replace आणि replacement→tail) मुलभूतरित्या 80ms equal-power crossfade लागू करतो. तुम्ही हे0ms (hard cut) पासून 250ms पर्यंत Crossfade स्लाइडर द्वारे सुधारणा करू शकता. लांब crossfades संपादन अधिक पूर्णपणे लपविते पण सीमांत ओव्हरलेप शब्द ऐकण्याजोगे मिक्स करू शकते.

ऑडिओ इनपेइंटिंग आवाज क्लोनिंग प्रमाणे भाषा कव्हरेजचे अनुसरण करते. आम्ही बहुतेक भाषांसाठी ओपनव्हॉईस आणि चीनी, जपानी व कोरियाई करीता कॉसीव्हॉईस2आपल्यापुरते निवडतो. तुम्ही उच्च स्तरीय संयोजना अंतर्गत मॉडेलवर मात करू शकता.

प्रति सेकंद 500 अक्षरे बदलविले ऑडिओची तुम्हाला फी आकारली जाते.4सेकंद दुरुस्तीसाठी 2000 अक्षरे खर्च होते. बदलविलेले पाठ्य किती लांब आहे यावर खर्च अवलंबून नाही, कारण खालच्या क्लोन संश्लेषण नवे क्लिपचे रनटाइम द्वारे गेट केले जाते, पाठ्य लांबी नाही.

आमच्या सेवा नियमांनुसार, तुम्ही फक्त तुमच्या मालकीचे ऑडिओ किंवा संपादन करण्याची स्पष्ट परवानगी असलेले ऑडिओ इंपेंड करू शकता. बनावट उद्धरण, फसवणूक करणारे संदर्भ किंवा प्रतिरूप तयार करणे अवैध आहे. आम्ही निर्मित ऑडिओवर वॉटरमार्क बनवतो व सर्व इंपेंडिंग कामांचा वापर दुरुपयोग तपासण्यासाठी नोंद करतो.

क्लिप कापला असता, गती आणि श्वास यांत एक स्पष्ट अंतर राहते; दोन तास क्रॉस-फेड केल्यास एक टोन मिसमैच राहतो. इंपेइटिंग आवाजाच्या आसपासच्या आवाजाशी जुळणारे भाषणाद्वारे अंतर भरते, म्हणून श्रोते सतत, नैसर्गिक आवाजाचे ऑडिओ ऐकतात.

होय — ऑडिओ फाइल, start_sec, end_sec, व replacement_text सह /v1/audio-inpaint/ ला POST करा. शेवटचे बिंदू एक काम UUID परत करतो; तयार झाल्यावर इंपेंडेड ऑडिओ प्राप्त करण्यासाठी /v1/speech/results/?uuid= चा वापर करा. तपशीलांसाठी API दस्तऐवज पहा.

ElevenLabs Speech-to-Speech लक्ष्य आवाजात संपूर्ण आवाज ओळीला पुन्हा निर्माण करते. आमचे ऑडिओ इनपेइटिंग सर्जरी आहे: ते फक्त मार्क केलेल्या क्षेत्राचे संपादन करते, तुमच्या मूळ रेकॉर्डिंगचे प्रत्येक इतर बायट अप्रभावित ठेवते, आणि वेगळ्या आवाज लायब्ररीऐवजी नवीन क्लिपला आसपासच्या आवाजाशी जुळवते.
5.0/5 (1)

आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.

सेकंदांत तुमचे ऑडिओ निश्चित कराName

कोणत्याही रेकार्डचा भाग AI-संश्लेषित भाषणाने बदलवा जे मूळ आवाजाशी जुळते. सुरू करण्यासाठी मोफत नोंदणी करा.