Сөйлеуден сөйлеугеName

Аудио дыбыстарды өзгерту — дыбыс, эмоция, тіл, стильді өзгерту, бірақ бастапқы мазмұнын сақтау.

Аудио көзі

Файлды мұнда сүйреп апарыңыз, не шолу

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— немесе дауысыңыз жазылсын —
00:00

Аудару параметрлері

Файлды мұнда сүйреп апарыңыз, не шолу

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

Нәтижесі

Аудио файлды жүктеп, аударуды таңдап, Бастау үшін Аудару дегенді басыңыз

Сөйлемді аудару... Бұл біраз уақытты алады.

Бастапқы

Аударылған

Қалай жұмыс істейді

1. Сөйлемді жүктеп беру

Аударғысы келетін аудионы жазу не жүктеп алу

2. Түрлендіруді таңдау

Дыбысты өзгерту, стильді ауыстыру немесе тілді аударуды таңдау

3. AI түрлендірулері

Дыбыс мазмұнын сақтай отырып, AI аудионы аясынан аяғына дейін өңдейді

Жүктеп алу

Нәтижесін тыңдап, өзгертілген аудионы жүктеп алу

Пайдалану жағдайлары

Мазмұн, қолжетімділік және шығармашылық жобалар үшін сөйлеуден сөйлеугеName

Видео дублдеу

Видеоны басқа тілдерге аударып, дыбысын сақтап қалыңыз.

Көңіл күй белгісін түзету

Режиссердің айтуынша, бұл фильмде рөлге түсудің басты себебі - оған ғашық болу, яғни ғашық болу.

Аудио шығаруName

Жазбаны басқа да дыбыстар мен стильдермен тегістеу.

Дыбыс анонимизациясы

Оның әрбір сөзі, әрбір сөзі, әрбір сөзі, әрбір сөзі, әрбір сөзі, әрбір сөзі, әрбір сөзі.

Сөйлеуден сөйлеуге модельдеріName

OpenVoice

Дыбысты жылдам аудару, егжей- тегжейлі стилін басқару. Дыбыстың сипатын, жылдамдығын және көңіл- күйін секундтар ішінде өзгерту. Name

  • Жылдам өңдеу
  • Стильдерді тасымалдау
  • Тіларалық

Chatterbox

Клиникалық көріністері іш қату, құсу, диарея, іштің ауыруы сияқты.

  • Эмоцияларды басқару
  • Zero-shot клондау
  • Жоғары дәлдік

CosyVoice 2

Тіларалық дауысты клондау 8 тілде, табиғи интонациямен және ағындық қолдаумен.

  • 8 тіл
  • Дыбысты клондау
  • Аудару

Жиі қойылатын сұрақтар

Сөзден сөзге (STS) AI бір сөйлеу аудиожазбасын басқа сөйлеу шығысына айналдырады - дауыс, стиль, эмоция немесе тіл өзгеріп, бірақ бастапқы сөздер мен уақыт сақталады. Бұл сөйлеуді тануды, өңдеуді және синтездеуді бір конвейерге біріктіреді.

Мәтінді сөйлеуге аудару жазылған мәтін аудиоға айналдырады. Мәтінді сөйлеуге аудару бар аудионы кірістіру ретінде алып, оны тікелей жаңа аудиоға айналдырады, яғни, мәтіннен сөйлеуді жасауға қарағанда, бастапқы дыбыс жазуының табиғи ырғағын, аялдамаларын, баса айтқанын және эмоционалдылығын сақтайды.

Жалпы қолданылатындары: бейнені басқа тілдерге аудару, дыбыс жазуда сөйлеушінің дауысын өзгерту, бар аудионың эмоциясын немесе тонын түзету, қарапайым дыбыс жазудан дауыс қосу жасау, дыбыс жазуды анонимді етіп, мазмұнын сақтап қалу.

OpenVoice және RVC сияқты дауыс аудару үлгілері дауыс- дауыс түрлендіруді басқарады. Тіларалық сөйлеу- сөйлеу үшін CosyVoice 2 және GPT- SoVITS басқа тілде клондап және қайта синтездей алады. Chatterbox сонымен қатар сілтемелік аудиоға негізделген синтездеуді қолдайды.

Иә. Дыбысты клондау үлгілерін қолданып, сөйлеуіңізді басқа тілге аударып, өзіңіздің дыбыс ерекшеліктеріңізді сақтай аласыз. Дыбыстарды клондау дыбысты іздеу арқылы дыбыстарды мақсатты тіл не стильге қайта синтездеп шығарады.

Конвейер алдымен сөйлеуіңізді транскрипциялап, мәтініңізді аударып, содан кейін аударылған мәтініңізді бастапқы дауысыңызбен синтездеу үшін дауыс клондау әдісін қолданады. CosyVoice 2 сияқты үлгілер тіларалық синтездеу үшін 8 тілді қолдайды.

Ең жақсы нәтиже алу үшін, фон шуы аз, таза дыбыстарды жүктеп алыңыз. WAV не FLAC 16 кГц немесе одан жоғары жиілікте жақсы жұмыс істейді. MP3, OGG, M4A, және WEBM файлдары да қабылданады. Ауысу ең дәл дыбыспен орындалады.

API арқылы Kokoro сияқты синтездеу үшін жылдам модельдер мен Faster Whisper сияқты таныу үшін жылдам модельдер қолданылып, шын уақытқа жақын өңдеу мүмкін. Кейінірек моделі мен аудио ұзындығына байланысты, бірақ қысқа сөйлемдер үшін 3 секундтан аз уақытты қажет етеді.

Иә. Chatterbox, Spark TTS және IndexTTS- 2 сияқты үлгілер эмоция мен стильді басқаруды қолдайды. Сіз тыныш сөйлемді қозғалысқа, қайғылы сөйлемді қуанышқа, бейтарап сөйлемді драмаға айналдыруға болады, бірақ сөздер мен сөйлеушінің сипаты өзгермейді.

Сөзден сөзге аудару таныу және синтездеу кредиттерін біріктіреді. 1 минуттық аудару таңдалған үлгілерге байланысты 3- 8 кредитті алады. Kokoro сияқты тегін деңгейдегі үлгілер синтездеу үшін ақысыз қолданылуы мүмкін.

Тегін пайдаланушылар 1 минутқа дейінгі аудионы өңдей алады. Ақылы жазылымдар 10 минутқа дейінгі файлдарды өңдей алады. Ұзақ жазылымдар үшін аудионы сегменттерге бөліңіз немесе ұзындығы шектелмеген пакетті өңдеу үшін API- ны қолданыңыз.

Иә, жүктелген барлық аудио файлдар біздің қауіпсіз графикалық процессор серверлерінде өңделеді және 24 сағаттан кейін автоматты түрде өшіріледі. Аудио файлдарыңыз модельдерді оқыту үшін ешқашан қолданылмайды. Барлық жіберулер шифрланған қосылым арқылы жүргізіледі және сервер- сервер байланысы аутентификацияланады.
5.0/5 (1)

Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.

ДК-мен кез келген сөйлемді түрлендіріңізName

Дауыс, эмоция, тіл және стильді өзгертіңіз. Тегін тіркеліңіз және 15000 таңбаны алыңыз.