שפּראַך צו שפּראַך

פֿאָרױסװײַז פֿאָרױסװײַז:

אויטאָמאַטיש

קלײַב אַלץ אױסFile בלעטער

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— אָדער אַרײַנשרײַבן אייער שטימע —
00:00

טעקסט פֿאַרבtransform-type

קלײַב אַלץ אױסFile בלעטער

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

רעזולטאט

קלײַב אַלץ אױסtransform-type

איבערזעצונג פֿון שפּראַך... דאָס קען נעמען אַ פּאָר מינוט

אָריגינעל

0:00 0:00

טעקסט פֿאַרבtransform-type

0:00 0:00

ווי עס אַרבעט

טעקסט פֿאַרבtext-tool-action

טעקסט פֿאַרבtransform-type

טעקסט פֿאַרבtransform-type

קלײַב אַלץ אױסselect-action

טעקסט פֿאַרבtransform-type

AI פּראַסעסט אודיו פֿון אָנהייב ביז סוף און באַהאַלט די שפּראַך־אינפֿאָרמאַציע

אַרײַנשטעלןStock label

קלײַב אַלץ אױסtransform-type

פֿאַרב:

שפּראַך־צו־שפּראַך פֿאַר אינהאַלט, צוטריט, און קינסטלערישע פּראָיעקטן

װידערצײכענונג

װײַז פֿילמען אין אַנדערע שפּראַכן און היט אױף דעם אָריגינעלן רעדאַקטאָר

אױסגלײַכונגStock label

װײַז/פֿאַרבײַז קאָפּצעטל

שריפֿט גרײס

פֿאַרװאַנדל גרױסע שפּראַך־אַרײַנשרײַבונגען אין פּשוטע שפּראַך־אַרײַנשרײַבונגען מיט פֿאַרשיידענע שפּראַכן און סטיילן

שריפֿט גרײס

קלײַב אַלץ אױסundo-type

שפּראַך־צו־שפּראַך מאָדעלס

OpenVoice

פֿאָרװערטס שפּראַך איבערזעצונג מיט גראַניאַלער סטיל קאָנטראָל. ענדערן שפּראַך אידענטיטעט, גיכקייט, און אינטערעס אין סעקונדעס

  • פֿאָרױסװײַז
  • טעקסט פֿאַרבtransform-type
  • שפּראַך

Chatterbox

Zero-shot שטימע־קלאָנירונג מיט פֿינן־גרײנעם עמאָציע־קאָנטראָל פֿון Resemble AI

  • עמאָציע קאָנטראָל
  • קלאָנירונג
  • קלײַב אַלץ אױסundo-type

CosyVoice 2

שפּראַך־אַרײַנגעפֿירטע שפּראַך־קלאָנינג איבער 8 שפּראַכן מיט נאַטירלעכער פּראָסאָדיע און סטרימינג־שטיצן

  • שפּראַכן
  • קלײַב אַלץ אױס
  • סטרימינג

פֿראַגעס און ענטפֿערס

שפּראַך־צו־שפּראַך (STS) AI טראַנספֿאָרמירט אַ געזאָגטע אודיו־אַרײַנשרײַבונג אין אַ אַנדערש שפּראַך־אַרײַנשרײַבונג — װײַל עס װײַזט די שפּראַך, סטיל, אױפֿפֿיר, אָדער שפּראַך בשעת עס װײַזט די אָריגינעלע ווערטער און צײַט. עס קאָמבינירט שפּראַך־אַרײַנשרײַבונג, באַהאַנדלונג, און סינטעז אין אַ איין פּאַפּיר.

טעקסט־צו־ספּראַך קאָווערט געשריבענע טעקסטן צו אַודיאָ. טעקסט־צו־ספּראַך נעמט אַן אױדיו־אינפֿאָרמאַציע און טראַנספֿאָרמירט עס גלייך צו אַ נײַעם אודיו־אינפֿאָרמאַציע — באַהאַלטן דעם נאַטירלעכן ריכטונג, פּאָזיציעס, אַרײַנשרײַבונגען, און אױפֿפֿירונגען פֿון דער אָריגינעלער אױפֿשריפֿט אַנשטאָט צו שאַפֿן שפּראַך פֿון אַ פּשוטן טעקסט.

װײַל די װײַס־רויט־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־פֿאָרװערטס־

שפּראַך־אַרײַנפֿיר־מאָדלן װי OpenVoice און RVC האַנדלען מיט שפּראַך־צו־שפּראַך־אַרײַנפֿיר. פֿאַר שפּראַך־צו־שפּראַך־אַרײַנפֿיר, קענען CosyVoice 2 און GPT-SoVITS קלאָנירן און איבער־סינטעזירן אין אַ אַנדערש שפּראַך. Chatterbox שטיצט אויך רעפֿערענץ־אויער־באזירטע סינטעזעס

יאָ. דורך ניצן שפּראַך־קלאָנינג־מאָדלן, קענט איר איבערזעצן אייער שפּראַך אין אַ אַנדערש שפּראַך בשעת איר באַהאַלטט אייער אייגענע שפּראַך־קעראַקטעריסטיקס. די קײן־טעכנאָלאָגיע אַרײַנשרײַבט אייער שפּראַך־אידענטיפֿיקאַציע און איבערזעצט דעם אודיו אין דער ציל־שפּראַך אָדער סטיל.

דער פּאַפּיר־אַרײַנשרײַבער שרײַבט אױס אײַער שפּראַך, איבערזעצט דעם טעקסט אין דער ציל־שפּראַך, און ניצט דערנאָך אַ שפּראַך־קלאָנינג צו איבערזעצן דעם איבערגעזעצטן טעקסט אין אייער מקור־שפּראַך. מאָדעלס װי CosyVoice 2 שטיצן 8 שפּראַכן פֿאַר איבערזעצונג צווישן שפּראַכן.

פֿאַר די בעסטער רעזולטאטן, אַרײַנשטעלן קלאָרע אוודיאָ־טעקעס מיט אַ קלענערן הינטערגרונט־רעש. WAV אָדער FLAC מיט 16kHz אָדער העכער אַרבעט בעסטער. MP3, OGG, M4A, און WEBM ווערן אויך צוגעלייגט. קלאָרע שפּראַך פּראָדוצירט די ריכטיקע טראַנספֿאָרמאַציעס

כּמעט־אמת־צײַט־פּראָצעסירונג איז בנימצא װײַזנדיק אױף אונזערע APIס און ניצנדיק שנעל־מאָדלן װי Kokoro פֿאַר סינטעז און Faster Whisper פֿאַר דערקענונג. די װײַטערהײט דעפּענדט אױף דעם מודל און די אודיו־לענג, אָבער אונטער־3־סעקונדע װײַזונגען זײַנען אױפֿצוהיטן פֿאַר קורצע אויסדרוקן.

יאָ. מאָדעלן װי Chatterbox, Spark TTS, און IndexTTS-2 שטיצן אױספֿיר־ און סטיל־קאָנטראָל. דו קענסט פֿאַרװאַנדלען אַ קלײנע שפּראַך אין אַ װײַטער־געפֿילטע, אַ שװערע אין אַ גלײַכע, אָדער אַ נײטרעלע אין אַ דראַמאַטיקע, בשעת דו האַלטסט די זעלבע ווערטער און די זעלבע שפּראַך־אידענטיקיטעט.

שפּראַך־צו־שפּראַך קאָמבינירט דערקענונג־ און סינטעז־קרעדיטס. אַ נאָרמאַלער 1־מינוטיקער איבערזעצונג ניצט 3־8 קרעדיטס לויט די סעלעקטירטע מאָדעלן. פֿרײַע־שטערן מאָדעלן װי קאָקאָראָ קענען ווערן גענוצט פֿאַרן סינטעז־שריט אָן קאָסטן

פֿרײַע ניצערס קענען באַהאַנדלען אוודיאָ ביז צו 1 מינוט. באַצאָלטע פּלאַנן שטיצן טעקעס ביז צו 10 מינוט. פֿאַר מער לענגדיקע אױפֿשרײַבונגען, צעטיילן דעם אוודיאָ אין סעגמאַנץ אָדער ניצן אונדזער API פֿאַר באַטש־באַהאַנדלונג אָן לענג־באַגרענעצונגען

יאָ, אַלע אַרײַנגעלאָפֿןע אודיו־טעקסטן װערן באַהאַנדלט אױף אונזערע זיכערע GPU־סערװירערס און אויטאָמאַטיש אויסגעלײגט אין 24 שעה. מיר ניצן קײן מאָל ניט אייער אודיו־טעקסט צו לערנען מאָדעלן. אַלע איבערװײַזונגען ניצן קאָדירטע פֿאַרבינדונגען און סערװירער־צו־סערװירער קאָמוניקאַציע איז אױטענטיפֿיצירט
5.0/5 (1)

טראַנספֿאָרמירן װעלכעװײניקע שפּראַך מיט AI

װײַז פֿאָרױסװײַז פֿון טעקע־נאָמען