VITS

Baker (Chinese)

פֿרײַ שפּאַניש Neutral VITS

Baker (Chinese) is a neutral AI voice powered by the VITS text-to-speech model. This פֿרײַער־הײב voice speaks שפּאַניש and delivers גוט-quality speech synthesis. מיט אַ גענערישקייט פֿון װײַטער־װײַטער און אַ קװאַליטעט־ראַנג פֿון 3/5, איז Baker (Chinese) גוט פֿאַר general-purpose text-to-speech with natural prosody די {מאָדל}־אינזין איז אױפֿגעבויט װײַט פֿון {אויפֿפֿירער}{ליסענס}, װאָס מאַכט זי זיכער פֿאַר קעמפּערישע ניצן. די עיקר־כּללים אַרײַננעמען: {פֿעיִקייטן}.

ניט קיין באַטרעף

VITSמאָדעל אינפֿאָרמאַציע

מאָדע VITS
אַנטוויקלער Jaehyeon Kim et al.
קװאַליטעט
גיכקייט פֿאָרױסװײַז
דערלויבעניש MIT
קלאָנירונג ניט בנימצא
פֿאָרױסװײַזundo-type פֿרײַ (ניט קיין קרעדיטס)
פּאַראַמעטערס 25M
ארכיטעקטורע VAE + Normalizing Flows + GAN
איבער־פֿאַרקער 585 שעה
יאָר 2021

בעסטער ניצן קאַסעס פֿאַר Baker (Chinese)

רעקאָמענדירטע פּראָגראַמען באזירט אויף דעם שטימע

אוודיאָ־בוך און דערציילונג

ניצן {נאָמען} צו דערציילן אַ לאַנגן אינהאַלט מיט נאַטירלעכע פּראָסאָדיע און אויסדרוק

ווידעא־סטימיאַלירונג

אַרײַנשטעלן אַ פּראָפֿעסיאָנאַלע דערציילונג צו YouTube װידעאָן, װירעװײַזן און געזעלשאַפֿטלעכע אינהאַלטן

אַפּליקאַציעס

Fast generation makes this voice ideal for real-time apps, screen readers, and accessibility tools.

װײַז בילדל

שאַפֿן אינטערעסאַנטע לערנען מאַטעריאַלן, קורסן, און בילדונגקרייז אינהאַלט מיט קלאָרע AI דערציילונג

מער VITS שריפֿטן

אנדערע שפּראַכן פֿון דער זעלבער TTS מאָדעל

Default

ענגליש Neutral

פֿראַגעס און ענטפֿערס

VITS (װאַריאַציע־אינפֿירירונג מיט אַ קעגנצײַטיקן לערנען פֿאַר סוף־צו־סוף טעקסט־צו־ספּראַך) איז אַ פּאַראַלעל־סוף־צו־סוף TTS־מעכאַניזם װאָס גיט אַ נאַטירלעכער קלינגנדיקן אויטאָמאָביל ווי די הײַנטיקע צוויי־שטאַפּן מאָדעלן. עס װײַזט אַװעק װאַריאַציע־אינפֿירירונג פֿאַרגרעסערט מיט נאָרמאַליזירנדיקע פֿלאָסן און אַ קעגן־ספּראַך־לערונג־פּראָצעס, װאָס דערגרייכט אַ װײַטערדיקע פֿאַרבעסערן אין נאַטירלעכקייט.

VITS איז אַנטוויקלט געווארן דורך Jaehyeon Kim et al. און איז באפרייט אונטער די MIT ליסענס, וואס דערלויבט קאמערציעלע ניצן פון געגרינדעטע אודיו.

VITS שטיצט 4 שפּראַכן: ענגליש, שפּאַניש, יאַפּאַניש, קאָרעיִש.

VITS איז אין דער פֿרײַער מדרגה — פֿרײַ — ניט נייטיקן קיין קרעדיטס. איר קענט פֿרײַער זען װאָסער VITS שפּראַך אױף אױסצושטעלן אַ פֿולן אודיו

VITS האָט אַ זייער שנעלן שאַפֿונגס־ספּור. עס לײגט זיך אין אַ נאָענט־פֿאַרװײַל, װאָס גיט עס פּאַסיק פֿאַר סטרימינג־ און אינטעראקטיװע אַפּליקאַציעס

VITS איז 3/5 פֿאַר אוודיאָ־קוואַליטעט אויף TTS.ai. עס גיט אַ גוטע קוואַליטעט פֿון רעדן, פּאַסיק פֿאַר די אױפֿגערײַסן

ניט, VITS ניצט אַ פֿאָרמאַטירטע סעלעקציע פֿון אַרײַנגעבוירענע שפּראַכן. צו קלאָנירן שפּראַכן, פּרובירן מאָדעלס װי CosyVoice 2, GPT-SoVITS, אָדער Chatterbox

יָה, VITS איז אַװעקצונעמען פֿאַר אַלגעמיינע־צו־שפּראַך־טעקסט־צו־שפּראַך מיט נאַטירלעכע פּראָסאָדיע. זײַן סוף־צו־סוף־סינטעזעס, נאַטירלעכע פּראָסאָדיע, שנעלע אַרײַנפֿיר־קײט מאַכן עס אַ גוטן ברירה פֿאַר דעם ניצן־קאַס

יע, VITS איז לייסענסירט אונטער MIT, װאָס דערלױבט קעמפּעריאַלע ניצן. אודיו געגרינדעט מיט VITS שפּראַכן קען ווערן גענוצט אין װידעאָס, פּאָדקאַסטן, אַפּליקאַציעס, שפּילערײַן, און װאָסער װײַטער קעמפּעריאַלער פּראָיעקט אױף דער וועלט.

יע, אַלע שפּראַכן אויף TTS.ai ניצן קאַסטאַמייזד ליסענצירטע אָפֿן־קאָפּ־מאָדעלן (MIT, Apache 2.0). די געגרינדענע אודיו איז אייער צו ניצן אין װידעאָס, פּאָדקאַסטן, אַפּליקאַציעס, שפּילערײַן און אַנדערע קאַסטאַמייזד־פּראָגראַמען

שיקן אַ POST־פֿירער צו /api/v1/tts/ מיטן מאָדעל־נאָמען און שפּראַך־אידענטיפֿיצירער. זע אונדזער API דאָקומענטאַציע־בלאַט פֿאַר קאָד־פֿאָרעם אין Python, JavaScript, Go, און cURL

יָה, דריקט אױף דעם שפּיל־קנעפּל אױף דער װײַז צו הערן אַ פֿאַרשפּיל. איר קענט אויך שרײַבן אַ צוגעלייגטן טעקסט אױף דער טעקסט־צו־רעדנדיקער װײַז און אַװעקצושטעלן אַ פֿרײַן פֿאַרװײַז מיט אַװעקצושטעלן אַ פֿאָרױסװײַז מיט אַװעקצושטעלן אַ פֿאָרױסװײַז

דורכפֿאַל Baker (Chinese) איצט

אַרײַנשרײַבן אַ טעקסט און הערן װי עס ווערט געשריבן Baker (Chinese). פֿרײַ צו ניצן װײַל קײן קרעדיטס זײַנען ניט נייטיק.