VITS

Default

פֿרײַ ענגליש Neutral VITS

Default is a neutral AI voice powered by the VITS text-to-speech model. This פֿרײַער־הײב voice speaks ענגליש and delivers גוט-quality speech synthesis. מיט אַ גענערישקייט פֿון װײַטער־װײַטער און אַ קװאַליטעט־ראַנג פֿון 3/5, איז Default גוט פֿאַר general-purpose text-to-speech with natural prosody The VITS engine is developed by Jaehyeon Kim et al. under the MIT license, making it safe for commercial use. Key capabilities include: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

ניט קיין באַטרעף

VITSמאָדעל אינפֿאָרמאַציע

מאָדע VITS
אַנטוויקלער Jaehyeon Kim et al.
קװאַליטעט
גיכקייט פֿאָרױסװײַז
דערלויבעניש MIT
קלאָנירונג ניט בנימצא
פֿאָרױסװײַזundo-type פֿרײַ (ניט קיין קרעדיטס)
פּאַראַמעטערס 25M
ארכיטעקטורע VAE + Normalizing Flows + GAN
איבער־פֿאַרקער 585 שעה
יאָר 2021

בעסטער ניצן קאַסעס פֿאַר Default

רעקאָמענדירטע פּראָגראַמען באזירט אויף דעם שטימע

אוודיאָ־בוך און דערציילונג

Use Default to narrate long-form content with natural prosody and expression.

ווידעא־סטימיאַלירונג

אַרײַנשטעלן אַ פּראָפֿעסיאָנאַלע דערציילונג צו YouTube װידעאָן, װירעװײַזן און געזעלשאַפֿטלעכע אינהאַלטן

אַפּליקאַציעס

Fast generation makes this voice ideal for real-time apps, screen readers, and accessibility tools.

װײַז בילדל

שאַפֿן אינטערעסאַנטע לערנען מאַטעריאַלן, קורסן, און בילדונגקרייז אינהאַלט מיט קלאָרע AI דערציילונג

מער VITS שריפֿטן

אנדערע שפּראַכן פֿון דער זעלבער TTS מאָדעל

CSS10 (Dutch)

האָלענדיש Neutral

CSS10 (Finnish)

פיניש Neutral

CSS10 (French)

פֿראַנצייש Neutral

CSS10 (German)

דײַטש Neutral

CSS10 (Hungarian)

הונגאריש Neutral

CSS10 (Spanish)

שפּאַניש Neutral

פֿראַגעס און ענטפֿערס

VITS (װאַריאַציע־אינפֿירירונג מיט אַ קעגנצײַטיקן לערנען פֿאַר סוף־צו־סוף טעקסט־צו־ספּראַך) איז אַ פּאַראַלעל־סוף־צו־סוף TTS־מעכאַניזם װאָס גיט אַ נאַטירלעכער קלינגנדיקן אויטאָמאָביל ווי די הײַנטיקע צוויי־שטאַפּן מאָדעלן. עס װײַזט אַװעק װאַריאַציע־אינפֿירירונג פֿאַרגרעסערט מיט נאָרמאַליזירנדיקע פֿלאָסן און אַ קעגן־ספּראַך־לערונג־פּראָצעס, װאָס דערגרייכט אַ װײַטערדיקע פֿאַרבעסערן אין נאַטירלעכקייט.

VITS איז אַנטוויקלט געווארן דורך Jaehyeon Kim et al. און איז באפרייט אונטער די MIT ליסענס, וואס דערלויבט קאמערציעלע ניצן פון געגרינדעטע אודיו.

VITS שטיצט 4 שפּראַכן: ענגליש, שפּאַניש, יאַפּאַניש, קאָרעיִש.

VITS איז אין דער פֿרײַער מדרגה — פֿרײַ — ניט נייטיקן קיין קרעדיטס. איר קענט פֿרײַער זען װאָסער VITS שפּראַך אױף אױסצושטעלן אַ פֿולן אודיו

VITS האָט אַ זייער שנעלן שאַפֿונגס־ספּור. עס לײגט זיך אין אַ נאָענט־פֿאַרװײַל, װאָס גיט עס פּאַסיק פֿאַר סטרימינג־ און אינטעראקטיװע אַפּליקאַציעס

VITS איז 3/5 פֿאַר אוודיאָ־קוואַליטעט אויף TTS.ai. עס גיט אַ גוטע קוואַליטעט פֿון רעדן, פּאַסיק פֿאַר די אױפֿגערײַסן

ניט, VITS ניצט אַ פֿאָרמאַטירטע סעלעקציע פֿון אַרײַנגעבוירענע שפּראַכן. צו קלאָנירן שפּראַכן, פּרובירן מאָדעלס װי CosyVoice 2, GPT-SoVITS, אָדער Chatterbox

יָה, VITS איז אַװעקצונעמען פֿאַר אַלגעמיינע־צו־שפּראַך־טעקסט־צו־שפּראַך מיט נאַטירלעכע פּראָסאָדיע. זײַן סוף־צו־סוף־סינטעזעס, נאַטירלעכע פּראָסאָדיע, שנעלע אַרײַנפֿיר־קײט מאַכן עס אַ גוטן ברירה פֿאַר דעם ניצן־קאַס

יע, VITS איז לייסענסירט אונטער MIT, װאָס דערלױבט קעמפּעריאַלע ניצן. אודיו געגרינדעט מיט VITS שפּראַכן קען ווערן גענוצט אין װידעאָס, פּאָדקאַסטן, אַפּליקאַציעס, שפּילערײַן, און װאָסער װײַטער קעמפּעריאַלער פּראָיעקט אױף דער וועלט.

יע, אַלע שפּראַכן אויף TTS.ai ניצן קאַסטאַמייזד ליסענצירטע אָפֿן־קאָפּ־מאָדעלן (MIT, Apache 2.0). די געגרינדענע אודיו איז אייער צו ניצן אין װידעאָס, פּאָדקאַסטן, אַפּליקאַציעס, שפּילערײַן און אַנדערע קאַסטאַמייזד־פּראָגראַמען

שיקן אַ POST־פֿירער צו /api/v1/tts/ מיטן מאָדעל־נאָמען און שפּראַך־אידענטיפֿיצירער. זע אונדזער API דאָקומענטאַציע־בלאַט פֿאַר קאָד־פֿאָרעם אין Python, JavaScript, Go, און cURL

יָה, דריקט אױף דעם שפּיל־קנעפּל אױף דער װײַז צו הערן אַ פֿאַרשפּיל. איר קענט אויך שרײַבן אַ צוגעלייגטן טעקסט אױף דער טעקסט־צו־רעדנדיקער װײַז און אַװעקצושטעלן אַ פֿרײַן פֿאַרװײַז מיט אַװעקצושטעלן אַ פֿאָרױסװײַז מיט אַװעקצושטעלן אַ פֿאָרױסװײַז

דורכפֿאַל Default איצט

אַרײַנשרײַבן אַ טעקסט און הערן װי עס ווערט געשריבן Default. פֿרײַ צו ניצן װײַל קײן קרעדיטס זײַנען ניט נייטיק.