טעקסט צו שפּראַך מיט אימאָטיאָנס
שאַפֿן שפּראַך מיט אַ אמתן עמאָציאָנעלן אויסדרוק — צופֿרידן, שעמעוודיק, אָרעם, אינטערעסירט, פֿײַסנדיק, און מער. אונדזערע AI־מאָדלן זײַנען מער װי אַ פּשוטע דערציילונג צו שאַפֿן שפּראַך װאָס װײַזט אַ אמתן געװײנטלעכקײט. פּאַסיק פֿאַר דערציילונג, גאַמעס־דיאַלאָג, פֿאַרקויף־אינפֿאָרמאַציע, און װעלכעװײניקער פּראָיעקט װוּ דער טון איז װיפֿל מער װי ווערטער.
פֿאָרשלאָגן איצט
עמאָציאָנעלע TTS־פֿעיִקייטן
AI שפּראַכן װאָס װײַזן אױס אמתע עמאָציעס און שײנונגען
אױסגלײַכונגStock label
שאַפֿן שפּראַך מיט פֿאַרשיידענע עמאָציאָנעלע טאָנען — צופֿרידן, שװער, װאָסער, שױן, איבערגעפֿאַלן, װאָסער, און ניטרעלע. יעדער עמאָציע װײַזט אױס אײנע פֿון די װירוסן.
אינטענסיװיטעט קאָנטראָל
קלײַב אױס װיפֿל װיפֿל װיפֿל װיפֿל װיפֿל װיפֿל
נאַטירלעכע פּראָסאָדיע
װיפֿל װײס איך?
פֿײַסערן און שרײַען
איבער סטענדאַרדיגע ימאָוציעס, שאַפֿן װײַסערטע שפּראַך פֿאַר אינטימע אױב ASMR אינהאַלט, און אױסגעפֿירטע שפּראַך פֿאַר דראַמאַטיקע מאָמענטן און דערקלערונגען.
טעקסט פֿאַרבundo-type
װיפֿל װײס איך?
קלײַב אַלץ אױסundo-type
טעקסט פֿאַרבtext-tool-action
שריפֿטצײכן
מאָדעלס װאָס װײַזן אױף אױס אױספֿירונגען און אױסדרוקן
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
בעסטער פֿאַר: דער בעסטער אױספֿיר־קאָנטראָל — צופּאַסנדיקע אױספֿיר־אינטענסיטעט מיט שפּראַך־קלאָנינג
דורכפֿאַל Chatterbox
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
בעסטער פֿאַר: נאַטירלעך לײַכט, װײַנט, װײנט, און ניט־ווערבלעכע עמאָציאָנעלע קלײַבן
דורכפֿאַל Bark
Orpheus
Standard
Human-level emotional TTS model trained on 100K hours of speech data.
בעסטער פֿאַר: אױסגעלערנטע 100,000 שעה אױסדרוקנדיקער שפּראַך
דורכפֿאַל Orpheus
Dia TTS
Standard
Multi-speaker dialog generation model that creates natural conversations between speakers.
בעסטער פֿאַר: עמאָציאָנעלער דיאַלאָקט צװישן שריפֿטצײכן מיט נאַטירלעכע װײַזונג
דורכפֿאַל Dia TTS
Parler TTS
Standard
Describe the voice you want in natural language and Parler generates matching speech.
בעסטער פֿאַר: באַשרײַב די עמאָציאָנעלע אַרײַנשרײַבונג אין קלאָרע ענגליש פֿאַר אינטואַטיווע קאָנטראָל
דורכפֿאַל Parler TTS
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
בעסטער פֿאַר: פֿינע־גרינעד עמאָציע קאָנטראָל מיט סטרימינג פֿאַר אמת־צײַט־פּראָגראַמען
דורכפֿאַל CosyVoice 2װי צו שאַפֿן אַן עמאָציאָנעלע שפּראַך
אַרײַנשרײַבן אַן עמאָציע אין AI שפּראַך אין סעקונדעס
שריפֿט דיין טעקסט
אַרײַנשרײַבן דעם טעקסט װאָס איר װילט אױסשרײַבן אױף אַן אײגנאַרטיקן אופֿן. דער אינהאַלט אַליין קען אױסשרײַבן אײגענע אײגנאַרטיקע אופֿן — אױפֿשרײַבונגען, פֿראַגעס און דראַמאַטיקע טעקסטן װײַזן אױס אַ נאַטירלעכן אופֿן.
קלײַב אַלץ אױסundo-type
קלײַב אױס צװישן גלײַך, שװער, װאָסער, שױן, אױפֿגעפֿילט, פֿײַסנדיק אױף אױף אױף אױף אױף אױף אױף אױף אױף אױף אױף
קלײַב אַלץ אױסundo-type
קלײַב אַלץ אױסselect-action
קלײַב אַלץ אױסundo-type
שאַפֿן שפּראַך און הערן. צופּאַסן דער אױספֿיר־סאָרט, אינטענסיװיטעט אָדער מאָדעל ביז די איבערצײַגונג פּאַסט צו דיין װיזיע. אַרײַנשטעלן דעם לעצטן אודיו אין MP3 אָדער WAV
עמאָציאָנעלע TTS מאָדעל קאַפּיביליטעטן
װי פֿאַרשײדענע מאָדעלן באַהאַנדלען עמאָציאָנעלע אויסדרוקן
Bark — אױסגעפֿירטע און קלאַנג־עפֿעקטן
װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל װײַל
- לײענען: \
- װײַטער
- איבערראַשן: \
- זינגען: מוזיקאַלישע טונען און מעלאָדיעס
Orpheus — עמאָציאָנעלע הענטלעך
Orpheus (גרינדעט אױף Llama 3.2) שטיצט אויסדרוקלעכע עמאָציע־קאָנטראָל אױף הענטלעך. װײַז דעם טעקסט אין עמאָציע־מאַרקערס צו קאָנטראָלירן די איבערצײַגונג: <צײַטיק>, <צײַטיק>, <זײַטיק>, <צופֿרידן>, <אומלעגלעך>. צעמישע עמאָציעס אױף איין גענעראַציע פֿאַר אַ דינאַמישן, װײַזנדיקן טון.
פֿאַר אַ פֿרײַנדלעכן, אָפּגעהיטן איבערצײַגונג פֿאַר אַ מײַלאַנאָלישן, שװערן טון - <אַרײַנגעפֿאַלן> פֿאַר אַ שטאַרקן, אינטענסיװן שפּראַך
פֿאַר שאָקירטע, פֿאַרשטאַנען רעאַקציעס
דיאַלאָג־פֿענצטער
דיאַ ספּעציאַליזירט זיך אין שמועס־שפּראַך מיט צוויי רעדאַקטאָרן. עס האַנדלט זיך נאַטירלעך מיט װײַז־אַרײַנפֿירן, אונטערשטעצן, און די עמאָציאָנעלע דינאַמיק פֿון אמתע שמועסן. גוט צו שאַפֿן שמועס־סצענעס, אינטערװיוען, אָדער פּאָדקאַסט־סטייל אינהאַלט װוּ עמאָציאָנעלע ינטערפּריטאַציע איז וויכטיק.
- נאַטירלעכע שמועס־דינאַמיק
- צװײ־לײענער־דיאַלאָג מיט פֿאַרשײדענע שפּראַכן
- עמאָציאָנעלע רעאַקציעס צװישן די רעדנדיקע
- ניט־ווערבלעכע לײדיקן (לײענען, װײַטן)
Sesame CSM — שמועס־קאָנטעקסט
Sesame CSM (Conversational Speech Model) איז דיזיינד צו פּראָדוצירן שפּראַך װאָס קלינגט װי אַ נאַטירלעכער שפּראַך, ניט לײענען װי אַ שפּראַך. עס באַהאַנדלט די קלאָרע עמאָציאָנעלע סימנים פֿון אמתער שפּראַך — פּאָזיציעס פֿאַר געדאַנקען, אײַנשרײַב־װאָרן, װײַטערדיקע אינטאָנאציע פֿאַר פֿראַגעס, און װאַרמײט אין פֿרײַנדלעכע קאָנטעקסטן.
- קאָנטעקסט־פֿאַרזיכערטע עמאָציאָנעלע איבערצײַגונג
- נאַטירלעכער שמועס־ריטם
- קלײַב אַלץ אױסselect-criterion
- פֿאָרױסװײַזundo-type
װען אױספֿיר איז וויכטיק
ניצן קאַסעס וווּ עמאָציאָנעל TTS גיט אַ אמתן חילוק
שפּיל־דיאַלאָג
אַ NPC װאָס הערט זיך אױס װי אַ אמתער װײַבער, אַ װײַבער מיט אַ אמתער סכּנה, אַ װײַבער מיט אַ האַרצן. אױב מען ניצט אַן עמאָציאָנעלער TTS, זײַנען די שריפֿטצײכן פֿון דעם שפּיל גלײַכגילטיק און אַרײַנגעפֿאַלן.
אַודיאָ־בוך איבערזעצונג
אַ דערציילער װאָס פֿלײשט אױף װען ס׳איז װײַט, שרײַט אױף װען ס׳איז װײַט, און רעדט קלײַבלעך אױף װען ס׳איז װײַט.
פֿאַרקויף און אַדרעסן
אױסגעפֿירטע שפּראַכן פֿאַר פּראָדוקט־לאַנגינגס, האַרטע שפּראַכן פֿאַר איבערזעצונגען, װידערשטענדלעכע שפּראַכן פֿאַר באַגרענעצטע צײַט־פֿאַרבינדונגען. די רעכטע אױסגעפֿירטע שפּראַכן װײַזן אינטערעס און װײַזן איבערזעצונגען.
עמאָציאָנעל שפּראַך דורך API
שאַפֿן שפּראַך מיט אַן אױסגעפֿירטע עמאָציע־קאָנטראָל
import requests
# Bark supports inline emotion cues
emotions = {
"happy": "This is absolutely wonderful! [laughs] I love it!",
"sad": "[sighs] I wish things could have been different...",
"angry": "I told you not to do that! This is unacceptable!",
"whisper": "[whispers] Can you keep a secret?",
"excited": "Oh my gosh! [gasps] We won! We actually won!"
}
for emotion, text in emotions.items():
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": text,
"model": "bark",
"voice": "v2/en_speaker_6",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open(f"emotion_{emotion}.wav", "wb") as f:
f.write(response.content)
טעקסט פֿאַרבtransform-type
אַפֿילו פרייע מאָדעלס ווי קאָקאָראָ ברענגען נאַטירלעך עמאָציאָנעל ניואַנס פון שריפֿטצײכן און קאָנטעקסט.
פֿאָרױסװײַזundo-type
$0
50 קרעדיטס אױף אַרײַנשרײַב
- קאָקאָראָ קאַנטעקסט־באַוווּסטע עמאָציע
- נאַטירלעכע פּראָסאָדיע פֿון שריפֿטצײכן
- פֿראַגע־ און אויסרוף־זײַטל באַהאַנדלונג
אָנהײב
$9
500 קרעדיטס/חודש
- בלײַבן מיט קלײַב־עפֿעקטן און לײענען
- Orpheus סטימיאַלישן הענטלעך
- ניט קיין שמועס־עמאָציע
פּראָפֿעסיאָנאַל
$29
2000 קרעדיטס/חודש
- Sesame CSM שמועס
- טעקסט פֿאַרבtransform-type
- שפּראַך־קלאָנינג מיט עמאָציע
פֿראַגעס און ענטפֿערס
אַלגעמיינע פֿראַגעס װעגן עמאָציאָנעלע טעקסט־צו־רעד
װײַז אײַער AI־סטימע אױף אַ אמתן אופֿן
גלײַך, שװער, װאָסער, פֿײַסנדיק — שאַפֿן שפּראַך װאָס װײַזט אױף אַ געװײנטלעכער געװײנטלעכקײט. פּרובירן אױסגעװײנטלעכע TTS־מאָדלן פֿרײַ.