פֿרײַער AI טעקסט צו שפּראַך
33+ עפֿענען־קאָפּיע מאָדעל, 273+ שטימע 33+ שפּראַכן. קײן אַקאַונט איז ניט נייטיק
אַלץ װאָס דו האָסט נײן פֿאַר װאָך AI
30+ מכשירים אױפֿגעפֿירט דורך אױפֿגעפֿירטע AI מאָדעלן
33+ AI שפּראַך מאָדעלס
די גרעסטע זאַמלונג פֿון אָפֿן־קאָד TTS־מאָדלן אין איין פּלאַטפאָרמע
Kokoro פֿרײַ
קאָקאָראָ איז אַ 82 מיליאָן־פּאַראַמעטער־טעקסט־צו־ספּראַך־מאָדעל װאָס שטײט גוט איבער זײַן גרײס־קלאַס. אױף זײער קליין גרײס, פּראָדוצירט עס אַ מאָדנע נאַטירלעכע און אויסדריקלעכע שפּראַך. קאָקאָראָ שטיצט אַ סך שפּראַכן, אַרײַנגערעכנט ענגליש, יאַפּאַניש, סינייִש, און קאָרעיִש, מיט אַ סך אויסדריקלעכע שפּראַכן. עס לײענט אומעטום שנעל — עס פּראָדוצירט אודיו כּמעט 100קס שנעלער װי אין אמת־צײַט אױף אַ GPU.
בעסטער פֿאַר: העכער־קװאַליטעט TTS מיט קלענסטע װײַטערגײט, סטרימינג־פּראָגראַמען
פֿרײַער־פּראָבע
Piper פֿרײַ
פּאַפּער איז אַ לייכטע טעקסט־צו־ספּראַך־מאַשין אַנטוויקלט פֿון Rhasspy וואָס ניצט VITS און larynx ארכיטעקטורן. עס לײגט אַלץ אױף דער CPU, װאָס מײנט אַז עס איז פּאַסיק פֿאַר Edge מכשירים, היים אויטאָמאַטיזאַציע, און אַפּליקאַציעס װאָס דאַרפן אױסגעלאָשן TTS. מיט איבער 100 שפּראַכן איבער 30+ שפּראַכן, גיט פּאַפּער נאַטירלעך־קלינגנדיקע שפּראַך אין אמת־צײַט־ספּרעדז, אױף אַ Raspberry Pi 4 אויך.
בעסטער פֿאַר: שנעל־פֿאָרױסװײַז, צוגײכלעכקײט, און אַרײַנגעװײַזטע פּראָגראַמען
פֿרײַער־פּראָבע
VITS פֿרײַ
VITS (װאַריאַציע־אינפֿאָרמאַציע מיט אױפֿגאַבע־לײענען פֿאַר סוף־צו־סוף־טעקסט־צו־ספּראַך) איז אַ פּאַראַלעל סוף־צו־סוף TTS־מעכאַניזם װאָס שאַפֿט אַ נאַטירלעכער קלינגנדיקן אופֿן װי די הײַנטיקע צוויי־שטאַפּ־מאָדלן. עס נעמט אַװעק װאַריאַציע־אינפֿאָרמאַציע פֿאַרגרעסערט מיט נאָרמאַליזירנדיקע פֿלאָסן און אַ אױפֿגאַבע־לײענען־פּראָצעס, װאָס דערגרייכט אַ וויכטיקע פֿאַרבעסערן אין נאַטירלעכקייט.
בעסטער פֿאַר: אַלגעמיינע־ניטיקע טעקסט־צו־ספּראַך מיט נאַטירלעכער פּראָסאָדיע
פֿרײַער־פּראָבע
MeloTTS פֿרײַ
MeloTTS פֿון MyShell.ai איז אַ פֿאַרשײדענע שפּראַך TTS ביבליאָטעק װאָס שטיצט ענגליש (אַמעריקאַנער, בריטיש, אינדיע, אױסטראַליער), שפּאַניש, פֿראַנצויזיש, סינייִש, יאַפּאַניש, און קאָרעיִש. עס איז זייער שנעל, באַהאַנדלט דעם טעקסט מיט אַ היפּש אמת־צײַט־ספּרעאַד אויף דער קאָמפּיוטער אַליין. MeloTTS איז צוגעגרייט פֿאַר פּראָדוקציע־נוצן און שטיצט בײדע קאָמפּיוטער־ און גראַפיק־פּראָצעסאָר־אינפֿאָרמאַציע.
בעסטער פֿאַר: פּראָדוקציע־פּראָגראַמען װאָס דאַרפן אַ שנעלן, מער־שפּראַכיקן TTS
פֿרײַער־פּראָבע
Kani TTS 2 פֿרײַ
Kani-TTS-2 פֿון NineNineSix איז אַ װעלכע־לייכטע 400 מײַל פּאַראַמעטער מאָדעל, געגרינדעט אויף LiquidAI LFM2 בײַטבאָנע מיט Nvidia NanoCodec. עס לײגט זיך אין נאָר 3 גיגאבייט VRAM און דערגרייכט 10 סעקונדעס פֿון רעדן אין ~2 סעקונדעס (RTF 0.2). שטיצט ניט־צוגעפֿירטע שטימע־קלאָנינג װײַזנדיק די רעדאַקטאָר־אַרײַנשרײַבונגען.
בעסטער פֿאַר: שנעלער אַרײַנשרײַב, װײַטער־פֿאַרבינדונג, שנעלער פֿאָרױסװײַז
פֿרײַער־פּראָבע
OuteTTS פֿרײַ
OuteTTS פֿאַרגרעסערט גרויסע שפּראַך־מאָדלן מיט טעקסט־צו־ספּראַך־קײט בשעת עס װעט באַהאַלטן די אויטאָמאַטישע ארכיטעקטור. עס שטיצט אַ סך הינטער־פֿאַרבינדונגען אַרײַנגערעכנט llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, און אױף אַ בראַוזער־אינפֿיראַציע װי Transformers.js. עס האָט אַ נוליקע־שאָט־סטימיק־קלאָנינג װײַטער די רעדאַקטאָר־פּראָפֿעליעס, אױסגעהאַלטן װי JSON.
בעסטער פֿאַר: Edge װײַזונג, בלעטערער־באזירטע TTS, װײַזונג אין װײַזונג־װירוס־פֿאַרבינדונגען
פֿרײַער־פּראָבע
Pocket TTS פֿרײַ
פּאָקע־טץ פֿון קיוטאַי (דער מחבר פֿון מושי) איז אַ קאָמפּאַקטער 100 מײַל פּאַראַמעטער־טעקסט־צו־ספּראַך־מאָדל װאָס װײַזט זיך גוט איבער זײַן וואָג. עס לײגט זיך עפעקטיוו אױף דער מעגלעכקייט, שטיצט אַ ניט־צוגעפֿאַלענע שפּראַך־קלאָנירונג פֿון אַ איין אודיו־פֿאָרעם, און פּראָדוצירט נאַטירלעך־קלינגנדיקע שפּראַך. די קליין מאָדעל גרײס װײַזט זיך גוט פֿאַר װײַטער־פֿאַרבינדונגען און װײַטער־פֿאַרבינדונגען
בעסטער פֿאַר: קלאָרע װײַזונג, CPU-אײנציק אומבאַקאַנטײטן, שנעל־סטימעלע קלאָנירונג
פֿרײַער־פּראָבע
Kitten TTS פֿרײַ
Kitten TTS פֿון KittenML איז אַ װײַטער־לייכטע טעקסט־צו־ספּראַך מאָדעל, געגרינדעט אויף ONNX. מיט װאַריאַנטן פֿון 15 מײַל צו 80 מײַל פּאַראַמעטערס (25-80 מײַל אויף דיסק), גיט עס אַ האַרט־קוואַליטעט שפּראַך־סײַנטעז אויף CPU אָן אַ GPU. עס האָט 8 אַרײַנגעבוירענע שפּראַכן, אַ צופּאַסן שפּראַך־ספּרינג, און אַ אַרײַנגעבוירענע טעקסט־פֿאָר־פּראָסעסינג פֿאַר נומערן, געלט און יחידן. ידעאַל פֿאַר אַרײַנפֿירן אין װײַטקייט און פֿאַר נידעריק־לאַטענסי־פּראָגראַמען.
בעסטער פֿאַר: שנעל־לייכטע TTS, װײַס־װײַס־פֿאַרבינדונג, װײַס־װײַס־פּראָגראַמען
פֿרײַער־פּראָבע
Ming-Omni TTS פֿרײַ
מינג־אָמני־טץ־0.5ב פֿון אינקלודיאָן־אַלי איז אַ קאָמפּאַקטער אָני־מאָדאַלער שפּראַך־מאָדל, געגרינדעט אויף דעם BailingMM־דיזאַזישן הינטערגרונט מיט אַ פּאַפּק־דורך־פּאַפּק־פֿלאָוס־באַהאַלטנדיקן אודיו־דיקאָדער. עס גיט אַ 44.1 קהז־אַרײַנשרײַב (נײַגעגאנגען צו אַ CD־קוואַליטעט), שטיצט אַ נול־שטופּ־שפּראַך־קלאָנינג פֿון אַ 3+ סעקונדעס רעפֿערענץ, און אַנטהאַלט אַ אַרײַנגעבוירענע ימאָוציע/דיאַלעקט/BGM־קאָנטראָול װי אַ JSON־אינפֿאָרמאַציע. אַ גוטער סטאַביליטעט — 0.83% WER אויף צײַטשישע באַנקמאַרקס.
בעסטער פֿאַר: הויך־פֿאַרפֿאָלגונג צוויי־שפּראַכיקער דערציילונג, עמאָציאָנעל־קאָנטראָלירטע שפּראַך־אַקטירונג, כינעזישע אוודיאָ־בוך אינהאַלט
פֿרײַער־פּראָבע
MOSS-TTS Nano פֿרײַ
MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.
בעסטער פֿאַר: Free-tier TTS, high-volume production, low-latency interactive use
פֿרײַער־פּראָבע
Bark סטנדרט
טראַנספֿאָרמירונג־באזירטע טעקסט־צו־אויער מאָדעל װאָס װײַזט רעאַליסטישע שפּראַך, מוזיק און קלאַנג־עפֿעקטן
אַנטוויקלער: Suno · דערלויבעניש: MIT
פֿאָרשלאָגן
Bark Small סטנדרט
קלענערע װערסיע פֿון Bark מיט שנעלערע אַרײַנשרײַבונג און קלענערער זכּרון־נוץ
אַנטוויקלער: Suno · דערלויבעניש: MIT
פֿאָרשלאָגן
CosyVoice 2 סטנדרט
דער אינטערנעץ איז אַ ווייכווארג־פּראָגראַם וואָס גיט אינטערנעט־צוטריט צו מענטשן און אָרגאַניזאַציעס.
אַנטוויקלער: Alibaba (Tongyi Lab) · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
Dia TTS סטנדרט
װיפֿל־רעדנדיקער־דיאַלאָג־גרענעצירונג־מאָדעל װאָס שאַפֿט נאַטירלעכע שמועסן צװישן רעדנדיקע
אַנטוויקלער: Nari Labs · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
Parler TTS סטנדרט
באַשרײַב די שטימע װאָס דו װילסט אין נאַטירלעכער שפּראַך און Parler װעט אױסגײן מיט אײן שפּראַך
אַנטוויקלער: Hugging Face · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
IndexTTS-2 סטנדרט
ער האָט געשריבן אַ בוך מיטן נאָמען „די מלחמה און דער שלום‟.
אַנטוויקלער: Index Team · דערלויבעניש: Bilibili Model License
פֿאָרשלאָגן
Spark TTS סטנדרט
שפּראַך־קלאָנינג TTS מיט קאָנטראָלירbare עמאָציעס און שפּראַך־סטייל װײַזנדיק אױף פֿראַגעס
אַנטוויקלער: SparkAudio · דערלויבעניש: CC BY-NC-SA 4.0
פֿאָרשלאָגן
GPT-SoVITS סטנדרט
אַ פּאָר־שטיקלעך שטימע־קלאָנינג TTS װאָס רעפּליקטירט אַ שטימע פֿון נאָר 5 סעקונדעס אוודיאָ
אַנטוויקלער: RVC-Boss · דערלויבעניש: MIT
פֿאָרשלאָגן
Orpheus סטנדרט
100,000 יאָר צוריק האָט מען דערגרייכט אַ מדרגה פון אַנטוויקלונג אין דער געשיכטע פון דער מענטשהייט.
אַנטוויקלער: Canopy Labs · דערלויבעניש: Llama 3.2 Community
פֿאָרשלאָגן
Qwen3 TTS סטנדרט
Alibaba'ס װיפֿל־שפּראַכיקער TTS מיט שפּראַך־קלאָנינג, פֿאַרזיכערטע שפּראַכן, און שפּראַך־דיזיין פֿון טעקסט
אַנטוויקלער: Alibaba (Qwen) · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
VieNeu-TTS-v2 סטנדרט
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
אַנטוויקלער: Phạm Nguyễn Ngọc Bảo · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
Chatterbox Turbo סטנדרט
שנעלערע צײַט־פֿאַרבינדונג מיט אונטער־200 מיסעלעטענץ און װײַטער־שפּראַכלעכע טאַגס פֿאַר לײַכעס, קאָפּשווינדל, און מער
אַנטוויקלער: Resemble AI · דערלויבעניש: MIT
פֿאָרשלאָגן
VoxCPM סטנדרט
441 איז אַ פערזענלעכע טעלעפאָן־קאָדירונגס־נאָמען, וואָס קומט פֿון די 441 סטעיטס פון אַמעריקע.
אַנטוויקלער: OpenBMB · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
VibeVoice סטנדרט
די גאנצע סדרה איז 90 מינוט לאַנג און איז באזירט אויף די 100 טעג פון די חורבן.
אַנטוויקלער: Microsoft · דערלויבעניש: MIT
פֿאָרשלאָגן
CosyVoice3 סטנדרט
ווייַטער־גענירונגס־פֿאַרשפּראַכיקער TTS מיט בי־סטרימינג, עמאָציע־קאָנטראָל, און נול־שאָט־סטימע־קלאָנינג
אַנטוויקלער: Alibaba (FunAudioLLM) · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
NAMAA Saudi TTS סטנדרט
דער ערשטער עפֿענעם סודאַן־אַראַביש TTS. משפּחה־סודאַן־דיאַלעקט מיט צײַטצײכן־קוואַליטעט־סטימיק־קלאָנינג
אַנטוויקלער: NAMAA Space · דערלויבעניש: MIT
פֿאָרשלאָגן
Darwin TTS סטנדרט
די װירוס איז געװען געװען געװען אױף די װירוס־פֿאָרמע װי אַ װירוס־פֿאָרמע פֿון װירוס־קאָד 1.0.
אַנטוויקלער: FINAL-Bench · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
MOSS-TTSD סטנדרט
די טעלעוויזיע־פּראָגראַם איז געווען אַ טעלעוויזיע־פּראָגראַם מיט אַ שעה משך און 50 מינוט משך.
אַנטוויקלער: OpenMOSS · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
CosyVoice 2
דער אינטערנעץ איז אַ ווייכווארג־פּראָגראַם וואָס גיט אינטערנעט־צוטריט צו מענטשן און אָרגאַניזאַציעס.
שפּראַכן: en, zh, ja, ko, fr, de, it, es
קלײַב אַלץ אױס
IndexTTS-2
ער האָט געשריבן אַ בוך מיטן נאָמען „די מלחמה און דער שלום‟.
שפּראַכן: en, zh
קלײַב אַלץ אױס
Spark TTS
שפּראַך־קלאָנינג TTS מיט קאָנטראָלירbare עמאָציעס און שפּראַך־סטייל װײַזנדיק אױף פֿראַגעס
שפּראַכן: en, zh
קלײַב אַלץ אױס
GPT-SoVITS
אַ פּאָר־שטיקלעך שטימע־קלאָנינג TTS װאָס רעפּליקטירט אַ שטימע פֿון נאָר 5 סעקונדעס אוודיאָ
שפּראַכן: en, zh, ja, ko
קלײַב אַלץ אױס
Chatterbox
אױף דער װעלט־פֿאַרבאַנד־רשימה פֿונעם װעלט־פֿאַרבאַנד װעלט־רשימה פֿונעם װעלטפֿאַרבאַנד
שפּראַכן: en
קלײַב אַלץ אױס
Tortoise TTS
װיפֿל־שפּראַך־טעקסט־צו־שפּראַך פֿאָקוסירט זיך אױף קװאַליטעט מיט אַ אויטאָרעגרעסיװער אױספֿיר.
שפּראַכן: en
קלײַב אַלץ אױס
OpenVoice
שפּראַך־קלאָנירונג מיט גראַניאַלער קאָנטראָל איבער סטיל, עמאָציע, און אַרײַנשרײַב
שפּראַכן: en, zh, ja, ko, fr, es
קלײַב אַלץ אױס
VieNeu-TTS-v2
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
שפּראַכן: vi, en
קלײַב אַלץ אױס
Chatterbox Turbo
שנעלערע צײַט־פֿאַרבינדונג מיט אונטער־200 מיסעלעטענץ און װײַטער־שפּראַכלעכע טאַגס פֿאַר לײַכעס, קאָפּשווינדל, און מער
שפּראַכן: en
קלײַב אַלץ אױס
VoxCPM
441 איז אַ פערזענלעכע טעלעפאָן־קאָדירונגס־נאָמען, וואָס קומט פֿון די 441 סטעיטס פון אַמעריקע.
שפּראַכן: en, zh
קלײַב אַלץ אױס
OuteTTS
LLM-באזירט TTS װאָס לײגט אױף CPU, GPU, אָדער בלעטערער װידער llama.cpp און Transformers.js
שפּראַכן: en
קלײַב אַלץ אױס
Pocket TTS
קלאָרע 100 מײַל פּאַראַמעטער מאָדעל פֿון Kyutai מיט שפּראַך־קלאָנינג פֿון אַ איין אַרײַנפֿיר
שפּראַכן: en, fr
קלײַב אַלץ אױס
CosyVoice3
ווייַטער־גענירונגס־פֿאַרשפּראַכיקער TTS מיט בי־סטרימינג, עמאָציע־קאָנטראָל, און נול־שאָט־סטימע־קלאָנינג
שפּראַכן: en, zh, ja, ko, de, es, fr, it, ru
קלײַב אַלץ אױס
NAMAA Saudi TTS
דער ערשטער עפֿענעם סודאַן־אַראַביש TTS. משפּחה־סודאַן־דיאַלעקט מיט צײַטצײכן־קוואַליטעט־סטימיק־קלאָנינג
שפּראַכן: ar
קלײַב אַלץ אױס
Darwin TTS
די װירוס איז געװען געװען געװען אױף די װירוס־פֿאָרמע װי אַ װירוס־פֿאָרמע פֿון װירוס־קאָד 1.0.
שפּראַכן: en, ko, ja, zh
קלײַב אַלץ אױס
MOSS-TTSD
די טעלעוויזיע־פּראָגראַם איז געווען אַ טעלעוויזיע־פּראָגראַם מיט אַ שעה משך און 50 מינוט משך.
שפּראַכן: en, zh
קלײַב אַלץ אױס
Ming-Omni TTS
די ערד־מאַכט־צענטער איז אַ 1.5-הונדערט מעטער הויך, 400-קוואַדראַט-פֿאַרמאַכט שטאָטיש שטאָט־קראָם.
שפּראַכן: en, zh
קלײַב אַלץ אױס
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.
שפּראַכן: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
קלײַב אַלץ אױסאױפֿפֿירער־פֿירער API
OpenAI-פֿאַרבינדענע REST API. איין סוף־פּונקט, 22+ מאָדעלן. סטרימינג שטיצן פֿאַר אמת־צײַט־פּראָגראַמען
- OpenAI־פֿאַרבײַטלעכע פֿאָרמאַטירונג
- סטרימינג TTS פֿאַר אמת־צײַט אַפּליקאַציעס
- קלײַב אַלץ אױס
- Webhook באַװעגונגען
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
פּשוטע, טראַנספּעראַנטע צאָלונג
אָנהײב פֿרײַ. װי דו גרײסט, װײַל דו גרײסט
פֿרײַ
15,000 שריפֿטצײכן + 5,000/טאָג
- 7 פרייע מאָדעלן אַרײַנגערעכנט קאָקאָראָ
- 5,000 שריפֿטצײכן אױף אײן װײַז
- API צוטריט אַרייַנגערעכנט
אָנהײב
500 קרעדיטס/חודש
- אַלע 22+ מאָדעלס
- 100,000 שריפֿטצײכן אױף אײן װערטשע
- שריפֿט גרײס
פּראָפֿעסיאָנאַל
2,000 קרעדיטס/חודש
- אַלץ אין אָנהײב
- API צוטריט
- פּרעפֿערענצן באַהאַנדלונג
פֿראַגעס און ענטפֿערס
וואָס קען מען פֿאַרבעסערן? דיין אָפּרוף העלפֿט אונדז צו פֿאַרריכטן פּראָבלעמען
אָנהײב צו ניצן AI Voice הײַנט
אַרײַנשרײַבן שאַפֿער, אַנטוויקלער און געשעפטן ניצן TTS.ai