פֿרײַער AI טעקסט צו שפּראַך
31+ עפֿענען־קאָפּיע מאָדעל, 231+ שטימע 34+ שפּראַכן. קײן אַקאַונט איז ניט נייטיק
אַלץ װאָס דו האָסט נײן פֿאַר װאָך AI
30+ מכשירים אױפֿגעפֿירט דורך אױפֿגעפֿירטע AI מאָדעלן
31+ AI שפּראַך מאָדעלס
די גרעסטע זאַמלונג פֿון אָפֿן־קאָד TTS־מאָדלן אין איין פּלאַטפאָרמע
Kokoro Free
קאָקאָראָ איז אַ 82 מיליאָן־פּאַראַמעטער־טעקסט־צו־ספּראַך־מאָדעל װאָס שטײט גוט איבער זײַן גרײס־קלאַס. אױף זײער קליין גרײס, פּראָדוצירט עס אַ מאָדנע נאַטירלעכע און אויסדריקלעכע שפּראַך. קאָקאָראָ שטיצט אַ סך שפּראַכן, אַרײַנגערעכנט ענגליש, יאַפּאַניש, סינייִש, און קאָרעיִש, מיט אַ סך אויסדריקלעכע שפּראַכן. עס לײענט אומעטום שנעל — עס פּראָדוצירט אודיו כּמעט 100קס שנעלער װי אין אמת־צײַט אױף אַ GPU.
בעסטער פֿאַר: העכער־קװאַליטעט TTS מיט קלענסטע װײַטערגײט, סטרימינג־פּראָגראַמען
פֿרײַער־פּראָבע
Piper Free
פּאַפּער איז אַ לייכטע טעקסט־צו־ספּראַך־מאַשין אַנטוויקלט פֿון Rhasspy וואָס ניצט VITS און larynx ארכיטעקטורן. עס לײגט אַלץ אױף דער CPU, װאָס מײנט אַז עס איז פּאַסיק פֿאַר Edge מכשירים, היים אויטאָמאַטיזאַציע, און אַפּליקאַציעס װאָס דאַרפן אױסגעלאָשן TTS. מיט איבער 100 שפּראַכן איבער 30+ שפּראַכן, גיט פּאַפּער נאַטירלעך־קלינגנדיקע שפּראַך אין אמת־צײַט־ספּרעדז, אױף אַ Raspberry Pi 4 אויך.
בעסטער פֿאַר: שנעל־פֿאָרױסװײַז, צוגײכלעכקײט, און אַרײַנגעװײַזטע פּראָגראַמען
פֿרײַער־פּראָבע
VITS Free
VITS (װאַריאַציע־אינפֿאָרמאַציע מיט אױפֿגאַבע־לײענען פֿאַר סוף־צו־סוף־טעקסט־צו־ספּראַך) איז אַ פּאַראַלעל סוף־צו־סוף TTS־מעכאַניזם װאָס שאַפֿט אַ נאַטירלעכער קלינגנדיקן אופֿן װי די הײַנטיקע צוויי־שטאַפּ־מאָדלן. עס נעמט אַװעק װאַריאַציע־אינפֿאָרמאַציע פֿאַרגרעסערט מיט נאָרמאַליזירנדיקע פֿלאָסן און אַ אױפֿגאַבע־לײענען־פּראָצעס, װאָס דערגרייכט אַ וויכטיקע פֿאַרבעסערן אין נאַטירלעכקייט.
בעסטער פֿאַר: אַלגעמיינע־ניטיקע טעקסט־צו־ספּראַך מיט נאַטירלעכער פּראָסאָדיע
פֿרײַער־פּראָבע
MeloTTS Free
MeloTTS פֿון MyShell.ai איז אַ פֿאַרשײדענע שפּראַך TTS ביבליאָטעק װאָס שטיצט ענגליש (אַמעריקאַנער, בריטיש, אינדיע, אױסטראַליער), שפּאַניש, פֿראַנצויזיש, סינייִש, יאַפּאַניש, און קאָרעיִש. עס איז זייער שנעל, באַהאַנדלט דעם טעקסט מיט אַ היפּש אמת־צײַט־ספּרעאַד אויף דער קאָמפּיוטער אַליין. MeloTTS איז צוגעגרייט פֿאַר פּראָדוקציע־נוצן און שטיצט בײדע קאָמפּיוטער־ און גראַפיק־פּראָצעסאָר־אינפֿאָרמאַציע.
בעסטער פֿאַר: פּראָדוקציע־פּראָגראַמען װאָס דאַרפן אַ שנעלן, מער־שפּראַכיקן TTS
פֿרײַער־פּראָבע
OuteTTS Free
OuteTTS פֿאַרגרעסערט גרויסע שפּראַך־מאָדלן מיט טעקסט־צו־ספּראַך־קײט בשעת עס װעט באַהאַלטן די אויטאָמאַטישע ארכיטעקטור. עס שטיצט אַ סך הינטער־פֿאַרבינדונגען אַרײַנגערעכנט llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, און אױף אַ בראַוזער־אינפֿיראַציע װי Transformers.js. עס האָט אַ נוליקע־שאָט־סטימיק־קלאָנינג װײַטער די רעדאַקטאָר־פּראָפֿעליעס, אױסגעהאַלטן װי JSON.
בעסטער פֿאַר: Edge װײַזונג, בלעטערער־באזירטע TTS, װײַזונג אין װײַזונג־װירוס־פֿאַרבינדונגען
פֿרײַער־פּראָבע
Pocket TTS Free
פּאָקע־טץ פֿון קיוטאַי (דער מחבר פֿון מושי) איז אַ קאָמפּאַקטער 100 מײַל פּאַראַמעטער־טעקסט־צו־ספּראַך־מאָדל װאָס װײַזט זיך גוט איבער זײַן וואָג. עס לײגט זיך עפעקטיוו אױף דער מעגלעכקייט, שטיצט אַ ניט־צוגעפֿאַלענע שפּראַך־קלאָנירונג פֿון אַ איין אודיו־פֿאָרעם, און פּראָדוצירט נאַטירלעך־קלינגנדיקע שפּראַך. די קליין מאָדעל גרײס װײַזט זיך גוט פֿאַר װײַטער־פֿאַרבינדונגען און װײַטער־פֿאַרבינדונגען
בעסטער פֿאַר: קלאָרע װײַזונג, CPU-אײנציק אומבאַקאַנטײטן, שנעל־סטימעלע קלאָנירונג
פֿרײַער־פּראָבע
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
בעסטער פֿאַר: Fast lightweight TTS, edge deployment, low-latency applications
פֿרײַער־פּראָבע
Bark Standard
טראַנספֿאָרמירונג־באזירטע טעקסט־צו־אויער מאָדעל װאָס װײַזט רעאַליסטישע שפּראַך, מוזיק און קלאַנג־עפֿעקטן
אַנטוויקלער: Suno · דערלויבעניש: MIT
פֿאָרשלאָגן
Bark Small Standard
קלענערע װערסיע פֿון Bark מיט שנעלערע אַרײַנשרײַבונג און קלענערער זכּרון־נוץ
אַנטוויקלער: Suno · דערלויבעניש: MIT
פֿאָרשלאָגן
CosyVoice 2 Standard
דער אינטערנעץ איז אַ ווייכווארג־פּראָגראַם וואָס גיט אינטערנעט־צוטריט צו מענטשן און אָרגאַניזאַציעס.
אַנטוויקלער: Alibaba (Tongyi Lab) · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
Dia TTS Standard
װיפֿל־רעדנדיקער־דיאַלאָג־גרענעצירונג־מאָדעל װאָס שאַפֿט נאַטירלעכע שמועסן צװישן רעדנדיקע
אַנטוויקלער: Nari Labs · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
Parler TTS Standard
באַשרײַב די שטימע װאָס דו װילסט אין נאַטירלעכער שפּראַך און Parler װעט אױסגײן מיט אײן שפּראַך
אַנטוויקלער: Hugging Face · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
GLM-TTS Standard
דערגרייכט די קלענסטע שריפֿטצײכן־טעות־רײט צװישן אָפֿן־קאָלוד TTS־מאָדלן
אַנטוויקלער: Zhipu AI · דערלויבעניש: GLM-4 License
פֿאָרשלאָגן
IndexTTS-2 Standard
ער האָט געשריבן אַ בוך מיטן נאָמען „די מלחמה און דער שלום‟.
אַנטוויקלער: Index Team · דערלויבעניש: Bilibili Model License
פֿאָרשלאָגן
Spark TTS Standard
שפּראַך־קלאָנינג TTS מיט קאָנטראָלירbare עמאָציעס און שפּראַך־סטייל װײַזנדיק אױף פֿראַגעס
אַנטוויקלער: SparkAudio · דערלויבעניש: CC BY-NC-SA 4.0
פֿאָרשלאָגן
GPT-SoVITS Standard
אַ פּאָר־שטיקלעך שטימע־קלאָנינג TTS װאָס רעפּליקטירט אַ שטימע פֿון נאָר 5 סעקונדעס אוודיאָ
אַנטוויקלער: RVC-Boss · דערלויבעניש: MIT
פֿאָרשלאָגן
Orpheus Standard
100,000 יאָר צוריק האָט מען דערגרייכט אַ מדרגה פון אַנטוויקלונג אין דער געשיכטע פון דער מענטשהייט.
אַנטוויקלער: Canopy Labs · דערלויבעניש: Llama 3.2 Community
פֿאָרשלאָגן
Qwen3 TTS Standard
Alibaba'ס װיפֿל־שפּראַכיקער TTS מיט שפּראַך־קלאָנינג, פֿאַרזיכערטע שפּראַכן, און שפּראַך־דיזיין פֿון טעקסט
אַנטוויקלער: Alibaba (Qwen) · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
Chatterbox Turbo Standard
שנעלערע צײַט־פֿאַרבינדונג מיט אונטער־200 מיסעלעטענץ און װײַטער־שפּראַכלעכע טאַגס פֿאַר לײַכעס, קאָפּשווינדל, און מער
אַנטוויקלער: Resemble AI · דערלויבעניש: MIT
פֿאָרשלאָגן
Dia 2 Standard
װידער אַמאָל, די װײַטערדיקע װערק פֿון װעלט־געשיכטע איז אַ װײַטערדיקע װעלט־געשיכטע.
אַנטוויקלער: Nari Labs · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
VoxCPM Standard
441 איז אַ פערזענלעכע טעלעפאָן־קאָדירונגס־נאָמען, וואָס קומט פֿון די 441 סטעיטס פון אַמעריקע.
אַנטוויקלער: OpenBMB · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
TADA Standard
די 5000-יאָריקע אַלט שטאָט איז געווען אַ שטאָט מיט אַ רייַך געשיכטע, אַפֿילו איידער די 5000-יאָריקע שטאָט איז געגרינדעט געוואָרן.
אַנטוויקלער: Hume AI · דערלויבעניש: MIT
פֿאָרשלאָגן
VibeVoice Standard
Microsoft's multi-speaker long-form TTS generating up to 90 minutes with 4 distinct speakers.
אַנטוויקלער: Microsoft · דערלויבעניש: MIT
פֿאָרשלאָגן
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
אַנטוויקלער: Alibaba (FunAudioLLM) · דערלויבעניש: Apache 2.0
פֿאָרשלאָגן
CosyVoice 2
דער אינטערנעץ איז אַ ווייכווארג־פּראָגראַם וואָס גיט אינטערנעט־צוטריט צו מענטשן און אָרגאַניזאַציעס.
שפּראַכן: en, zh, ja, ko, fr, de, it, es
קלײַב אַלץ אױס
GLM-TTS
דערגרייכט די קלענסטע שריפֿטצײכן־טעות־רײט צװישן אָפֿן־קאָלוד TTS־מאָדלן
שפּראַכן: en, zh
קלײַב אַלץ אױס
IndexTTS-2
ער האָט געשריבן אַ בוך מיטן נאָמען „די מלחמה און דער שלום‟.
שפּראַכן: en, zh
קלײַב אַלץ אױס
Spark TTS
שפּראַך־קלאָנינג TTS מיט קאָנטראָלירbare עמאָציעס און שפּראַך־סטייל װײַזנדיק אױף פֿראַגעס
שפּראַכן: en, zh
קלײַב אַלץ אױס
GPT-SoVITS
אַ פּאָר־שטיקלעך שטימע־קלאָנינג TTS װאָס רעפּליקטירט אַ שטימע פֿון נאָר 5 סעקונדעס אוודיאָ
שפּראַכן: en, zh, ja, ko
קלײַב אַלץ אױס
Chatterbox
אױף דער װעלט־פֿאַרבאַנד־רשימה פֿונעם װעלט־פֿאַרבאַנד װעלט־רשימה פֿונעם װעלטפֿאַרבאַנד
שפּראַכן: en
קלײַב אַלץ אױס
Tortoise TTS
װיפֿל־שפּראַך־טעקסט־צו־שפּראַך פֿאָקוסירט זיך אױף קװאַליטעט מיט אַ אויטאָרעגרעסיװער אױספֿיר.
שפּראַכן: en
קלײַב אַלץ אױס
OpenVoice
שפּראַך־קלאָנירונג מיט גראַניאַלער קאָנטראָל איבער סטיל, עמאָציע, און אַרײַנשרײַב
שפּראַכן: en, zh, ja, ko, fr, de, es, it
קלײַב אַלץ אױס
Qwen3 TTS
Alibaba'ס װיפֿל־שפּראַכיקער TTS מיט שפּראַך־קלאָנינג, פֿאַרזיכערטע שפּראַכן, און שפּראַך־דיזיין פֿון טעקסט
שפּראַכן: en, zh, ja, ko, de, fr, ru, pt, es, it
קלײַב אַלץ אױס
Chatterbox Turbo
שנעלערע צײַט־פֿאַרבינדונג מיט אונטער־200 מיסעלעטענץ און װײַטער־שפּראַכלעכע טאַגס פֿאַר לײַכעס, קאָפּשווינדל, און מער
שפּראַכן: en
קלײַב אַלץ אױס
VoxCPM
441 איז אַ פערזענלעכע טעלעפאָן־קאָדירונגס־נאָמען, וואָס קומט פֿון די 441 סטעיטס פון אַמעריקע.
שפּראַכן: en, zh
קלײַב אַלץ אױס
OuteTTS
LLM-באזירט TTS װאָס לײגט אױף CPU, GPU, אָדער בלעטערער װידער llama.cpp און Transformers.js
שפּראַכן: en
קלײַב אַלץ אױס
Pocket TTS
קלאָרע 100 מײַל פּאַראַמעטער מאָדעל פֿון Kyutai מיט שפּראַך־קלאָנינג פֿון אַ איין אַרײַנפֿיר
שפּראַכן: en, fr
קלײַב אַלץ אױס
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
שפּראַכן: en, zh, ja, ko, de, es, fr, it, ru
קלײַב אַלץ אױס
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
שפּראַכן: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
קלײַב אַלץ אױס
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
שפּראַכן: en, zh
קלײַב אַלץ אױסאױפֿפֿירער־פֿירער API
OpenAI-פֿאַרבינדענע REST API. איין סוף־פּונקט, 22+ מאָדעלן. סטרימינג שטיצן פֿאַר אמת־צײַט־פּראָגראַמען
- OpenAI־פֿאַרבײַטלעכע פֿאָרמאַטירונג
- סטרימינג TTS פֿאַר אמת־צײַט אַפּליקאַציעס
- קלײַב אַלץ אױס
- Webhook באַװעגונגען
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
פּשוטע, טראַנספּעראַנטע צאָלונג
אָנהײב פֿרײַ. װי דו גרײסט, װײַל דו גרײסט
פֿרײַ
50 קרעדיטס
- Kokoro, Piper, VITS, MeloTTS
- 500 שריפֿטצײכן גבֿורה
- 3 טעג/שעה (ניט קיין חשבון)
אָנהײב
500 קרעדיטס/חודש
- אַלע 22+ מאָדעלס
- 100,000 שריפֿטצײכן אױף אײן װערטשע
- שריפֿט גרײס
פּראָפֿעסיאָנאַל
2,000 קרעדיטס/חודש
- אַלץ אין אָנהײב
- API צוטריט
- פּרעפֿערענצן באַהאַנדלונג
פֿראַגעס און ענטפֿערס
What could we improve? Your feedback helps us fix issues.
אָנהײב צו ניצן AI Voice הײַנט
אַרײַנשרײַבן שאַפֿער, אַנטוויקלער און געשעפטן ניצן TTS.ai