פֿרײַער AI טעקסט צו שפּראַך

33+ עפֿענען־קאָפּיע מאָדעל, 273+ שטימע 33+ שפּראַכן. קײן אַקאַונט איז ניט נייטיק

17K+
שאַפֿער
70K+
װײַטער
33+
AI מאָדעלס
273+
שריפֿטצײכן
ליבע TTS.ai? זאָגן דיין פריינט

אַלץ װאָס דו האָסט נײן פֿאַר װאָך AI

30+ מכשירים אױפֿגעפֿירט דורך אױפֿגעפֿירטע AI מאָדעלן

33+ AI שפּראַך מאָדעלס

די גרעסטע זאַמלונג פֿון אָפֿן־קאָד TTS־מאָדלן אין איין פּלאַטפאָרמע

KokoroKokoro פֿרײַ

קאָקאָראָ איז אַ 82 מיליאָן־פּאַראַמעטער־טעקסט־צו־ספּראַך־מאָדעל װאָס שטײט גוט איבער זײַן גרײס־קלאַס. אױף זײער קליין גרײס, פּראָדוצירט עס אַ מאָדנע נאַטירלעכע און אויסדריקלעכע שפּראַך. קאָקאָראָ שטיצט אַ סך שפּראַכן, אַרײַנגערעכנט ענגליש, יאַפּאַניש, סינייִש, און קאָרעיִש, מיט אַ סך אויסדריקלעכע שפּראַכן. עס לײענט אומעטום שנעל — עס פּראָדוצירט אודיו כּמעט 100קס שנעלער װי אין אמת־צײַט אױף אַ GPU.

בעסטער פֿאַר: העכער־קװאַליטעט TTS מיט קלענסטע װײַטערגײט, סטרימינג־פּראָגראַמען

פֿרײַער־פּראָבע

PiperPiper פֿרײַ

פּאַפּער איז אַ לייכטע טעקסט־צו־ספּראַך־מאַשין אַנטוויקלט פֿון Rhasspy וואָס ניצט VITS און larynx ארכיטעקטורן. עס לײגט אַלץ אױף דער CPU, װאָס מײנט אַז עס איז פּאַסיק פֿאַר Edge מכשירים, היים אויטאָמאַטיזאַציע, און אַפּליקאַציעס װאָס דאַרפן אױסגעלאָשן TTS. מיט איבער 100 שפּראַכן איבער 30+ שפּראַכן, גיט פּאַפּער נאַטירלעך־קלינגנדיקע שפּראַך אין אמת־צײַט־ספּרעדז, אױף אַ Raspberry Pi 4 אויך.

בעסטער פֿאַר: שנעל־פֿאָרױסװײַז, צוגײכלעכקײט, און אַרײַנגעװײַזטע פּראָגראַמען

פֿרײַער־פּראָבע

VITSVITS פֿרײַ

VITS (װאַריאַציע־אינפֿאָרמאַציע מיט אױפֿגאַבע־לײענען פֿאַר סוף־צו־סוף־טעקסט־צו־ספּראַך) איז אַ פּאַראַלעל סוף־צו־סוף TTS־מעכאַניזם װאָס שאַפֿט אַ נאַטירלעכער קלינגנדיקן אופֿן װי די הײַנטיקע צוויי־שטאַפּ־מאָדלן. עס נעמט אַװעק װאַריאַציע־אינפֿאָרמאַציע פֿאַרגרעסערט מיט נאָרמאַליזירנדיקע פֿלאָסן און אַ אױפֿגאַבע־לײענען־פּראָצעס, װאָס דערגרייכט אַ וויכטיקע פֿאַרבעסערן אין נאַטירלעכקייט.

בעסטער פֿאַר: אַלגעמיינע־ניטיקע טעקסט־צו־ספּראַך מיט נאַטירלעכער פּראָסאָדיע

פֿרײַער־פּראָבע

MeloTTSMeloTTS פֿרײַ

MeloTTS פֿון MyShell.ai איז אַ פֿאַרשײדענע שפּראַך TTS ביבליאָטעק װאָס שטיצט ענגליש (אַמעריקאַנער, בריטיש, אינדיע, אױסטראַליער), שפּאַניש, פֿראַנצויזיש, סינייִש, יאַפּאַניש, און קאָרעיִש. עס איז זייער שנעל, באַהאַנדלט דעם טעקסט מיט אַ היפּש אמת־צײַט־ספּרעאַד אויף דער קאָמפּיוטער אַליין. MeloTTS איז צוגעגרייט פֿאַר פּראָדוקציע־נוצן און שטיצט בײדע קאָמפּיוטער־ און גראַפיק־פּראָצעסאָר־אינפֿאָרמאַציע.

בעסטער פֿאַר: פּראָדוקציע־פּראָגראַמען װאָס דאַרפן אַ שנעלן, מער־שפּראַכיקן TTS

פֿרײַער־פּראָבע

Kani TTS 2Kani TTS 2 פֿרײַ

Kani-TTS-2 פֿון NineNineSix איז אַ װעלכע־לייכטע 400 מײַל פּאַראַמעטער מאָדעל, געגרינדעט אויף LiquidAI LFM2 בײַטבאָנע מיט Nvidia NanoCodec. עס לײגט זיך אין נאָר 3 גיגאבייט VRAM און דערגרייכט 10 סעקונדעס פֿון רעדן אין ~2 סעקונדעס (RTF 0.2). שטיצט ניט־צוגעפֿירטע שטימע־קלאָנינג װײַזנדיק די רעדאַקטאָר־אַרײַנשרײַבונגען.

בעסטער פֿאַר: שנעלער אַרײַנשרײַב, װײַטער־פֿאַרבינדונג, שנעלער פֿאָרױסװײַז

פֿרײַער־פּראָבע

OuteTTSOuteTTS פֿרײַ

OuteTTS פֿאַרגרעסערט גרויסע שפּראַך־מאָדלן מיט טעקסט־צו־ספּראַך־קײט בשעת עס װעט באַהאַלטן די אויטאָמאַטישע ארכיטעקטור. עס שטיצט אַ סך הינטער־פֿאַרבינדונגען אַרײַנגערעכנט llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, און אױף אַ בראַוזער־אינפֿיראַציע װי Transformers.js. עס האָט אַ נוליקע־שאָט־סטימיק־קלאָנינג װײַטער די רעדאַקטאָר־פּראָפֿעליעס, אױסגעהאַלטן װי JSON.

בעסטער פֿאַר: Edge װײַזונג, בלעטערער־באזירטע TTS, װײַזונג אין װײַזונג־װירוס־פֿאַרבינדונגען

פֿרײַער־פּראָבע

Pocket TTSPocket TTS פֿרײַ

פּאָקע־טץ פֿון קיוטאַי (דער מחבר פֿון מושי) איז אַ קאָמפּאַקטער 100 מײַל פּאַראַמעטער־טעקסט־צו־ספּראַך־מאָדל װאָס װײַזט זיך גוט איבער זײַן וואָג. עס לײגט זיך עפעקטיוו אױף דער מעגלעכקייט, שטיצט אַ ניט־צוגעפֿאַלענע שפּראַך־קלאָנירונג פֿון אַ איין אודיו־פֿאָרעם, און פּראָדוצירט נאַטירלעך־קלינגנדיקע שפּראַך. די קליין מאָדעל גרײס װײַזט זיך גוט פֿאַר װײַטער־פֿאַרבינדונגען און װײַטער־פֿאַרבינדונגען

בעסטער פֿאַר: קלאָרע װײַזונג, CPU-אײנציק אומבאַקאַנטײטן, שנעל־סטימעלע קלאָנירונג

פֿרײַער־פּראָבע

Kitten TTSKitten TTS פֿרײַ

Kitten TTS פֿון KittenML איז אַ װײַטער־לייכטע טעקסט־צו־ספּראַך מאָדעל, געגרינדעט אויף ONNX. מיט װאַריאַנטן פֿון 15 מײַל צו 80 מײַל פּאַראַמעטערס (25-80 מײַל אויף דיסק), גיט עס אַ האַרט־קוואַליטעט שפּראַך־סײַנטעז אויף CPU אָן אַ GPU. עס האָט 8 אַרײַנגעבוירענע שפּראַכן, אַ צופּאַסן שפּראַך־ספּרינג, און אַ אַרײַנגעבוירענע טעקסט־פֿאָר־פּראָסעסינג פֿאַר נומערן, געלט און יחידן. ידעאַל פֿאַר אַרײַנפֿירן אין װײַטקייט און פֿאַר נידעריק־לאַטענסי־פּראָגראַמען.

בעסטער פֿאַר: שנעל־לייכטע TTS, װײַס־װײַס־פֿאַרבינדונג, װײַס־װײַס־פּראָגראַמען

פֿרײַער־פּראָבע

Ming-Omni TTSMing-Omni TTS פֿרײַ

מינג־אָמני־טץ־0.5ב פֿון אינקלודיאָן־אַלי איז אַ קאָמפּאַקטער אָני־מאָדאַלער שפּראַך־מאָדל, געגרינדעט אויף דעם BailingMM־דיזאַזישן הינטערגרונט מיט אַ פּאַפּק־דורך־פּאַפּק־פֿלאָוס־באַהאַלטנדיקן אודיו־דיקאָדער. עס גיט אַ 44.1 קהז־אַרײַנשרײַב (נײַגעגאנגען צו אַ CD־קוואַליטעט), שטיצט אַ נול־שטופּ־שפּראַך־קלאָנינג פֿון אַ 3+ סעקונדעס רעפֿערענץ, און אַנטהאַלט אַ אַרײַנגעבוירענע ימאָוציע/דיאַלעקט/BGM־קאָנטראָול װי אַ JSON־אינפֿאָרמאַציע. אַ גוטער סטאַביליטעט — 0.83% WER אויף צײַטשישע באַנקמאַרקס.

בעסטער פֿאַר: הויך־פֿאַרפֿאָלגונג צוויי־שפּראַכיקער דערציילונג, עמאָציאָנעל־קאָנטראָלירטע שפּראַך־אַקטירונג, כינעזישע אוודיאָ־בוך אינהאַלט

פֿרײַער־פּראָבע

MOSS-TTS NanoMOSS-TTS Nano פֿרײַ

MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.

בעסטער פֿאַר: Free-tier TTS, high-volume production, low-latency interactive use

פֿרײַער־פּראָבע

BarkBark סטנדרט

טראַנספֿאָרמירונג־באזירטע טעקסט־צו־אויער מאָדעל װאָס װײַזט רעאַליסטישע שפּראַך, מוזיק און קלאַנג־עפֿעקטן

אַנטוויקלער: Suno · דערלויבעניש: MIT

פֿאָרשלאָגן

Bark SmallBark Small סטנדרט

קלענערע װערסיע פֿון Bark מיט שנעלערע אַרײַנשרײַבונג און קלענערער זכּרון־נוץ

אַנטוויקלער: Suno · דערלויבעניש: MIT

פֿאָרשלאָגן

CosyVoice 2CosyVoice 2 סטנדרט

דער אינטערנעץ איז אַ ווייכווארג־פּראָגראַם וואָס גיט אינטערנעט־צוטריט צו מענטשן און אָרגאַניזאַציעס.

אַנטוויקלער: Alibaba (Tongyi Lab) · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

Dia TTSDia TTS סטנדרט

װיפֿל־רעדנדיקער־דיאַלאָג־גרענעצירונג־מאָדעל װאָס שאַפֿט נאַטירלעכע שמועסן צװישן רעדנדיקע

אַנטוויקלער: Nari Labs · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

Parler TTSParler TTS סטנדרט

באַשרײַב די שטימע װאָס דו װילסט אין נאַטירלעכער שפּראַך און Parler װעט אױסגײן מיט אײן שפּראַך

אַנטוויקלער: Hugging Face · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

IndexTTS-2IndexTTS-2 סטנדרט

ער האָט געשריבן אַ בוך מיטן נאָמען „די מלחמה און דער שלום‟.

אַנטוויקלער: Index Team · דערלויבעניש: Bilibili Model License

פֿאָרשלאָגן

Spark TTSSpark TTS סטנדרט

שפּראַך־קלאָנינג TTS מיט קאָנטראָלירbare עמאָציעס און שפּראַך־סטייל װײַזנדיק אױף פֿראַגעס

אַנטוויקלער: SparkAudio · דערלויבעניש: CC BY-NC-SA 4.0

פֿאָרשלאָגן

GPT-SoVITSGPT-SoVITS סטנדרט

אַ פּאָר־שטיקלעך שטימע־קלאָנינג TTS װאָס רעפּליקטירט אַ שטימע פֿון נאָר 5 סעקונדעס אוודיאָ

אַנטוויקלער: RVC-Boss · דערלויבעניש: MIT

פֿאָרשלאָגן

OrpheusOrpheus סטנדרט

100,000 יאָר צוריק האָט מען דערגרייכט אַ מדרגה פון אַנטוויקלונג אין דער געשיכטע פון דער מענטשהייט.

אַנטוויקלער: Canopy Labs · דערלויבעניש: Llama 3.2 Community

פֿאָרשלאָגן

Qwen3 TTSQwen3 TTS סטנדרט

Alibaba'ס װיפֿל־שפּראַכיקער TTS מיט שפּראַך־קלאָנינג, פֿאַרזיכערטע שפּראַכן, און שפּראַך־דיזיין פֿון טעקסט

אַנטוויקלער: Alibaba (Qwen) · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

VieNeu-TTS-v2VieNeu-TTS-v2 סטנדרט

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

אַנטוויקלער: Phạm Nguyễn Ngọc Bảo · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

Chatterbox TurboChatterbox Turbo סטנדרט

שנעלערע צײַט־פֿאַרבינדונג מיט אונטער־200 מיסעלעטענץ און װײַטער־שפּראַכלעכע טאַגס פֿאַר לײַכעס, קאָפּשווינדל, און מער

אַנטוויקלער: Resemble AI · דערלויבעניש: MIT

פֿאָרשלאָגן

VoxCPMVoxCPM סטנדרט

441 איז אַ פערזענלעכע טעלעפאָן־קאָדירונגס־נאָמען, וואָס קומט פֿון די 441 סטעיטס פון אַמעריקע.

אַנטוויקלער: OpenBMB · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

VibeVoiceVibeVoice סטנדרט

די גאנצע סדרה איז 90 מינוט לאַנג און איז באזירט אויף די 100 טעג פון די חורבן.

אַנטוויקלער: Microsoft · דערלויבעניש: MIT

פֿאָרשלאָגן

CosyVoice3CosyVoice3 סטנדרט

ווייַטער־גענירונגס־פֿאַרשפּראַכיקער TTS מיט בי־סטרימינג, עמאָציע־קאָנטראָל, און נול־שאָט־סטימע־קלאָנינג

אַנטוויקלער: Alibaba (FunAudioLLM) · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

NAMAA Saudi TTSNAMAA Saudi TTS סטנדרט

דער ערשטער עפֿענעם סודאַן־אַראַביש TTS. משפּחה־סודאַן־דיאַלעקט מיט צײַטצײכן־קוואַליטעט־סטימיק־קלאָנינג

אַנטוויקלער: NAMAA Space · דערלויבעניש: MIT

פֿאָרשלאָגן

Darwin TTSDarwin TTS סטנדרט

די װירוס איז געװען געװען געװען אױף די װירוס־פֿאָרמע װי אַ װירוס־פֿאָרמע פֿון װירוס־קאָד 1.0.

אַנטוויקלער: FINAL-Bench · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

MOSS-TTSDMOSS-TTSD סטנדרט

די טעלעוויזיע־פּראָגראַם איז געווען אַ טעלעוויזיע־פּראָגראַם מיט אַ שעה משך און 50 מינוט משך.

אַנטוויקלער: OpenMOSS · דערלויבעניש: Apache 2.0

פֿאָרשלאָגן

ChatterboxChatterbox פּרעמיום

אױף דער װעלט־פֿאַרבאַנד־רשימה פֿונעם װעלט־פֿאַרבאַנד װעלט־רשימה פֿונעם װעלטפֿאַרבאַנד

קװאַליטעט:

פֿאָרשלאָגן

Tortoise TTSTortoise TTS פּרעמיום

װיפֿל־שפּראַך־טעקסט־צו־שפּראַך פֿאָקוסירט זיך אױף קװאַליטעט מיט אַ אויטאָרעגרעסיװער אױספֿיר.

קװאַליטעט:

פֿאָרשלאָגן

StyleTTS 2StyleTTS 2 פּרעמיום

אינטערנאַציאָנאַלע שפּראַך איז אַ שפּראַך וואָס ווערט גערעדט דורך אינטערנאַציאָנאַלע אָרגאַניזאַציעס און אינסטיטוציעס.

קװאַליטעט:

פֿאָרשלאָגן

OpenVoiceOpenVoice פּרעמיום

שפּראַך־קלאָנירונג מיט גראַניאַלער קאָנטראָל איבער סטיל, עמאָציע, און אַרײַנשרײַב

קװאַליטעט:

פֿאָרשלאָגן

Sesame CSMSesame CSM פּרעמיום

װײַל די װעלט איז אױסגעװײנטלעכט װי אַ נאַטירלעכער װעלט מיט װידערגעװײנטלעכן װײַטקייט און צײַט.

קװאַליטעט:

פֿאָרשלאָגן

CosyVoice 2CosyVoice 2

דער אינטערנעץ איז אַ ווייכווארג־פּראָגראַם וואָס גיט אינטערנעט־צוטריט צו מענטשן און אָרגאַניזאַציעס.

שפּראַכן: en, zh, ja, ko, fr, de, it, es

קלײַב אַלץ אױס

IndexTTS-2IndexTTS-2

ער האָט געשריבן אַ בוך מיטן נאָמען „די מלחמה און דער שלום‟.

שפּראַכן: en, zh

קלײַב אַלץ אױס

Spark TTSSpark TTS

שפּראַך־קלאָנינג TTS מיט קאָנטראָלירbare עמאָציעס און שפּראַך־סטייל װײַזנדיק אױף פֿראַגעס

שפּראַכן: en, zh

קלײַב אַלץ אױס

GPT-SoVITSGPT-SoVITS

אַ פּאָר־שטיקלעך שטימע־קלאָנינג TTS װאָס רעפּליקטירט אַ שטימע פֿון נאָר 5 סעקונדעס אוודיאָ

שפּראַכן: en, zh, ja, ko

קלײַב אַלץ אױס

ChatterboxChatterbox

אױף דער װעלט־פֿאַרבאַנד־רשימה פֿונעם װעלט־פֿאַרבאַנד װעלט־רשימה פֿונעם װעלטפֿאַרבאַנד

שפּראַכן: en

קלײַב אַלץ אױס

Tortoise TTSTortoise TTS

װיפֿל־שפּראַך־טעקסט־צו־שפּראַך פֿאָקוסירט זיך אױף קװאַליטעט מיט אַ אויטאָרעגרעסיװער אױספֿיר.

שפּראַכן: en

קלײַב אַלץ אױס

OpenVoiceOpenVoice

שפּראַך־קלאָנירונג מיט גראַניאַלער קאָנטראָל איבער סטיל, עמאָציע, און אַרײַנשרײַב

שפּראַכן: en, zh, ja, ko, fr, es

קלײַב אַלץ אױס

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

שפּראַכן: vi, en

קלײַב אַלץ אױס

Chatterbox TurboChatterbox Turbo

שנעלערע צײַט־פֿאַרבינדונג מיט אונטער־200 מיסעלעטענץ און װײַטער־שפּראַכלעכע טאַגס פֿאַר לײַכעס, קאָפּשווינדל, און מער

שפּראַכן: en

קלײַב אַלץ אױס

VoxCPMVoxCPM

441 איז אַ פערזענלעכע טעלעפאָן־קאָדירונגס־נאָמען, וואָס קומט פֿון די 441 סטעיטס פון אַמעריקע.

שפּראַכן: en, zh

קלײַב אַלץ אױס

OuteTTSOuteTTS

LLM-באזירט TTS װאָס לײגט אױף CPU, GPU, אָדער בלעטערער װידער llama.cpp און Transformers.js

שפּראַכן: en

קלײַב אַלץ אױס

Pocket TTSPocket TTS

קלאָרע 100 מײַל פּאַראַמעטער מאָדעל פֿון Kyutai מיט שפּראַך־קלאָנינג פֿון אַ איין אַרײַנפֿיר

שפּראַכן: en, fr

קלײַב אַלץ אױס

CosyVoice3CosyVoice3

ווייַטער־גענירונגס־פֿאַרשפּראַכיקער TTS מיט בי־סטרימינג, עמאָציע־קאָנטראָל, און נול־שאָט־סטימע־קלאָנינג

שפּראַכן: en, zh, ja, ko, de, es, fr, it, ru

קלײַב אַלץ אױס

NAMAA Saudi TTSNAMAA Saudi TTS

דער ערשטער עפֿענעם סודאַן־אַראַביש TTS. משפּחה־סודאַן־דיאַלעקט מיט צײַטצײכן־קוואַליטעט־סטימיק־קלאָנינג

שפּראַכן: ar

קלײַב אַלץ אױס

Darwin TTSDarwin TTS

די װירוס איז געװען געװען געװען אױף די װירוס־פֿאָרמע װי אַ װירוס־פֿאָרמע פֿון װירוס־קאָד 1.0.

שפּראַכן: en, ko, ja, zh

קלײַב אַלץ אױס

MOSS-TTSDMOSS-TTSD

די טעלעוויזיע־פּראָגראַם איז געווען אַ טעלעוויזיע־פּראָגראַם מיט אַ שעה משך און 50 מינוט משך.

שפּראַכן: en, zh

קלײַב אַלץ אױס

Ming-Omni TTSMing-Omni TTS

די ערד־מאַכט־צענטער איז אַ 1.5-הונדערט מעטער הויך, 400-קוואַדראַט-פֿאַרמאַכט שטאָטיש שטאָט־קראָם.

שפּראַכן: en, zh

קלײַב אַלץ אױס

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

שפּראַכן: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

קלײַב אַלץ אױס

אױפֿפֿירער־פֿירער API

OpenAI-פֿאַרבינדענע REST API. איין סוף־פּונקט, 22+ מאָדעלן. סטרימינג שטיצן פֿאַר אמת־צײַט־פּראָגראַמען

  • OpenAI־פֿאַרבײַטלעכע פֿאָרמאַטירונג
  • סטרימינג TTS פֿאַר אמת־צײַט אַפּליקאַציעס
  • קלײַב אַלץ אױס
  • Webhook באַװעגונגען
װײַז API דאָקומענטן
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

פּשוטע, טראַנספּעראַנטע צאָלונג

אָנהײב פֿרײַ. װי דו גרײסט, װײַל דו גרײסט

פֿרײַ

$0

15,000 שריפֿטצײכן + 5,000/טאָג

  • 7 פרייע מאָדעלן אַרײַנגערעכנט קאָקאָראָ
  • 5,000 שריפֿטצײכן אױף אײן װײַז
  • API צוטריט אַרייַנגערעכנט
אַרײַנשרײַבן

אָנהײב

$9/מינוט

500 קרעדיטס/חודש

  • אַלע 22+ מאָדעלס
  • 100,000 שריפֿטצײכן אױף אײן װערטשע
  • שריפֿט גרײס
אָנהײב
באַרימטסטע

פּראָפֿעסיאָנאַל

$29/מינוט

2,000 קרעדיטס/חודש

  • אַלץ אין אָנהײב
  • API צוטריט
  • פּרעפֿערענצן באַהאַנדלונג
קלײַב אַלץ אױס

אַרבעט

$99/מינוט

10,000 קרעדיטס/חודש

  • אַלץ אין פּראָ
  • גרײס:
  • פּריאָריטעט שורה
װײַז פֿאָרמאַטירונג

װײַז אױף אַלע פּלאָנען אַרײַנגערעכנט קרעדיט־פּאַקעס →

פֿראַגעס און ענטפֿערס

TTS.ai איז דער מערסטע װיפֿל־װײַטער־געװײנטלעכער AI־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס־װײַס

Yes! TTS.ai offers free text-to-speech with Kokoro, Piper, VITS, and MeloTTS models. No account required. Sign up to get 15,000 free characters and access all models. Paid plans start at $9/month.

פֿאַר שנעלײט, ניצ Kokoro אָדער Piper. פֿאַר קװאַליטעט, פּרובירן CosyVoice 2 אָדער StyleTTS 2. פֿאַר שפּראַך־קלאָנינג, ניצ Chatterbox אָדער GPT-SoVITS. פֿאַר דיאַלאָקט, ניצ Dia TTS. פּרובירן מערע מאָדעלס אויף דער זעלבער טעקסט צו פֿאַרגליכן

י. OpenAI-פֿאַרבינדענע REST API פֿאַר TTS, STT, שפּראַך־קלאָנינג, און אודיו־אַרײַנפֿירער. אַרייַנגערעכנט אין אַלע פּלאָנען, אױף פֿרײַע, מיט צאָל־באַגרענעצונגען װאָס װײַזן זיך אױף די װירוס (פֿרייַ: 10 req/מינ., ליטע: 20, אָנהײבער: 30, פּראָ: 60, ביזנעס: 300). זע דאָקומענטאַציע אױף tts.ai/api/

די שפּראַך־קוואַליטעט װײַזט זיך אױף דעם מאָדעל. פּרעמיום־מאָדלן װי CosyVoice 2, StyleTTS 2, און Chatterbox פּראָדוצירן אַ כּמעט־מענטשלעכע שפּראַך־קוואַליטעט מיט נאַטירלעכער אינטאָנאַציע און אױפֿפֿירונגען. פֿרײַע מאָדלן װי Kokoro װײַזן אַ גוטע שפּראַך־קוואַליטעט אױף די אױפֿפֿירונגען.

TTS.ai שטיצט 30+ שפּראַכן איבער זײַן מאָדעל ביבליאָטעק. ענגליש האָט די ברייטסטע מאָדעל שטיצט, אָבער מאָדעלס װי CosyVoice 2 דעקן שפּאַניש, יאַפּאַניש און קאָרעיִש; GPT-SoVITS האַלט שפּאַניש, יאַפּאַניש, קאָרעיִש און ענגליש; און MeloTTS שטיצט שפּאַניש, פֿראַנצויזיש, שפּאַניש, יאַפּאַניש און קאָרעיִש.

יאָ. אַלע פּראַסעסונגען פּאַסירן זיך אױף אונזערע פֿאַרזיכערטע GPU סערװערס. מיר אַרײַנשרײַבן ניט אייער טעקסט־אַרײַנשרײַב אָדער דערגרייכט אודיו נאָך דער איבערצײַגונג. אַרײַנגעלייגטע שפּראַך־פֿאָרשלאָגן פֿאַר קלאָנינג ווערן נאָר פֿאַר דער הײַנטיקער סעסיע גענוצט און ווערן ניט באַהאַלטן. מיר טיילן קײן מאָל ניט אייער דאַטן מיט דריטע פּאַרטיעס אָדער ניצן זיי צו פֿאַרזיכערן מאָדעלן

יאָ. אַלע אויטאָמאַטישע איבערזעצונגען פֿון TTS.ai זײַנען אייער צו פֿאַרקויף־צוועקן, אַרײַנגערעכנט פֿאַר YouTube װידואָס, פּאָדקאַסטן, אודיו־בוך, אַפּליקאַציעס, רעפֿערענצן, און פּראָדוקטן. אונזערע מאָדעלן זײַנען אָפֿן־קאָלוד אונטער פֿאַרלאָזלעכע לײַזאַנסן (MIT, Apache 2.0). קײן רעװאָלוציעס אָדער צושטימען איז ניט נייטיק.

TTS.ai שאַפֿט אודיו אין WAV־פֿאָרעם געװײנטלעך פֿאַר אַ מאַקסימום קװאַליטעט. דו קענסט איבערקוקן צו MP3, FLAC, OGG, אָדער M4A ניצן אונזערע פֿרײַע אודיו־אַרײַנװײַזער־פּראָגראַמען. די API שטיצט די ספּעסאַפאַקאַציע פֿון די אױסגאַבע־פֿאָרעם אין דער פֿראַגע.

אַרײַנשטעלן אַ קורצער אודיו־פֿאָרעם (פֿאַר 5 סעקונדעס) פֿון דער שפּראַך װאָס איר װילט קלאָנירן, און דעמאָלט אַרײַנשרײַבן אַ טעקסט װאָס װעט שאַפֿן אַ שפּראַך אין דער שפּראַך. מאָדעלס װי Chatterbox, GPT-SoVITS, און CosyVoice 2 שטיצן שפּראַך־קלאָנירן. דער קלאָנירטער שפּראַך אַרײַנשטעלן טון, אַרײַנשרײַב און שפּראַך־סטייל

פֿרײַע מאָדעלס (Kokoro, Piper, VITS, MeloTTS) דאַרפן ניט קיין חשבון און קאָסטן ניט קיין קרעדיטס. סטאַנדאַרד מאָדעלס (2 קרעדיטס/1 ק שריפֿטצײכן) אַרײַננעמען Bark, CosyVoice 2, F5-TTS, און Dia. פּרעמיום מאָדעלס (4 קרעדיטס/1 ק שריפֿטצײכן) אַרײַננעמען OpenVoice, Chatterbox, StyleTTS 2, און Tortoise. באַצאָלטע מאָדעלס אַרײַננעמען אין אַלגעמיין העכערע קוואַליטעט, מער שפּראַכן, און צוגעגעבןע פֿונקציעס װי שפּראַך־קלאָנינג.

י. די API שטיצט װײַטער־פּראָצעסן װוּ מען װײַזט אַ גרויסע צאָל טעקסטן צו רעדן. שיקן אַ סך פֿראַגעס און װײַזט די רעזולטאַטן ניט־סײַנװײַז מיט אַרבעט־UUIDס. די ביזנעס־פּלאַן ($99/חודש) און העכער אַרײַננעמען אַ פּריאָריטעט־װײַז־צוטריט װוּ מען װײַזט אַ גרעסערע צאָל טעקסטן צו רעדן. װײַל דאָס איז גוט פֿאַר אודיו־בוך־פּראָדוקציע, לערנװײַז־אינפֿאָרמאַציע און גרעסערע שפּראַך־פּראָדזשעקטן.
4.1/5 (42)

וואָס קען מען פֿאַרבעסערן? דיין אָפּרוף העלפֿט אונדז צו פֿאַרריכטן פּראָבלעמען

אָנהײב צו ניצן AI Voice הײַנט

אַרײַנשרײַבן שאַפֿער, אַנטוויקלער און געשעפטן ניצן TTS.ai