AI חינם טקסט לדיבור

פרמטרים 82M Ultra-מהיר קולות מביעים רב לשונית תמיכה בזרימה

מודל 82M במשקל קל מספק נאום איכות אולפן עם סיכום מהיר לוהט.

מהיר · 1.5GB VRAM נסה את זה.

Piper

ידידותי למעבד לא מקוון מסוגל 100+ קולות 35+ שפות תמיכה ב־ SSML

טקסט נוירוני מהיר ומקומי למערכת דיבור מאובזר עבור פטל פיי ומכשירים משובצים.

מהיר · 0 (CPU only) VRAM נסה את זה.

VITS

סינתזה מקצה לקצה פרוסודיה טבעית סיכום מהיר רמקולים מרובים

מקודד אוטומטי מותנה עם למידה יריבה לטקסט אל-סוף.

מהיר · 1GB VRAM נסה את זה.

MeloTTS

מעבד אופטימלי רב לשונית מבטאים מרובים מוכן להפקה חבישה נמוכה

רב-לשונית באיכות גבוהה טקסט-to-speech שפועל על מעבד עם השהיה מינימלית.

מהיר · 0.5GB (GPU optional) VRAM נסה את זה.

Bark

אפקטים קוליים צוחק/ נאנח דור המוזיקה 100+ רמקולים רב לשונית

מודל רובוטריק מבוסס טקסט-audio שיוצר דיבור מציאותי, מוסיקה, ואפקטים קוליים.

איטי · 5GB VRAM נסה את זה.

Bark Small

משקל קל מהר יותר מנביחה מלאה. דיבור רגשי רב לשונית

גירסה קלה יותר של Bark עם הסקה מהירה יותר ושימוש בזיכרון נמוך יותר.

בינוני · 2GB VRAM נסה את זה.

CosyVoice 2

זרימה שיבוט אפס-ירייה דו־ שיחיName שליטה ברגשות פערי אנוש

TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.

Dia TTS

רב־ רמקולים יצירת דו־ שיח לוקח תפנית טבעית. ביטוי רגשי פרמטרים 1.6B

מודל דור דיאלוג רב רמקול שיוצר שיחות טבעיות בין רמקולים.

Parler TTS

תיאור קול שליטה בשפה טבעית יצירת קול גמישה אין צורך בקולות שנקבעו מראש

תאר את הקול שאתה רוצה בשפה טבעית וParler יוצר דיבור תואם.

Indic Parler TTS

11 שפות הודיות תיאור קול שליטה בשפה טבעית הגייה אינדית אותנטית

נאום באיכות גבוהה עבור 8+ שפות הודיות עם שליטה קולית טבעית בשפה.

איטי · 8GB VRAM נסה את זה.

KhanomTan TTS

TTS תאילנדי רמקולים מרובים ארכיטקטורת TTS שלך רישיון בטיחות מסחרי

התאילנדי הראשון טקסט לדיבור עם בחירה של קולות רמקול.

מהיר · 2GB VRAM נסה את זה.

IndexTTS-2

שליטה ברגשות אפס-ירייה וקטורי רגש נאום אקספרסיבי שליטה בדגמים דקיםweather forecast

TTS אפס ירה עם שליטה ברגשות דקים וגילוי גבוה.

Spark TTS

שיבוט קולי שליטה ברגשות בקרת סגנון מבוסס מראש שיבוט של 5 שניות

השיבוט הקולי TTS עם רגש ניתן לשליטה וסגנון דיבור באמצעות דחפים.

GPT-SoVITS

שיבוט של 5 שניות קול שר למידה מועטה נאמנות גבוהה דו־ שיחיName

כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.

איטי · 6GB VRAM נסה את זה.

Orpheus

רגש ברמה אנושית. מאה אלף שעות אימונים. הדגשה טבעית נאום אקספרסיבי

מודל TTS רגשי ברמה אנושית מאומן על 100K שעות של נתוני דיבור.

Chatterbox

שיבוט אפס-ירייה שליטה ברגשות נאמנות גבוהה העברת סגנון שכפול דוגמיות בודד

שכפול קול חדשני של אפס יריות עם שליטה רגשית מ-Rescomple AI.

Tortoise TTS

האיכות הגבוהה ביותר רב־ קול ארכיטקטורת דאל-אי שיבוט קולי חזרה אוטומטית

רב-קולי טקסט לדיבור התמקד באיכות עם ארכיטקטורה אוטוגרסיבית.

איטי · 8GB VRAM נסה את זה.

StyleTTS 2

רמה אנושית דיפוזיה סגנון הכשרה יריבותית וריאציה טבעית נאמנות גבוהה

דרך דיפוזיה בסגנון ואימוני יריבות.

OpenVoice

שיבוט מיידי המרה קולית שליטה ברגשות שליטה במבטא רב לשונית

שיבוט קול מיידי עם שליטה בגרגירים על סגנון, רגש ומבטא.

Qwen3 TTS

9 קולות שנקבעו מראש עיצוב קול מטקסט שליטה ברגשות 10 שפות

TTS הרב לשוני של עליבא עם קולות מראש עיצוב קול מטקסט.

בינוני · 7GB VRAM נסה את זה.

VieNeu-TTS-v2

7 קולות מוגדרים מראש (המבטא הצפון-מערבי + דרום) החלפת קוד En-Vi שכפול קול (התייחסות 3-5) תמיכה בפודקאסט / רב־ רמקולים מעבד בלבד □ לא נדרש GPU

ויאטנמית + אנגלית, החלפת קוד TTS עם 7 קולות מראש ושיבוט קול אפס-ירייה.

מהיר · CPU VRAM נסה את זה.

Sesame CSM

שיחה תזמון טבעי Turn-taking ערוץ BackchannelComment פרמטרים 1B

מודל דיבור שיחה יוצר דיאלוג טבעי עם תזמון מתאים ורגש.

איטי · 8GB VRAM נסה את זה.

Chatterbox Turbo

Sub-200ms חבישהName תוויות פרלינגואיסטיות 6X בזמן אמת שיבוט קולי סימני מים

מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.

מהיר · 2GB VRAM נסה את זה.

VoxCPM

אודיו 44.1kHz ללא טוקן שכפול דו-לשוני הודעה@ title: window כוונון לורה עדין

TTS ללא Tokenizer מייצר 44.1kHz אודיו עם עקביות סעיף מודע הקשר.

מהיר · 4GB VRAM נסה את זה.

Kani TTS 2

3GB VRAM Ultra-מהיר משקל קל NanoCodc חופשי

מודל TTS אנגלי במשקל קל-Ultra פועל רק 3GB VRAM.

מהיר · 3GB VRAM נסה את זה.

OuteTTS

הגדרות מעבד הגדרות דפדפן Name פרופילים של דובר

TTS מבוסס LLM הפועל על מעבד, GPU, או דפדפן באמצעות לאמה.cpp ורובוטריקים.js.

איטי · 2GB VRAM נסה את זה.

VibeVoice

רב־ רמקולים עד 90 דקות יצירת פוד־ קסט עקביות רמקול 200 מ " מ הזרימה

Microsoft model for long-form speaker thing like podcasts and odiobooks.

מהיר · 4GB VRAM נסה את זה.

Pocket TTS

פרמטרים 100M הגדרות מעבד שיבוט קולי שיבוט חד-פעמית הקצה מוכן@ title: window

מודל פרמטר 100M במשקל קל על ידי Kyutai עם שיבוט קול מדגימה אחת.

מהיר · 1GB VRAM נסה את זה.

Kitten TTS

הגדרות מעבד בלבד פחות מ-80MB גודל המודל 8 קולות מובנים בקרת מהירות מבוסס ONNX פלט 24kHz

TTS אולטרה-משקל מתחת ל-80MB פועל על מעבד ללא GPU.

מהיר · 0GB VRAM נסה את זה.

CosyVoice3

זרימה דו־ סטרילית שליטה ברגשות שיבוט קולי בקרת מהירות/ נפח הוראה הבאה:

דור הבא עם רב לשונית TTS עם דו זרימה, שליטה ברגשות, ושיבוט קול אפס ירה.

מהיר · 4GB VRAM נסה את זה.

NAMAA Saudi TTS

ניב ערבי סעודיName ערבית רגילה מודרנית שכפול קול אפס-ירייה. שליטה ברגשות היגוי ילידי

ראשית פתוח TTS סעודי-ערבי ניב סעודי ילידי עם שיבוט קול chatterbox איכות.

בינוני · 6GB VRAM נסה את זה.

Darwin TTS

שיבוט קולי דו־ שיחיName FFN- blended 4 שפות ליבה עמוד שדרה Qwen3

Cross-modal Qwen3-TTS variant with FFN mightles invoiled from the Qwen3-1.7B language model for speaker multipual שיבוט.

בינוני · 7GB VRAM נסה את זה.

MOSS-TTSD

דיאלוג רב־ רמקולים עד 5 רמקולים שמע עקבי 60min שיבוט קולי Podcast- Optimized

דו־ שיח רב־ רמקולי ממשיך ליצור שיחות בסגנון פודקאסט עם עד 5 רמקולים ו ־ 60 דקות של אודיו עקבי.

בינוני · 12GB VRAM נסה את זה.

Ming-Omni TTS

פלט 44.1kHz שיבוט קולי שליטה ברגשות שליטה בדיאלקט דור BGM Compact 0. 5B

Compact 0.5B מודל דיבור אומני-מודל מכלול AI עם תפוקה גבוהה של 44.1kHz ושיבוט קול אפס-ירייה.

בינוני · 3GB VRAM נסה את זה.

MOSS-TTS Nano