AI חינם טקסט לדיבור
33+ מודלים של קוד פתוח. 273+ קולות, 33+ שפות, אין צורך בחשבון.
כל מה שאתה צריך לקול אל
30+ כלים מופעלים על ידי מודלים AI קוד פתוח
33+ מודלי AI VoiceName
האוסף המקיף ביותר של מודלי TTS בקוד פתוח בפלטפורמה אחת
Kokoro חופשי
קוקורו הוא מודל של 82 מיליון פרמטרים של טקסט-to-speech שפוגשים הרבה מעל מעמד המשקל שלו. למרות גודלו הזעיר, הוא מייצר דיבור טבעי ומבטא להפליא. קוקורו תומך במספר שפות כולל אנגלית, יפנית, סינית וקוריאנית עם מגוון רב של קולות אקספרסיביים. הוא פועל במהירות רבה מאוד מהר יותר מ- 100x בזמן אמת על GPU.
הטוב ביותר עבור: TTS באיכות גבוהה עם השהיה מינימלית, יישומי הזרמה
נסה חופשי
Piper חופשי
פייפר היא מנוע טקסט לדיבור קל שפותחה על ידי Rhaspy המשתמש ב- VITS ובארכיטקטורות של Larynx. היא פועלת באופן מלא על מעבד, מה שהופך אותו לאידיאלי למכשירי קצה, אוטומציה ביתית, ויישומים הדורשים TTS מקוון. עם יותר מ-100 קולות לאורך 30+ שפות, פייפר מעבירה נאום צליל טבעי במהירויות בזמן אמת אפילו על פטל פי 4.
הטוב ביותר עבור: תצוגה מקדימה מהירה, נגישות ויישומים מוטבעים
נסה חופשי
VITS חופשי
VITS (Variational Inference with adversarial learning for end-to-end text to-Speech) היא שיטה מקבילה של TTS שיוצרת קול טבעי יותר מאשר מודלים עכשוויים של שני שלבים.
הטוב ביותר עבור: טקסט לדיבור כללי עם פרוסודיה טבעית
נסה חופשי
MeloTTS חופשי
Melotts by My Shell.ai היא ספריית TTS רב-לשונית התומכת באנגלית (באנגלית: American, British, Indian, Australian), ספרדית, סינית, יפנית וקוריאנית.
הטוב ביותר עבור: יישומי הפקה צורך מהיר, רב לשוני TTS
נסה חופשי
Kani TTS 2 חופשי
Kani-TTS-2 by NineNineS6 הוא מודל בעל משקל קל 400M הבנוי על עמוד שדרה ali LFM2 נוזלי עם NVIDIA NanoCodec. הוא פועל רק 3GB VRAM ומפיק 10 שניות של דיבור ב#2 שניות על A100 (RTF 0.2).
הטוב ביותר עבור: דור אנגלי מהיר על חומרה נמוכה VRAM, תצוגה מקדימה מהירה
נסה חופשי
OuteTTS חופשי
OutetTS מרחיב מודלים שפה גדולים עם יכולות טקסט-to-speech תוך שימור הארכיטקטורה המקורית. היא תומכת בכמה כיוונים כולל לאמה.cpp (CPU/GPU), מחבקת את רובוטריקי הפנים, ExLamaV2, VLM, ואפילו דפדפן הקלט באמצעות רובוטריקים.
הטוב ביותר עבור: פריסת קצה, TTS מבוסס דפדפן, סביבות מיקור נמוך
נסה חופשי
Pocket TTS חופשי
Pocket TTS by Kyutai (באנגלית: Pocket TTS by Kyutai) הוא דגם של 100 מ' של טקסט ל-speech, אשר פונקציות רבות מעל משקלו, הוא פועל ביעילות על מעבד, תומך בשיבוט קול אפס-ירייה מדגימת אודיו בודדת, ומייצר נאום בעל צליל טבעי.
הטוב ביותר עבור: פריסת משקל קל, סביבות מעבד בלבד, שיבוט קול מהיר
נסה חופשי
Kitten TTS חופשי
Kitten TTS על ידי KittenML הוא מודל בעל משקל קל במיוחד של טקסט לנאום שנבנה על גבי ONNX. עם גרסאות מ-15M ל-80M פרמטרים (25-80 MB על דיסק), הוא מספק סינתזת קול באיכות גבוהה על מעבד ללא צורך במעבד GPU. Features 8 מובנה-in, מהירות דיבור מתכווננת, ועיבוד טקסט מובנה למספרים, קימורים, ויחידות.
הטוב ביותר עבור: TTS קל מהיר, פריסת קצה, יישומי low-Laterense
נסה חופשי
Ming-Omni TTS חופשי
Ming-omni-tts-0.5B by includingAI הוא מודל דיבור אומני-מודלי קומפקטי שנבנה על עמוד השדרה הצפוף BailingMMM עם מצפן זרימה על ידי Patch-by-Patch. מספק 44.1kHz פלט (כמעט CD), תומך בשיבוט קול אפס-shot מהתייחסות 3+ שנייה, וכולל ניבול קול מובנה / BGM דרך הוראות JSON.
הטוב ביותר עבור: פידליות דו-לשונית, משחק קול נשלט רגש, תוכן אודיו סיני
נסה חופשי
MOSS-TTS Nano חופשי
MOSS-TTS-Nano-100M הוא הפסגה הקומפקטית של OpenMOSS 100M-paramer וריאציה של משפחת MOSS-TTS, שיתוף ארכיטקטורת טרנספורם עיכוב. מסחר באיכות השיא של מודל 8B עבור ~80x משקולות קטנות יותר ובדרגתיות נמוכות יותר ל-request VRAM, מה שהופך אותו מתאים לפריסה חופשית וגבוהה יותר.
הטוב ביותר עבור: Pree-tier TTS, ייצור נפח גבוה, שימוש אינטראקטיבי נמוך
נסה חופשי
Bark רגיל
מודל רובוטריק מבוסס טקסט-audio שיוצר דיבור מציאותי, מוסיקה, ואפקטים קוליים.
מפתח: Suno · רישיון: MIT
נסה את זה.
Bark Small רגיל
גירסה קלה יותר של Bark עם הסקה מהירה יותר ושימוש בזיכרון נמוך יותר.
מפתח: Suno · רישיון: MIT
נסה את זה.
CosyVoice 2 רגיל
TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.
מפתח: Alibaba (Tongyi Lab) · רישיון: Apache 2.0
נסה את זה.
Dia TTS רגיל
מודל דור דיאלוג רב רמקול שיוצר שיחות טבעיות בין רמקולים.
מפתח: Nari Labs · רישיון: Apache 2.0
נסה את זה.
Parler TTS רגיל
תאר את הקול שאתה רוצה בשפה טבעית וParler יוצר דיבור תואם.
מפתח: Hugging Face · רישיון: Apache 2.0
נסה את זה.
IndexTTS-2 רגיל
TTS אפס ירה עם שליטה ברגשות דקים וגילוי גבוה.
מפתח: Index Team · רישיון: Bilibili Model License
נסה את זה.
Spark TTS רגיל
השיבוט הקולי TTS עם רגש ניתן לשליטה וסגנון דיבור באמצעות דחפים.
מפתח: SparkAudio · רישיון: CC BY-NC-SA 4.0
נסה את זה.
GPT-SoVITS רגיל
כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.
מפתח: RVC-Boss · רישיון: MIT
נסה את זה.
Orpheus רגיל
מודל TTS רגשי ברמה אנושית מאומן על 100K שעות של נתוני דיבור.
מפתח: Canopy Labs · רישיון: Llama 3.2 Community
נסה את זה.
Qwen3 TTS רגיל
TTS הרב לשוני של עליבא עם קולות מראש עיצוב קול מטקסט.
מפתח: Alibaba (Qwen) · רישיון: Apache 2.0
נסה את זה.
VieNeu-TTS-v2 רגיל
ויאטנמית + אנגלית, החלפת קוד TTS עם 7 קולות מראש ושיבוט קול אפס-ירייה.
מפתח: Phạm Nguyễn Ngọc Bảo · רישיון: Apache 2.0
נסה את זה.
Chatterbox Turbo רגיל
מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.
מפתח: Resemble AI · רישיון: MIT
נסה את זה.
VoxCPM רגיל
TTS ללא Tokenizer מייצר 44.1kHz אודיו עם עקביות סעיף מודע הקשר.
מפתח: OpenBMB · רישיון: Apache 2.0
נסה את זה.
VibeVoice רגיל
Microsoft model for long-form speaker thing like podcasts and odiobooks.
מפתח: Microsoft · רישיון: MIT
נסה את זה.
CosyVoice3 רגיל
דור הבא עם רב לשונית TTS עם דו זרימה, שליטה ברגשות, ושיבוט קול אפס ירה.
מפתח: Alibaba (FunAudioLLM) · רישיון: Apache 2.0
נסה את זה.
NAMAA Saudi TTS רגיל
ראשית פתוח TTS סעודי-ערבי ניב סעודי ילידי עם שיבוט קול chatterbox איכות.
מפתח: NAMAA Space · רישיון: MIT
נסה את זה.
Darwin TTS רגיל
Cross-modal Qwen3-TTS variant with FFN mightles invoiled from the Qwen3-1.7B language model for speaker multipual שיבוט.
מפתח: FINAL-Bench · רישיון: Apache 2.0
נסה את זה.
MOSS-TTSD רגיל
דו־ שיח רב־ רמקולי ממשיך ליצור שיחות בסגנון פודקאסט עם עד 5 רמקולים ו ־ 60 דקות של אודיו עקבי.
מפתח: OpenMOSS · רישיון: Apache 2.0
נסה את זה.
CosyVoice 2
TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.
שפות: en, zh, ja, ko, fr, de, it, es
שכפול קול
GPT-SoVITS
כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.
שפות: en, zh, ja, ko
שכפול קול
OpenVoice
שיבוט קול מיידי עם שליטה בגרגירים על סגנון, רגש ומבטא.
שפות: en, zh, ja, ko, fr, es
שכפול קול
VieNeu-TTS-v2
ויאטנמית + אנגלית, החלפת קוד TTS עם 7 קולות מראש ושיבוט קול אפס-ירייה.
שפות: vi, en
שכפול קול
Chatterbox Turbo
מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.
שפות: en
שכפול קול
OuteTTS
TTS מבוסס LLM הפועל על מעבד, GPU, או דפדפן באמצעות לאמה.cpp ורובוטריקים.js.
שפות: en
שכפול קול
CosyVoice3
דור הבא עם רב לשונית TTS עם דו זרימה, שליטה ברגשות, ושיבוט קול אפס ירה.
שפות: en, zh, ja, ko, de, es, fr, it, ru
שכפול קול
NAMAA Saudi TTS
ראשית פתוח TTS סעודי-ערבי ניב סעודי ילידי עם שיבוט קול chatterbox איכות.
שפות: ar
שכפול קול
Darwin TTS
Cross-modal Qwen3-TTS variant with FFN mightles invoiled from the Qwen3-1.7B language model for speaker multipual שיבוט.
שפות: en, ko, ja, zh
שכפול קול
MOSS-TTSD
דו־ שיח רב־ רמקולי ממשיך ליצור שיחות בסגנון פודקאסט עם עד 5 רמקולים ו ־ 60 דקות של אודיו עקבי.
שפות: en, zh
שכפול קול
Ming-Omni TTS
Compact 0.5B מודל דיבור אומני-מודל מכלול AI עם תפוקה גבוהה של 44.1kHz ושיבוט קול אפס-ירייה.
שפות: en, zh
שכפול קול
MOSS-TTS Nano
100M MOSTTS זעיר וריאציה אותו אדריכלות, 80x קטן יותר, חבישה חופשית יותר.
שפות: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
שכפול קולמפתח API ראשון
OpenAI-התאמה מנוחה API נקודה אחת, 22+ מודלים תמיכה הזרמת ליישומים בזמן אמת.
- פורמט תואם OpenAI
- הזרמת TTS עבור יישומים בזמן אמת
- עיבוד Batch עבור עבודות גדולות
- הודעות Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Princing פשוט, שקוף
תתחיל להשתחרר, תמדדי ככל שתגדלי.
חופשי
15,000 תווים + 5,000 / יום
- 7 דגמים בחינם כולל קוקורו
- 5,000 chars לכל דור
- גישה API כלולה
התחל@ title: window
500 נקודות/ חודשים
- כל 22 הדוגמניות.
- 100,000 chars לכל דור
- שיכפול קול
בעד
2,000 נקודות/ חודש
- הכל בהתחלות@ item: inlistbox
- גישה ל- API
- עיבוד עדיפות
שאלות ששואלים לעתים קרובות
המשוב שלך עוזר לנו לפתור בעיות.