AI חינם טקסט לדיבור
31+ מודלים של קוד פתוח. 231+ קולות, 34+ שפות, אין צורך בחשבון.
כל מה שאתה צריך לקול אל
30+ כלים מופעלים על ידי מודלים AI קוד פתוח
31+ מודלי AI VoiceName
האוסף המקיף ביותר של מודלי TTS בקוד פתוח בפלטפורמה אחת
Kokoro Free
קוקורו הוא מודל של 82 מיליון פרמטרים של טקסט-to-speech שפוגשים הרבה מעל מעמד המשקל שלו. למרות גודלו הזעיר, הוא מייצר דיבור טבעי ומבטא להפליא. קוקורו תומך במספר שפות כולל אנגלית, יפנית, סינית וקוריאנית עם מגוון רב של קולות אקספרסיביים. הוא פועל במהירות רבה מאוד מהר יותר מ- 100x בזמן אמת על GPU.
הטוב ביותר עבור: TTS באיכות גבוהה עם השהיה מינימלית, יישומי הזרמה
נסה חופשי
Piper Free
פייפר היא מנוע טקסט לדיבור קל שפותחה על ידי Rhaspy המשתמש ב- VITS ובארכיטקטורות של Larynx. היא פועלת באופן מלא על מעבד, מה שהופך אותו לאידיאלי למכשירי קצה, אוטומציה ביתית, ויישומים הדורשים TTS מקוון. עם יותר מ-100 קולות לאורך 30+ שפות, פייפר מעבירה נאום צליל טבעי במהירויות בזמן אמת אפילו על פטל פי 4.
הטוב ביותר עבור: תצוגה מקדימה מהירה, נגישות ויישומים מוטבעים
נסה חופשי
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end text to-Speech) היא שיטה מקבילה של TTS שיוצרת קול טבעי יותר מאשר מודלים עכשוויים של שני שלבים.
הטוב ביותר עבור: טקסט לדיבור כללי עם פרוסודיה טבעית
נסה חופשי
MeloTTS Free
Melotts by My Shell.ai היא ספריית TTS רב-לשונית התומכת באנגלית (באנגלית: American, British, Indian, Australian), ספרדית, סינית, יפנית וקוריאנית.
הטוב ביותר עבור: יישומי הפקה צורך מהיר, רב לשוני TTS
נסה חופשי
OuteTTS Free
OutetTS מרחיב מודלים שפה גדולים עם יכולות טקסט-to-speech תוך שימור הארכיטקטורה המקורית. היא תומכת בכמה כיוונים כולל לאמה.cpp (CPU/GPU), מחבקת את רובוטריקי הפנים, ExLamaV2, VLM, ואפילו דפדפן הקלט באמצעות רובוטריקים.
הטוב ביותר עבור: פריסת קצה, TTS מבוסס דפדפן, סביבות מיקור נמוך
נסה חופשי
Pocket TTS Free
Pocket TTS by Kyutai (באנגלית: Pocket TTS by Kyutai) הוא דגם של 100 מ' של טקסט ל-speech, אשר פונקציות רבות מעל משקלו, הוא פועל ביעילות על מעבד, תומך בשיבוט קול אפס-ירייה מדגימת אודיו בודדת, ומייצר נאום בעל צליל טבעי.
הטוב ביותר עבור: פריסת משקל קל, סביבות מעבד בלבד, שיבוט קול מהיר
נסה חופשי
Kitten TTS Free
Kitten TTS על ידי KittenML הוא מודל בעל משקל קל במיוחד של טקסט לנאום שנבנה על גבי ONNX. עם גרסאות מ-15M ל-80M פרמטרים (25-80 MB על דיסק), הוא מספק סינתזת קול באיכות גבוהה על מעבד ללא צורך במעבד GPU. Features 8 מובנה-in, מהירות דיבור מתכווננת, ועיבוד טקסט מובנה למספרים, קימורים, ויחידות.
הטוב ביותר עבור: TTS קל מהיר, פריסת קצה, יישומי low-Laterense
נסה חופשי
Bark Standard
מודל רובוטריק מבוסס טקסט-audio שיוצר דיבור מציאותי, מוסיקה, ואפקטים קוליים.
מפתח: Suno · רישיון: MIT
נסה את זה.
Bark Small Standard
גירסה קלה יותר של Bark עם הסקה מהירה יותר ושימוש בזיכרון נמוך יותר.
מפתח: Suno · רישיון: MIT
נסה את זה.
CosyVoice 2 Standard
TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.
מפתח: Alibaba (Tongyi Lab) · רישיון: Apache 2.0
נסה את זה.
Dia TTS Standard
מודל דור דיאלוג רב רמקול שיוצר שיחות טבעיות בין רמקולים.
מפתח: Nari Labs · רישיון: Apache 2.0
נסה את זה.
Parler TTS Standard
תאר את הקול שאתה רוצה בשפה טבעית וParler יוצר דיבור תואם.
מפתח: Hugging Face · רישיון: Apache 2.0
נסה את זה.
GLM-TTS Standard
משיג את שיעור השגיאות הנמוך ביותר בין מודלי TTS של קוד פתוח.
מפתח: Zhipu AI · רישיון: GLM-4 License
נסה את זה.
IndexTTS-2 Standard
TTS אפס ירה עם שליטה ברגשות דקים וגילוי גבוה.
מפתח: Index Team · רישיון: Bilibili Model License
נסה את זה.
Spark TTS Standard
השיבוט הקולי TTS עם רגש ניתן לשליטה וסגנון דיבור באמצעות דחפים.
מפתח: SparkAudio · רישיון: CC BY-NC-SA 4.0
נסה את זה.
GPT-SoVITS Standard
כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.
מפתח: RVC-Boss · רישיון: MIT
נסה את זה.
Orpheus Standard
מודל TTS רגשי ברמה אנושית מאומן על 100K שעות של נתוני דיבור.
מפתח: Canopy Labs · רישיון: Llama 3.2 Community
נסה את זה.
Qwen3 TTS Standard
TTS הרב לשוני של עליבא עם שיבוט קול, קולות שנקבעו מראש, ועיצוב קול מטקסט.
מפתח: Alibaba (Qwen) · רישיון: Apache 2.0
נסה את זה.
Chatterbox Turbo Standard
מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.
מפתח: Resemble AI · רישיון: MIT
נסה את זה.
Dia 2 Standard
הזרמת TTS השיחה הראשונה עם דיאלוג רב רמקולים ורמזים פרלינגואיסטיים.
מפתח: Nari Labs · רישיון: Apache 2.0
נסה את זה.
VoxCPM Standard
TTS ללא Tokenizer מייצר 44.1kHz אודיו עם עקביות סעיף מודע הקשר.
מפתח: OpenBMB · רישיון: Apache 2.0
נסה את זה.
TADA Standard
TTS הזיית אפס עם יישור כפול טקסט-אקוסטי, 5x מהיר יותר מאשר TTS LLM דומה.
מפתח: Hume AI · רישיון: MIT
נסה את זה.
VibeVoice Standard
Microsoft model for long-form speaker thing like podcasts and odiobooks.
מפתח: Microsoft · רישיון: MIT
נסה את זה.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
מפתח: Alibaba (FunAudioLLM) · רישיון: Apache 2.0
נסה את זה.
CosyVoice 2
TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.
שפות: en, zh, ja, ko, fr, de, it, es
שכפול קול
GPT-SoVITS
כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.
שפות: en, zh, ja, ko
שכפול קול
OpenVoice
שיבוט קול מיידי עם שליטה בגרגירים על סגנון, רגש ומבטא.
שפות: en, zh, ja, ko, fr, de, es, it
שכפול קול
Qwen3 TTS
TTS הרב לשוני של עליבא עם שיבוט קול, קולות שנקבעו מראש, ועיצוב קול מטקסט.
שפות: en, zh, ja, ko, de, fr, ru, pt, es, it
שכפול קול
Chatterbox Turbo
מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.
שפות: en
שכפול קול
OuteTTS
TTS מבוסס LLM הפועל על מעבד, GPU, או דפדפן באמצעות לאמה.cpp ורובוטריקים.js.
שפות: en
שכפול קול
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
שפות: en, zh, ja, ko, de, es, fr, it, ru
שכפול קול
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
שפות: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
שכפול קול
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
שפות: en, zh
שכפול קולמפתח API ראשון
OpenAI-התאמה מנוחה API נקודה אחת, 22+ מודלים תמיכה הזרמת ליישומים בזמן אמת.
- פורמט תואם OpenAI
- הזרמת TTS עבור יישומים בזמן אמת
- עיבוד Batch עבור עבודות גדולות
- הודעות Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Princing פשוט, שקוף
תתחיל להשתחרר, תמדדי ככל שתגדלי.
חופשי
15 קרדיטים
- Kokoro, Piper, VITS, MeloTTS
- מגבלה של 500 תווים
- 3 Gen/ hour (ללא חשבון)
התחל@ title: window
500 נקודות/ חודשים
- כל 22 הדוגמניות.
- 100,000 chars לכל דור
- שיכפול קול
בעד
2,000 נקודות/ חודש
- הכל בהתחלות@ item: inlistbox
- גישה ל- API
- עיבוד עדיפות
שאלות ששואלים לעתים קרובות
המשוב שלך עוזר לנו לפתור בעיות.