AI חינם טקסט לדיבור

33+ מודלים של קוד פתוח. 273+ קולות, 33+ שפות, אין צורך בחשבון.

18K+
יוצרי
72K+
דורות
33+
דוגמניות AI
273+
קולות
0/500 תווים · נרשמים ל-5,000 דולר לדור. → חופשי
אוהב את ט.ט.ס.אי?

כל מה שאתה צריך לקול אל

30+ כלים מופעלים על ידי מודלים AI קוד פתוח

33+ מודלי AI VoiceName

האוסף המקיף ביותר של מודלי TTS בקוד פתוח בפלטפורמה אחת

KokoroKokoro חופשי

קוקורו הוא מודל של 82 מיליון פרמטרים של טקסט-to-speech שפוגשים הרבה מעל מעמד המשקל שלו. למרות גודלו הזעיר, הוא מייצר דיבור טבעי ומבטא להפליא. קוקורו תומך במספר שפות כולל אנגלית, יפנית, סינית וקוריאנית עם מגוון רב של קולות אקספרסיביים. הוא פועל במהירות רבה מאוד מהר יותר מ- 100x בזמן אמת על GPU.

הטוב ביותר עבור: TTS באיכות גבוהה עם השהיה מינימלית, יישומי הזרמה

נסה חופשי

PiperPiper חופשי

פייפר היא מנוע טקסט לדיבור קל שפותחה על ידי Rhaspy המשתמש ב- VITS ובארכיטקטורות של Larynx. היא פועלת באופן מלא על מעבד, מה שהופך אותו לאידיאלי למכשירי קצה, אוטומציה ביתית, ויישומים הדורשים TTS מקוון. עם יותר מ-100 קולות לאורך 30+ שפות, פייפר מעבירה נאום צליל טבעי במהירויות בזמן אמת אפילו על פטל פי 4.

הטוב ביותר עבור: תצוגה מקדימה מהירה, נגישות ויישומים מוטבעים

נסה חופשי

VITSVITS חופשי

VITS (Variational Inference with adversarial learning for end-to-end text to-Speech) היא שיטה מקבילה של TTS שיוצרת קול טבעי יותר מאשר מודלים עכשוויים של שני שלבים.

הטוב ביותר עבור: טקסט לדיבור כללי עם פרוסודיה טבעית

נסה חופשי

MeloTTSMeloTTS חופשי

Melotts by My Shell.ai היא ספריית TTS רב-לשונית התומכת באנגלית (באנגלית: American, British, Indian, Australian), ספרדית, סינית, יפנית וקוריאנית.

הטוב ביותר עבור: יישומי הפקה צורך מהיר, רב לשוני TTS

נסה חופשי

Kani TTS 2Kani TTS 2 חופשי

Kani-TTS-2 by NineNineS6 הוא מודל בעל משקל קל 400M הבנוי על עמוד שדרה ali LFM2 נוזלי עם NVIDIA NanoCodec. הוא פועל רק 3GB VRAM ומפיק 10 שניות של דיבור ב#2 שניות על A100 (RTF 0.2).

הטוב ביותר עבור: דור אנגלי מהיר על חומרה נמוכה VRAM, תצוגה מקדימה מהירה

נסה חופשי

OuteTTSOuteTTS חופשי

OutetTS מרחיב מודלים שפה גדולים עם יכולות טקסט-to-speech תוך שימור הארכיטקטורה המקורית. היא תומכת בכמה כיוונים כולל לאמה.cpp (CPU/GPU), מחבקת את רובוטריקי הפנים, ExLamaV2, VLM, ואפילו דפדפן הקלט באמצעות רובוטריקים.

הטוב ביותר עבור: פריסת קצה, TTS מבוסס דפדפן, סביבות מיקור נמוך

נסה חופשי

Pocket TTSPocket TTS חופשי

Pocket TTS by Kyutai (באנגלית: Pocket TTS by Kyutai) הוא דגם של 100 מ' של טקסט ל-speech, אשר פונקציות רבות מעל משקלו, הוא פועל ביעילות על מעבד, תומך בשיבוט קול אפס-ירייה מדגימת אודיו בודדת, ומייצר נאום בעל צליל טבעי.

הטוב ביותר עבור: פריסת משקל קל, סביבות מעבד בלבד, שיבוט קול מהיר

נסה חופשי

Kitten TTSKitten TTS חופשי

Kitten TTS על ידי KittenML הוא מודל בעל משקל קל במיוחד של טקסט לנאום שנבנה על גבי ONNX. עם גרסאות מ-15M ל-80M פרמטרים (25-80 MB על דיסק), הוא מספק סינתזת קול באיכות גבוהה על מעבד ללא צורך במעבד GPU. Features 8 מובנה-in, מהירות דיבור מתכווננת, ועיבוד טקסט מובנה למספרים, קימורים, ויחידות.

הטוב ביותר עבור: TTS קל מהיר, פריסת קצה, יישומי low-Laterense

נסה חופשי

Ming-Omni TTSMing-Omni TTS חופשי

Ming-omni-tts-0.5B by includingAI הוא מודל דיבור אומני-מודלי קומפקטי שנבנה על עמוד השדרה הצפוף BailingMMM עם מצפן זרימה על ידי Patch-by-Patch. מספק 44.1kHz פלט (כמעט CD), תומך בשיבוט קול אפס-shot מהתייחסות 3+ שנייה, וכולל ניבול קול מובנה / BGM דרך הוראות JSON.

הטוב ביותר עבור: פידליות דו-לשונית, משחק קול נשלט רגש, תוכן אודיו סיני

נסה חופשי

MOSS-TTS NanoMOSS-TTS Nano חופשי

MOSS-TTS-Nano-100M הוא הפסגה הקומפקטית של OpenMOSS 100M-paramer וריאציה של משפחת MOSS-TTS, שיתוף ארכיטקטורת טרנספורם עיכוב. מסחר באיכות השיא של מודל 8B עבור ~80x משקולות קטנות יותר ובדרגתיות נמוכות יותר ל-request VRAM, מה שהופך אותו מתאים לפריסה חופשית וגבוהה יותר.

הטוב ביותר עבור: Pree-tier TTS, ייצור נפח גבוה, שימוש אינטראקטיבי נמוך

נסה חופשי

BarkBark רגיל

מודל רובוטריק מבוסס טקסט-audio שיוצר דיבור מציאותי, מוסיקה, ואפקטים קוליים.

מפתח: Suno · רישיון: MIT

נסה את זה.

Bark SmallBark Small רגיל

גירסה קלה יותר של Bark עם הסקה מהירה יותר ושימוש בזיכרון נמוך יותר.

מפתח: Suno · רישיון: MIT

נסה את זה.

CosyVoice 2CosyVoice 2 רגיל

TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.

מפתח: Alibaba (Tongyi Lab) · רישיון: Apache 2.0

נסה את זה.

Dia TTSDia TTS רגיל

מודל דור דיאלוג רב רמקול שיוצר שיחות טבעיות בין רמקולים.

מפתח: Nari Labs · רישיון: Apache 2.0

נסה את זה.

Parler TTSParler TTS רגיל

תאר את הקול שאתה רוצה בשפה טבעית וParler יוצר דיבור תואם.

מפתח: Hugging Face · רישיון: Apache 2.0

נסה את זה.

IndexTTS-2IndexTTS-2 רגיל

TTS אפס ירה עם שליטה ברגשות דקים וגילוי גבוה.

מפתח: Index Team · רישיון: Bilibili Model License

נסה את זה.

Spark TTSSpark TTS רגיל

השיבוט הקולי TTS עם רגש ניתן לשליטה וסגנון דיבור באמצעות דחפים.

מפתח: SparkAudio · רישיון: CC BY-NC-SA 4.0

נסה את זה.

GPT-SoVITSGPT-SoVITS רגיל

כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.

מפתח: RVC-Boss · רישיון: MIT

נסה את זה.

OrpheusOrpheus רגיל

מודל TTS רגשי ברמה אנושית מאומן על 100K שעות של נתוני דיבור.

מפתח: Canopy Labs · רישיון: Llama 3.2 Community

נסה את זה.

Qwen3 TTSQwen3 TTS רגיל

TTS הרב לשוני של עליבא עם קולות מראש עיצוב קול מטקסט.

מפתח: Alibaba (Qwen) · רישיון: Apache 2.0

נסה את זה.

VieNeu-TTS-v2VieNeu-TTS-v2 רגיל

ויאטנמית + אנגלית, החלפת קוד TTS עם 7 קולות מראש ושיבוט קול אפס-ירייה.

מפתח: Phạm Nguyễn Ngọc Bảo · רישיון: Apache 2.0

נסה את זה.

Chatterbox TurboChatterbox Turbo רגיל

מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.

מפתח: Resemble AI · רישיון: MIT

נסה את זה.

VoxCPMVoxCPM רגיל

TTS ללא Tokenizer מייצר 44.1kHz אודיו עם עקביות סעיף מודע הקשר.

מפתח: OpenBMB · רישיון: Apache 2.0

נסה את זה.

VibeVoiceVibeVoice רגיל

Microsoft model for long-form speaker thing like podcasts and odiobooks.

מפתח: Microsoft · רישיון: MIT

נסה את זה.

CosyVoice3CosyVoice3 רגיל

דור הבא עם רב לשונית TTS עם דו זרימה, שליטה ברגשות, ושיבוט קול אפס ירה.

מפתח: Alibaba (FunAudioLLM) · רישיון: Apache 2.0

נסה את זה.

NAMAA Saudi TTSNAMAA Saudi TTS רגיל

ראשית פתוח TTS סעודי-ערבי ניב סעודי ילידי עם שיבוט קול chatterbox איכות.

מפתח: NAMAA Space · רישיון: MIT

נסה את זה.

Darwin TTSDarwin TTS רגיל

Cross-modal Qwen3-TTS variant with FFN mightles invoiled from the Qwen3-1.7B language model for speaker multipual שיבוט.

מפתח: FINAL-Bench · רישיון: Apache 2.0

נסה את זה.

MOSS-TTSDMOSS-TTSD רגיל

דו־ שיח רב־ רמקולי ממשיך ליצור שיחות בסגנון פודקאסט עם עד 5 רמקולים ו ־ 60 דקות של אודיו עקבי.

מפתח: OpenMOSS · רישיון: Apache 2.0

נסה את זה.

ChatterboxChatterbox פרמיום

שכפול קול חדשני של אפס יריות עם שליטה רגשית מ-Rescomple AI.

איכות:

נסה את זה.

Tortoise TTSTortoise TTS פרמיום

רב-קולי טקסט לדיבור התמקד באיכות עם ארכיטקטורה אוטוגרסיבית.

איכות:

נסה את זה.

StyleTTS 2StyleTTS 2 פרמיום

דרך דיפוזיה בסגנון ואימוני יריבות.

איכות:

נסה את זה.

OpenVoiceOpenVoice פרמיום

שיבוט קול מיידי עם שליטה בגרגירים על סגנון, רגש ומבטא.

איכות:

נסה את זה.

Sesame CSMSesame CSM פרמיום

מודל דיבור שיחה יוצר דיאלוג טבעי עם תזמון מתאים ורגש.

איכות:

נסה את זה.

CosyVoice 2CosyVoice 2

TTS הזרמת scalbaba של הזרמת עם טבע אנושי-parity וכמעט אפס חבישה.

שפות: en, zh, ja, ko, fr, de, it, es

שכפול קול

IndexTTS-2IndexTTS-2

TTS אפס ירה עם שליטה ברגשות דקים וגילוי גבוה.

שפות: en, zh

שכפול קול

Spark TTSSpark TTS

השיבוט הקולי TTS עם רגש ניתן לשליטה וסגנון דיבור באמצעות דחפים.

שפות: en, zh

שכפול קול

GPT-SoVITSGPT-SoVITS

כמה יריות קול שיבוט TTS שמשכפל כל קול מ רק 5 שניות של אודיו.

שפות: en, zh, ja, ko

שכפול קול

ChatterboxChatterbox

שכפול קול חדשני של אפס יריות עם שליטה רגשית מ-Rescomple AI.

שפות: en

שכפול קול

Tortoise TTSTortoise TTS

רב-קולי טקסט לדיבור התמקד באיכות עם ארכיטקטורה אוטוגרסיבית.

שפות: en

שכפול קול

OpenVoiceOpenVoice

שיבוט קול מיידי עם שליטה בגרגירים על סגנון, רגש ומבטא.

שפות: en, zh, ja, ko, fr, es

שכפול קול

VieNeu-TTS-v2VieNeu-TTS-v2

ויאטנמית + אנגלית, החלפת קוד TTS עם 7 קולות מראש ושיבוט קול אפס-ירייה.

שפות: vi, en

שכפול קול

Chatterbox TurboChatterbox Turbo

מהר יותר Chatterbox עם תת 200ms חבישה ותגיות paralinguistic לצחוק, שיעול, ועוד.

שפות: en

שכפול קול

VoxCPMVoxCPM

TTS ללא Tokenizer מייצר 44.1kHz אודיו עם עקביות סעיף מודע הקשר.

שפות: en, zh

שכפול קול

OuteTTSOuteTTS

TTS מבוסס LLM הפועל על מעבד, GPU, או דפדפן באמצעות לאמה.cpp ורובוטריקים.js.

שפות: en

שכפול קול

Pocket TTSPocket TTS

מודל פרמטר 100M במשקל קל על ידי Kyutai עם שיבוט קול מדגימה אחת.

שפות: en, fr

שכפול קול

CosyVoice3CosyVoice3

דור הבא עם רב לשונית TTS עם דו זרימה, שליטה ברגשות, ושיבוט קול אפס ירה.

שפות: en, zh, ja, ko, de, es, fr, it, ru

שכפול קול

NAMAA Saudi TTSNAMAA Saudi TTS

ראשית פתוח TTS סעודי-ערבי ניב סעודי ילידי עם שיבוט קול chatterbox איכות.

שפות: ar

שכפול קול

Darwin TTSDarwin TTS

Cross-modal Qwen3-TTS variant with FFN mightles invoiled from the Qwen3-1.7B language model for speaker multipual שיבוט.

שפות: en, ko, ja, zh

שכפול קול

MOSS-TTSDMOSS-TTSD

דו־ שיח רב־ רמקולי ממשיך ליצור שיחות בסגנון פודקאסט עם עד 5 רמקולים ו ־ 60 דקות של אודיו עקבי.

שפות: en, zh

שכפול קול

Ming-Omni TTSMing-Omni TTS

Compact 0.5B מודל דיבור אומני-מודל מכלול AI עם תפוקה גבוהה של 44.1kHz ושיבוט קול אפס-ירייה.

שפות: en, zh

שכפול קול

MOSS-TTS NanoMOSS-TTS Nano

100M MOSTTS זעיר וריאציה אותו אדריכלות, 80x קטן יותר, חבישה חופשית יותר.

שפות: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

שכפול קול

מפתח API ראשון

OpenAI-התאמה מנוחה API נקודה אחת, 22+ מודלים תמיכה הזרמת ליישומים בזמן אמת.

  • פורמט תואם OpenAI
  • הזרמת TTS עבור יישומים בזמן אמת
  • עיבוד Batch עבור עבודות גדולות
  • הודעות Webhook
תצוגה של API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Princing פשוט, שקוף

תתחיל להשתחרר, תמדדי ככל שתגדלי.

חופשי

$0

15,000 תווים + 5,000 / יום

  • 7 דגמים בחינם כולל קוקורו
  • 5,000 chars לכל דור
  • גישה API כלולה
הרשמה חופשית

התחל@ title: window

$9/מו

500 נקודות/ חודשים

  • כל 22 הדוגמניות.
  • 100,000 chars לכל דור
  • שיכפול קול
התחל לעבוד
הפופולרי ביותר

בעד

$29/מו

2,000 נקודות/ חודש

  • הכל בהתחלות@ item: inlistbox
  • גישה ל- API
  • עיבוד עדיפות
קבל פרו

עסקים

$99/מו

10,000 נקודות/ חודש

  • הכל במקצוען.
  • Bulk API
  • תור עדיפות
קבל עסקים

הצג את כל התוכניות כולל חפיסות תווים →

שאלות ששואלים לעתים קרובות

TTS.ai הוא פלטפורמת הקול המקיפה ביותר של AI, מציע 22+ מודלים של טקסט לדיבור, שיבוט קול, דיבור לטקסט, וכלי שמע.

כן! TTS.ai מציע טקסט-to-speech חינם עם Kokoro, פייפר, VITS, ומודלים Melotts. אין צורך בחשבון. הרשמה עד 15,000 תווים חינם וגישה לכל המודלים. תוכניות בתשלום להתחיל ב -9/ חודשים.

עבור מהירות, השתמש בקוקורו או פייפר. עבור איכות, נסה Cosy Voice 2 או StyleTS 2. עבור שיבוט קול, השתמש בצ'אטרבוקס או GPT-SOVITS. עבור דו־ שיח, השתמש בדיה TTS. נסה דגמים מרובים באותו טקסט כדי להשוות.

כן. OpenAI- Compatable מנוחה API for TTS, STT, קול שיבוט, וכלי שמע. כלול בכל תוכנית כולל חינם, עם גבולות שיעור שקנה מידה לפי רובד (חופשי: 10 req/min, לייט: 20, Starter: 30, Pro: 60, Business: 300. View תיעוד at tts.ai/ api/.

איכות הקול משתנה על ידי מודל. מודלים פרימיום כמו Cosy Voice 2, סגנון TTS 2, וChatterbox מייצר נאום איכות כמעט אנושי עם אינפורמציה טבעית ורגש. מודלים חופשיים כמו Kokoro להציע איכות מצוינת עבור רוב המקרים השימוש.

TTS.ai תומכים ב-30 שפות ברחבי ספריית המודל שלה. באנגלית יש את התמיכה המודלת הרחבה ביותר, אך מודלים כמו Cosy Voice 2 מכסים סינית, יפנית וקוריאנית; GPT-SOVITS מטפלים בסינית, יפנית, קוריאנית ואנגלית; ו-MeloTS תומכים באנגלית, ספרדית, צרפתית, סינית, יפנית, קוריאנית וקוריאנית.

כן כל העיבוד מתרחש בשרתי GPU המסורים שלנו אנחנו לא מאחסנים את קלט הטקסט שלך או מייצרים אודיו לאחר הלידה. דוגמיות קוליות מועלות משמשות רק עבור ההפעלה הנוכחית ולא נשמרות. אנחנו אף פעם לא חולקים את המידע שלך עם מפלגות שלישיות או משתמשים בו כדי לאמן מודלים.

כן, כל האודיו שנוצר על TTS.ai הוא שלך לשימוש מסחרי, כולל סרטי וידאו ביוטיוב, פודקאסטים, אודיו, אפליקציות, פרסומות ומוצרים. המודלים שלנו הם מקור פתוח תחת רישיון מתירני (MIT, Apache 2.0).

TTS.ai מייצר אודיו בפורמט WAV כברירת מחדל לאיכות מקסימלית. באפשרותך להמיר ל- MP3, FLAC, OGG, או M4A תוך שימוש בכלי ממיר השמע החופשי שלנו. ה- API תומך בהגדרת תבנית הפלט המועדפת עליך ישירות לבקשה.

העלה מדגם אודיו קצר (כחמש שניות) של הקול שאתה רוצה לשכפל, ואז הקלד כל טקסט כדי ליצור דיבור בקול זה. מודלים כמו צ'אטרבוקס, GPT-SOVITS, ו- Cosy Voice תומכים בשיבוט קול. הקול המשובט לוכד צליל, מבטא, וסגנון דיבור.

מודלים חופשיים (Kokoro, Fiper, VITS, MeloTS) אינם דורשים חשבון ומחיר אפס תווים. מודלים סטנדרטיים (2,000 תווים/1K קלט) כוללים Bark, Cosy Voice 2, F5-TTS, ודיה. דגמי פרמיום (4,000 תווים/1K קלט) כוללים Open Voice, Chatterbox, StyTS 2, ו-Tortois. מודלים בתשלום בדרך כלל מציעים איכות גבוהה יותר, קולות נוספים כמו שיבוט קול.

כן. API תומך בעיבוד אצווה עבור המרת כרכים גדולים של טקסט לדיבור. שלח בקשות מרובות והחזר תוצאות מסונכרנות תוך שימוש בעבודה UUIDs. התוכנית העסקית ($99/mo) וגבוהה יותר כוללת גישה לתור עדיפות לעיבוד אצווה מהיר יותר. אידיאלי לייצור אודיובוק, תוכן קורס, ופרוייקטים קוליים בקנה מידה גדול.
4.1/5 (42)

המשוב שלך עוזר לנו לפתור בעיות.

התחל להשתמש בקול AI היום

הצטרפו ליוצרים, מפתחים ועסקים בעזרת TTS.ai