AI חינם טקסט לדיבור
22+ מודלי קוד פתוח, 100+ קולות, 32+ שפות, אין צורך בחשבון.
כל מה שאתה צריך לקול אל
26 כלים שמופעלים על ידי 24+ מודלי קוד פתוח AI
22 + AI Voice Models
האוסף המקיף ביותר של מודלי TTS בקוד פתוח בפלטפורמה אחת
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
הטוב ביותר עבור: High-quality TTS with minimal latency, streaming applications
נסה חופשי
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
הטוב ביותר עבור: Quick previews, accessibility, and embedded applications
נסה חופשי
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
הטוב ביותר עבור: General-purpose text-to-speech with natural prosody
נסה חופשי
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
הטוב ביותר עבור: יישומי הפקה צורך מהיר, רב לשוני TTS
נסה חופשי
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
מפתח: Suno · רישיון: MIT
נסה את זה.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
מפתח: Suno · רישיון: MIT
נסה את זה.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
מפתח: Alibaba (Tongyi Lab) · רישיון: Apache 2.0
נסה את זה.
Dia TTS Standard
מודל דור דיאלוג רב רמקול שיוצר שיחות טבעיות בין רמקולים.
מפתח: Nari Labs · רישיון: Apache 2.0
נסה את זה.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
מפתח: Hugging Face · רישיון: Apache 2.0
נסה את זה.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
מפתח: Index Team · רישיון: Apache 2.0
נסה את זה.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
מפתח: SparkAudio · רישיון: Apache 2.0
נסה את זה.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
מפתח: RVC-Boss · רישיון: MIT
נסה את זה.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
מפתח: Canopy Labs · רישיון: Llama 3.2 Community
נסה את זה.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
מפתח: Alibaba (Qwen) · רישיון: Apache 2.0
נסה את זה.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
שפות: en, zh, ja, ko, fr, de, it, es
שכפול קול
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
שפות: en, zh
שכפול קול
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
שפות: en, zh
שכפול קול
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
שפות: en, zh, ja, ko
שכפול קול
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
שפות: en, zh, ja, ko, fr, de, es, it
שכפול קול
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
שפות: en, zh, ja, ko, de, fr, ru, pt, es, it
שכפול קולמפתח API ראשון
OpenAI-התאמה מנוחה API נקודה אחת, 22+ מודלים תמיכה הזרמת ליישומים בזמן אמת.
- פורמט תואם OpenAI
- הזרמת TTS עבור יישומים בזמן אמת
- עיבוד Batch עבור עבודות גדולות
- הודעות Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Princing פשוט, שקוף
תתחיל להשתחרר, תמדדי ככל שתגדלי.
חופשי
50 קרדיטים
- Kokoro, Piper, VITS, MeloTTS
- מגבלה של 500 תווים
- 3 Gen/ hour (ללא חשבון)
התחל@ title: window
500 נקודות/ חודשים
- כל 22 הדוגמניות.
- הגבלה של 5,000 תווים
- שיכפול קול
בעד
2,000 נקודות/ חודש
- הכל בהתחלות@ item: inlistbox
- גישה ל- API
- עיבוד עדיפות