الذكاء الاصطناعي المجاني تحويل النص إلى كلمة
22+ نماذج مفتوحة المصدر، 100+ أصوات، 32+ لا يلزم إنشاء حساب.
كل ما تحتاجه للذكاء الاصطناعي الصوتي
26 أداة مدعومة بأكثر من 24 نموذجاً مفتوح المصدر للذكاء الاصطناعي
22+ نماذج صوت الذكاء الاصطناعي
أشمل مجموعة من نماذج تكنولوجيا المعلومات والاتصالات المفتوحة المصدر في منصة واحدة
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
أفضل ل: High-quality TTS with minimal latency, streaming applications
تجربة مجانيةPiper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
أفضل ل: Quick previews, accessibility, and embedded applications
تجربة مجانيةVITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
أفضل ل: General-purpose text-to-speech with natural prosody
تجربة مجانيةMeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
أفضل ل: تطبيقات الإنتاج التي تحتاج إلى ترجمة تلقائية سريعة ومتعددة اللغات
تجربة مجانيةBark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
مطوّر: Suno · الترخيص: MIT
جربهاBark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
مطوّر: Suno · الترخيص: MIT
جربهاCosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
مطوّر: Alibaba (Tongyi Lab) · الترخيص: Apache 2.0
جربهاDia TTS Standard
نموذج توليد حوار متعدد المتكلمين يخلق محادثات طبيعية بين المتكلمين.
مطوّر: Nari Labs · الترخيص: Apache 2.0
جربهاParler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
مطوّر: Hugging Face · الترخيص: Apache 2.0
جربهاIndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
مطوّر: Index Team · الترخيص: Apache 2.0
جربهاSpark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
مطوّر: SparkAudio · الترخيص: Apache 2.0
جربهاGPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
مطوّر: RVC-Boss · الترخيص: MIT
جربهاOrpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
مطوّر: Canopy Labs · الترخيص: Llama 3.2 Community
جربهاQwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
مطوّر: Alibaba (Qwen) · الترخيص: Apache 2.0
جربهاCosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
اللغات: en, zh, ja, ko, fr, de, it, es
صوت مستنسخIndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
اللغات: en, zh
صوت مستنسخSpark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
اللغات: en, zh
صوت مستنسخGPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
اللغات: en, zh, ja, ko
صوت مستنسخTortoise TTS
تحويل النصوص إلى كلام بأصوات متعددة يركز على الجودة مع بنية ذاتية التراجع.
اللغات: en
صوت مستنسخOpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
اللغات: en, zh, ja, ko, fr, de, es, it
صوت مستنسخQwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
اللغات: en, zh, ja, ko, de, fr, ru, pt, es, it
صوت مستنسخواجهة برمجة التطبيقات الموجهة للمطورين أولا
REST API متوافق مع OpenAI، نقطة نهاية واحدة، 22+ نماذج، دعم التدفق لتطبيقات الوقت الحقيقي.
- صيغة متوافقة مع OpenAI
- تحويل النصوص إلى صوت لتطبيقات الوقت الحقيقي
- التجهيز بالدفعات للأعمال الكبيرة
- إخطارات Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
التسعير البسيط والشفاف
ابدأ مجاناً وازداد حجمك مع نموك
مجاني
50 وحدة دراسية
- Kokoro, Piper, VITS, MeloTTS
- الحد الأقصى 500 كلمة
- ٣ مولدات/ساعة )ﻻ يوجد حساب(
المؤيدون
000 2 رصيد شهريا
- كل شيء في البداية
- الوصول إلى واجهة برمجة التطبيقات
- أولوية التجهيز
المؤسسة
000 10 رصيد شهريا
- كل شيء في Pro
- تطبيقات برمجة التطبيقات بالجملة
- الطابور ذي الأولوية
الأسئلة المتكررة
ابدأ باستخدام صوت الذكاء الاصطناعي اليوم
انضم إلى المبدعين والمطورين والأعمال التجارية باستخدام TTS.ai