الذكاء الاصطناعي المجاني تحويل النص إلى كلمة

22+ نماذج مفتوحة المصدر، 100+ أصوات، 32+ لا يلزم إنشاء حساب.

0/500 حروف مجاني
بدون بطاقة ائتمان 50 وحدة دراسية مجانية 32+ اللغات الاستخدام التجاري
0:00 / 0:00
تنزيل الصوت الرابط ينتهي بعد 24 ساعة
مثل TTS.ai؟ أخبر أصدقائك

كل ما تحتاجه للذكاء الاصطناعي الصوتي

26 أداة مدعومة بأكثر من 24 نموذجاً مفتوح المصدر للذكاء الاصطناعي

22+ نماذج صوت الذكاء الاصطناعي

أشمل مجموعة من نماذج تكنولوجيا المعلومات والاتصالات المفتوحة المصدر في منصة واحدة

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

أفضل ل: High-quality TTS with minimal latency, streaming applications

تجربة مجانية

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

أفضل ل: Quick previews, accessibility, and embedded applications

تجربة مجانية

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

أفضل ل: General-purpose text-to-speech with natural prosody

تجربة مجانية

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

أفضل ل: تطبيقات الإنتاج التي تحتاج إلى ترجمة تلقائية سريعة ومتعددة اللغات

تجربة مجانية

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

مطوّر: Suno · الترخيص: MIT

جربها

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

مطوّر: Suno · الترخيص: MIT

جربها

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

مطوّر: Alibaba (Tongyi Lab) · الترخيص: Apache 2.0

جربها

Dia TTS Standard

نموذج توليد حوار متعدد المتكلمين يخلق محادثات طبيعية بين المتكلمين.

مطوّر: Nari Labs · الترخيص: Apache 2.0

جربها

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

مطوّر: Hugging Face · الترخيص: Apache 2.0

جربها

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

مطوّر: Index Team · الترخيص: Apache 2.0

جربها

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

مطوّر: SparkAudio · الترخيص: Apache 2.0

جربها

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

مطوّر: RVC-Boss · الترخيص: MIT

جربها

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

مطوّر: Canopy Labs · الترخيص: Llama 3.2 Community

جربها

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

مطوّر: Alibaba (Qwen) · الترخيص: Apache 2.0

جربها

Chatterbox Premium

استنساخ الصوت بأحدث التقنيات مع التحكم العاطفي من (ريزيمبل آي)

الجودة:

جربها

Tortoise TTS Premium

تحويل النصوص إلى كلام بأصوات متعددة يركز على الجودة مع بنية ذاتية التراجع.

الجودة:

جربها

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

الجودة:

جربها

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

الجودة:

جربها

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

اللغات: en, zh, ja, ko, fr, de, it, es

صوت مستنسخ

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

اللغات: en, zh

صوت مستنسخ

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

اللغات: en, zh

صوت مستنسخ

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

اللغات: en, zh, ja, ko

صوت مستنسخ

Chatterbox

استنساخ الصوت بأحدث التقنيات مع التحكم العاطفي من (ريزيمبل آي)

اللغات: en

صوت مستنسخ

Tortoise TTS

تحويل النصوص إلى كلام بأصوات متعددة يركز على الجودة مع بنية ذاتية التراجع.

اللغات: en

صوت مستنسخ

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

اللغات: en, zh, ja, ko, fr, de, es, it

صوت مستنسخ

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

اللغات: en, zh, ja, ko, de, fr, ru, pt, es, it

صوت مستنسخ

واجهة برمجة التطبيقات الموجهة للمطورين أولا

REST API متوافق مع OpenAI، نقطة نهاية واحدة، 22+ نماذج، دعم التدفق لتطبيقات الوقت الحقيقي.

  • صيغة متوافقة مع OpenAI
  • تحويل النصوص إلى صوت لتطبيقات الوقت الحقيقي
  • التجهيز بالدفعات للأعمال الكبيرة
  • إخطارات Webhook
عرض مستندات API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

التسعير البسيط والشفاف

ابدأ مجاناً وازداد حجمك مع نموك

مجاني

$0

50 وحدة دراسية

  • Kokoro, Piper, VITS, MeloTTS
  • الحد الأقصى 500 كلمة
  • ٣ مولدات/ساعة )ﻻ يوجد حساب(
انضم مجاناً

البدء

$9/شهر

500 رصيد شهريا

  • جميع النماذج 22+
  • الحد الأقصى 000 5 حرف
  • استنساخ الصوت
ابدأ
الأكثر شعبية

المؤيدون

$29/شهر

000 2 رصيد شهريا

  • كل شيء في البداية
  • الوصول إلى واجهة برمجة التطبيقات
  • أولوية التجهيز
احصل على Pro

المؤسسة

$99/شهر

000 10 رصيد شهريا

  • كل شيء في Pro
  • تطبيقات برمجة التطبيقات بالجملة
  • الطابور ذي الأولوية
الاتصال بالمبيعات

View all plans including credit packs →

الأسئلة المتكررة

TTS.ai هي المنصة الصوتية الأكثر شمولا للذكاء الاصطناعي، حيث توفر أكثر من 22 نموذجا لتحويل النص إلى كلام، واستنساخ الصوت، وتحويل الكلام إلى نص، وأدوات صوتية. وجميع النماذج مفتوحة المصدر ولا تعتمد على البائع.

نعم! تقدم TTS.ai ترجمة النصوص إلى كلام مجانا مع نماذج كوكورو، وبايبر، وفيتس، وميلوتتس. لا يلزم إنشاء حساب. انضم للحصول على 50 نقطة مجانية والوصول إلى جميع النماذج. الخطط المدفوعة تبدأ من 9 دولارات شهريا.

للسرعة، استخدم كوكورو أو بيبر. للجودة، جرب CosyVoice 2 أو StyleTTS 2. للاستنساخ الصوتي، استخدم Chatterbox أو GPT-SoVITS. للحوار، استخدم Dia TTS. جرب نماذج متعددة على النص نفسه للمقارنة.

نعم. متوافق مع OpenAI REST API ل TTS، STT، استنساخ الصوت، وأدوات الصوت. متوفر على Pro ($29/mo) و Enterprise ($99/mo) خطط. انظر الوثائق على tts.ai/api/.

تختلف جودة الصوت حسب النموذج. النماذج العالية مثل CosyVoice 2 و StyleTTS 2 و Chatterbox تنتج كلامًا شبه بشري الجودة مع النبرة الطبيعية والعاطفة. النماذج المجانية مثل Kokoro توفر جودة ممتازة لمعظم حالات الاستخدام.

تدعم TTS.ai أكثر من 30 لغة في مكتبة نماذجها. وتحظى اللغة الإنجليزية بأوسع دعم للنماذج، ولكن نماذج مثل CosyVoice 2 تغطي الصينية واليابانية والكورية؛ وتتعامل GPT-SoVITS مع الصينية واليابانية والكورية والإنجليزية؛ وتدعم MeloTTS الإنجليزية والإسبانية والفرنسية والصينية واليابانية والكورية.

نعم. كل المعالجة تحدث على خوادمنا المخصصة لمعالجة الرسوميات. نحن لا نخزن مدخلات النصوص أو الصوت المولد بعد التسليم. عينات الصوت المرفوعة للاستنساخ تستخدم فقط للجلسة الحالية ولا يتم الاحتفاظ بها. نحن لا نشاطر أبدا بياناتك مع أطراف ثالثة أو نستخدمها لتدريب النماذج.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai يولد الصوت في شكل WAV بشكل افتراضي لأقصى قدر من الجودة. يمكنك تحويل إلى MP3، FLAC، OGG، أو M4A باستخدام أداة تحويل الصوت المجانية. API يدعم تحديد شكل الخرج المفضل الخاص بك مباشرة في الطلب.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

النماذج المجانية (Kokoro, Piper, VITS, MeloTTS) لا تتطلب أي حساب وتكلف صفر من النقاط. وتشمل النماذج العادية (2 نقطة/1000 حرف) Bark, CosyVoice 2, F5-TTS, and Dia. وتشمل النماذج المتميزة (4 نقاط/1000 حرف) OpenVoice, Chatterbox, StyleTTS 2, and Tortoise. وتقدم النماذج المدفوعة عموما جودة أعلى، وأصوات أكثر، وخصائص إضافية مثل استنساخ الصوت.

نعم. تدعم واجهة برمجة التطبيقات معالجة المجموعات لتحويل كميات كبيرة من النصوص إلى كلام. قم بتقديم طلبات متعددة واسترجاع النتائج بشكل غير متزامن باستخدام UUIDs للوظائف. تشمل خطط المؤسسة (99 دولارًا / شهريًا) الوصول إلى الصفوف ذات الأولوية لمعالجة المجموعات بشكل أسرع. مثالي لإنتاج الكتب السمعية، ومحتوى الدورات، ومشاريع الصوتيات الكبيرة.
5.0/5 (1)

ابدأ باستخدام صوت الذكاء الاصطناعي اليوم

انضم إلى المبدعين والمطورين والأعمال التجارية باستخدام TTS.ai