هوش مصنوعی آزاد متن به گفتارName

22 مدل متن باز، 100 صدا، 32+ هیچ حسابی نیاز نیست.

0/500 نویسه‌ها آزاد
کارت اعتباري ندارم 50 کرون آزاد 32+ زبانها استفاده تجاری خوبه
0:00 / 0:00
بارگیری صوتی پیوند در ۲۴ ساعت پایان می‌یابد
مثل TTS.ai به دوستات بگو

هر چیزی که برای هوش مصنوعی صوت نیاز دارید

26 ابزار که توسط 24+ مدل هوش مصنوعی منبع باز پشتیبانی می شوند

22+ مدل‌های صدای هوش مصنوعی

جامع‌ترین مجموعه مدل‌های TTS متن‌باز در یک پلتفرم

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

بهترین برای: High-quality TTS with minimal latency, streaming applications

آزمون رایگان

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

بهترین برای: Quick previews, accessibility, and embedded applications

آزمون رایگان

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

بهترین برای: General-purpose text-to-speech with natural prosody

آزمون رایگان

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

بهترین برای: برنامه‌های کاربردی تولید نیازمند TTS سریع و چندزبانه هستند

آزمون رایگان

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

توسعه‌دهنده: Suno · مجوز: MIT

سعي کن

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

توسعه‌دهنده: Suno · مجوز: MIT

سعي کن

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

توسعه‌دهنده: Alibaba (Tongyi Lab) · مجوز: Apache 2.0

سعي کن

Dia TTS Standard

مدل تولید مکالمه چند بلندگو که مکالمات طبیعی را بین بلندگوها ایجاد می‌کند.

توسعه‌دهنده: Nari Labs · مجوز: Apache 2.0

سعي کن

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

توسعه‌دهنده: Hugging Face · مجوز: Apache 2.0

سعي کن

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

توسعه‌دهنده: Index Team · مجوز: Apache 2.0

سعي کن

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

توسعه‌دهنده: SparkAudio · مجوز: Apache 2.0

سعي کن

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

توسعه‌دهنده: RVC-Boss · مجوز: MIT

سعي کن

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

توسعه‌دهنده: Canopy Labs · مجوز: Llama 3.2 Community

سعي کن

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

توسعه‌دهنده: Alibaba (Qwen) · مجوز: Apache 2.0

سعي کن

Chatterbox Premium

شبیه‌سازی صدای صفر شلیک با کنترل احساسات از Resemble AI.

کیفیت:

سعي کن

Tortoise TTS Premium

متن-به-گفتار چند صدایی بر کیفیت با معماری خودبازگشتی متمرکز است.

کیفیت:

سعي کن

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

کیفیت:

سعي کن

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

کیفیت:

سعي کن

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

زبانها: en, zh, ja, ko, fr, de, it, es

صدای شبیه

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

زبانها: en, zh

صدای شبیه

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

زبانها: en, zh

صدای شبیه

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

زبانها: en, zh, ja, ko

صدای شبیه

Chatterbox

شبیه‌سازی صدای صفر شلیک با کنترل احساسات از Resemble AI.

زبانها: en

صدای شبیه

Tortoise TTS

متن-به-گفتار چند صدایی بر کیفیت با معماری خودبازگشتی متمرکز است.

زبانها: en

صدای شبیه

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

زبانها: en, zh, ja, ko, fr, de, es, it

صدای شبیه

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

زبانها: en, zh, ja, ko, de, fr, ru, pt, es, it

صدای شبیه

API توسعه‌دهنده اول

API REST سازگار با OpenAI. یک نقطه پایانی، ۲۲+ مدل. پشتیبانی جریانی برای برنامه‌های کاربردی زمان واقعی.

  • قالب سازگار با OpenAI
  • پخش TTS برای برنامه‌های زمان واقعی
  • پردازش گروهی برای کارهای بزرگ
  • اطلاعیه‌های Webhook
نمایش مستندات API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

قیمت‌گذاری ساده و شفاف

آزاد شروع کنيد و با بزرگ شدن بزرگ تر بشينيد

آزاد

$0

50 کرون

  • Kokoro, Piper, VITS, MeloTTS
  • محدودیت ۵۰۰ کاراکتر
  • 3 gen/hour) حسابی نیست (
ثبت نام

آغازگر

$9/% 1 دقیقه

500 امتیاز/ماه

  • 22+ مدل
  • محدودیت ۵۰۰۰ کاراکتر
  • شبیه‌سازی صدا
شروع
محبوب‌ترین

حرفه‌ای

$29/% 1 دقیقه

2000 کرون/ماه

  • همه چیز در Starter
  • دسترسی API
  • پردازش اولویت
حرفه‌ای شوید

انترپرایز

$99/% 1 دقیقه

10,000 کرون/ماه

  • همه چيز در پرو
  • API انبوه
  • صف اولویت
تماس با فروش

View all plans including credit packs →

پرسشهای متداول

TTS.ai جامع‌ترین پلتفرم صدای هوش مصنوعی است که بیش از ۲۲ مدل متن به گفتار، شبیه‌سازی صدا، گفتار به متن و ابزارهای صوتی را ارائه می‌دهد.

بله! TTS.ai با مدل‌های Kokoro، Piper، VITS و MeloTTS متن به گفتار رایگان را ارائه می‌دهد. هیچ حسابی نیاز نیست. برای دریافت ۵۰ کرید رایگان و دسترسی به تمام مدل‌ها ثبت نام کنید. برنامه‌های پرداختی از ۹ دلار در ماه شروع می‌شوند.

برای سرعت ، از Kokoro یا Piper استفاده کنید. برای کیفیت ، CosyVoice 2 یا StyleTTS 2 را امتحان کنید. برای شبیه‌سازی صدا ، از Chatterbox یا GPT- SoVITS استفاده کنید. برای گفتگو ، از Dia TTS استفاده کنید. برای مقایسه ، چندین مدل را روی یک متن امتحان کنید.

بله. API REST سازگار با OpenAI برای TTS، STT، شبیه‌سازی صدا و ابزارهای صوتی. در دسترس در برنامه‌های Pro ($29/mo) و Enterprise ($99/mo). مستندات را در tts.ai/api/ مشاهده کنید.

کیفیت صدا بسته به مدل متفاوت است. مدل‌های پریمیوم مانند CosyVoice 2، StyleTTS 2، و Chatterbox تولید سخنرانی با کیفیت نزدیک به انسانی با نغمه و احساس طبیعی می‌کنند. مدل‌های رایگان مانند Kokoro کیفیت فوق‌العاده‌ای برای اکثر موارد استفاده ارائه می‌دهند.

TTS.ai بیش از ۳۰ زبان را در کتابخانه مدل خود پشتیبانی می‌کند. انگلیسی گسترده‌ترین پشتیبانی مدل را دارد، اما مدل‌هایی مانند CosyVoice 2 چینی، ژاپنی و کره‌ای را پوشش می‌دهد؛ GPT-SoVITS چینی، ژاپنی، کره‌ای و انگلیسی را مدیریت می‌کند؛ و MeloTTS انگلیسی، اسپانیایی، فرانسوی، چینی، ژاپنی و کره‌ای را پشتیبانی می‌کند.

بله. همۀ پردازشها روی کارسازهای اختصاصی GPU ما اتفاق می‌افتد. ما ورودی متن شما یا صدای تولید شده را پس از تحویل ذخیره نمی‌کنیم. نمونه‌های صدای بارگذاری‌شده برای شبیه‌سازی فقط برای نشست جاری استفاده می‌شوند و نگه داشته نمی‌شوند. ما هرگز داده‌های شما را با شخص سوم به اشتراک نمی‌گذاریم یا از آن برای آموزش مدلها استفاده نمی‌کنیم.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai به صورت پیش‌فرض صدا را در قالب WAV برای حداکثر کیفیت تولید می‌کند. می‌توانید با استفاده از ابزار مبدل صوتی رایگان ما به MP3 ، FLAC ، OGG یا M4A تبدیل کنید. API از مشخص کردن قالب خروجی مورد علاقه شما مستقیماً در درخواست پشتیبانی می‌کند.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

مدل‌های رایگان (Kokoro, Piper, VITS, MeloTTS) نیازی به حساب ندارند و هزینهٔ آن‌ها صفر کرون است. مدل‌های استاندارد (۲ کرون/۱۰۰۰ کاراکتر) شامل Bark, CosyVoice 2, F5-TTS, و Dia. مدل‌های پرمیوم (۴ کرون/۱۰۰۰ کاراکتر) شامل OpenVoice, Chatterbox, StyleTTS 2, و Tortoise.

بله. این رابط برنامه‌نویسی از پردازش گروهی برای تبدیل حجم‌های بزرگ متن به گفتار پشتیبانی می‌کند. درخواست‌های متعدد را ارسال کنید و نتایج را به صورت غیر همگام با استفاده از UUIDهای کار بازیابی کنید. برنامه‌های شرکتی ($99/mo) شامل دسترسی صف اولویت برای پردازش سریعتر گروهی است. ایده‌آل برای تولید کتاب صوتی، محتوای دوره، و پروژه‌های صداگذاری در مقیاس بزرگ.
5.0/5 (1)

امروز شروع به استفاده از صدای هوش مصنوعی کنید

به خالقان، توسعه دهندگان و کسب و کارها با استفاده از TTS.ai بپیوندید