هوش مصنوعی آزاد متن به گفتارName
22 مدل متن باز، 100 صدا، 32+ هیچ حسابی نیاز نیست.
هر چیزی که برای هوش مصنوعی صوت نیاز دارید
26 ابزار که توسط 24+ مدل هوش مصنوعی منبع باز پشتیبانی می شوند
22+ مدلهای صدای هوش مصنوعی
جامعترین مجموعه مدلهای TTS متنباز در یک پلتفرم
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
بهترین برای: High-quality TTS with minimal latency, streaming applications
آزمون رایگانPiper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
بهترین برای: Quick previews, accessibility, and embedded applications
آزمون رایگانVITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
بهترین برای: General-purpose text-to-speech with natural prosody
آزمون رایگانMeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
بهترین برای: برنامههای کاربردی تولید نیازمند TTS سریع و چندزبانه هستند
آزمون رایگانBark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
توسعهدهنده: Suno · مجوز: MIT
سعي کنBark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
توسعهدهنده: Suno · مجوز: MIT
سعي کنCosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
توسعهدهنده: Alibaba (Tongyi Lab) · مجوز: Apache 2.0
سعي کنDia TTS Standard
مدل تولید مکالمه چند بلندگو که مکالمات طبیعی را بین بلندگوها ایجاد میکند.
توسعهدهنده: Nari Labs · مجوز: Apache 2.0
سعي کنParler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
توسعهدهنده: Hugging Face · مجوز: Apache 2.0
سعي کنIndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
توسعهدهنده: Index Team · مجوز: Apache 2.0
سعي کنSpark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
توسعهدهنده: SparkAudio · مجوز: Apache 2.0
سعي کنGPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
توسعهدهنده: RVC-Boss · مجوز: MIT
سعي کنOrpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
توسعهدهنده: Canopy Labs · مجوز: Llama 3.2 Community
سعي کنQwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
توسعهدهنده: Alibaba (Qwen) · مجوز: Apache 2.0
سعي کنCosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
زبانها: en, zh, ja, ko, fr, de, it, es
صدای شبیهIndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
زبانها: en, zh
صدای شبیهSpark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
زبانها: en, zh
صدای شبیهGPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
زبانها: en, zh, ja, ko
صدای شبیهOpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
زبانها: en, zh, ja, ko, fr, de, es, it
صدای شبیهQwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
زبانها: en, zh, ja, ko, de, fr, ru, pt, es, it
صدای شبیهAPI توسعهدهنده اول
API REST سازگار با OpenAI. یک نقطه پایانی، ۲۲+ مدل. پشتیبانی جریانی برای برنامههای کاربردی زمان واقعی.
- قالب سازگار با OpenAI
- پخش TTS برای برنامههای زمان واقعی
- پردازش گروهی برای کارهای بزرگ
- اطلاعیههای Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
قیمتگذاری ساده و شفاف
آزاد شروع کنيد و با بزرگ شدن بزرگ تر بشينيد
حرفهای
2000 کرون/ماه
- همه چیز در Starter
- دسترسی API
- پردازش اولویت
پرسشهای متداول
امروز شروع به استفاده از صدای هوش مصنوعی کنید
به خالقان، توسعه دهندگان و کسب و کارها با استفاده از TTS.ai بپیوندید