मुक्त AI पाठ्य ते वक्तव्यName

२२+ ओपन-सोर्स मॉडेल्स, १००+ आवाज, 32+ भाषा. खाते आवश्यक नाही.

0/500 अक्षरे मोकळे
क्रेडिट कार्ड नाही 50 मुक्त क्रेडिट 32+ भाषाName व्यावसायिक वापर OK
0:00 / 0:00
ऑडिओ डाउनलोड करा लिंक २४ तासांत संपेल
TTS.ai आवडले? तुमच्या मित्रांना सांगा!

आवाज AI साठी तुम्हाला सर्व काही हवे आहेName

24+ ओपन सोर्स एआय मॉडेल्सद्वारे चालविलेले 26 साधने

22+ AI आवाज मॉडेल

एका प्लॅटफॉर्मवर ओपन सोर्स टीटीएस मॉडेलचे सर्वात व्यापक संग्रहName

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

सर्वोत्तम: High-quality TTS with minimal latency, streaming applications

मोफत प्रयत्न करा

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

सर्वोत्तम: Quick previews, accessibility, and embedded applications

मोफत प्रयत्न करा

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

सर्वोत्तम: General-purpose text-to-speech with natural prosody

मोफत प्रयत्न करा

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

सर्वोत्तम: वेगवान, बहुभाषिक TTS आवश्यक असलेले उत्पादन अनुप्रयोगName

मोफत प्रयत्न करा

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

डेव्हलपर: Suno · परवाना: MIT

प्रयत्न करा

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

डेव्हलपर: Suno · परवाना: MIT

प्रयत्न करा

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

डेव्हलपर: Alibaba (Tongyi Lab) · परवाना: Apache 2.0

प्रयत्न करा

Dia TTS Standard

मराठी भाषेतील बहुभाषिक साहित्याची निर्मिती करणारी ही एक संस्था आहे.

डेव्हलपर: Nari Labs · परवाना: Apache 2.0

प्रयत्न करा

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

डेव्हलपर: Hugging Face · परवाना: Apache 2.0

प्रयत्न करा

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

डेव्हलपर: Index Team · परवाना: Apache 2.0

प्रयत्न करा

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

डेव्हलपर: SparkAudio · परवाना: Apache 2.0

प्रयत्न करा

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

डेव्हलपर: RVC-Boss · परवाना: MIT

प्रयत्न करा

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

डेव्हलपर: Canopy Labs · परवाना: Llama 3.2 Community

प्रयत्न करा

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

डेव्हलपर: Alibaba (Qwen) · परवाना: Apache 2.0

प्रयत्न करा

Chatterbox Premium

ॲरिस्टॉटलच्या तत्त्वज्ञानाप्रमाणे तत्त्वज्ञान म्हणजे तत्त्वज्ञानाच्या आधारे तत्त्वज्ञानाची मांडणी करणे होय.

गुणवत्ता:

प्रयत्न करा

Tortoise TTS Premium

मराठी भाषेतील अनेक नाटकांचे दिग्दर्शन त्यांनी केले आहे.

गुणवत्ता:

प्रयत्न करा

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

गुणवत्ता:

प्रयत्न करा

OpenVoice Premium

त्यांपैकी काही तत्त्वे पुढील प्रमाणे : लिंगभाव, लैंगिकता, लिंगभाव आणि लिंगभाव आणि लिंगभाव.

गुणवत्ता:

प्रयत्न करा

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

भाषा: en, zh, ja, ko, fr, de, it, es

आवाज क्लोन करा

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

भाषा: en, zh

आवाज क्लोन करा

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

भाषा: en, zh

आवाज क्लोन करा

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

भाषा: en, zh, ja, ko

आवाज क्लोन करा

Chatterbox

ॲरिस्टॉटलच्या तत्त्वज्ञानाप्रमाणे तत्त्वज्ञान म्हणजे तत्त्वज्ञानाच्या आधारे तत्त्वज्ञानाची मांडणी करणे होय.

भाषा: en

आवाज क्लोन करा

Tortoise TTS

मराठी भाषेतील अनेक नाटकांचे दिग्दर्शन त्यांनी केले आहे.

भाषा: en

आवाज क्लोन करा

OpenVoice

त्यांपैकी काही तत्त्वे पुढील प्रमाणे : लिंगभाव, लैंगिकता, लिंगभाव आणि लिंगभाव आणि लिंगभाव.

भाषा: en, zh, ja, ko, fr, de, es, it

आवाज क्लोन करा

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

भाषा: en, zh, ja, ko, de, fr, ru, pt, es, it

आवाज क्लोन करा

डेव्हलपर- प्रथम API

OpenAI-सुसंगत REST API. एक अंतबिंदू, 22+ मॉडेल. वास्तविक वेळ अनुप्रयोगांसाठी स्ट्रीमिंग समर्थन.

  • OpenAI- सुसंगत स्वरूप
  • वास्तविक वेळ अनुप्रयोग करीता TTS स्ट्रीमिंग
  • मोठे कार्य करीता बॅच प्रक्रिया
  • वेबहॉक सूचना
API दस्तऐवजीकरण पहा
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

सोपी, पारदर्शक किंमत निश्चिती

मुक्तपणे सुरू करा. वाढू द्या.

मोकळे

$0

क्रेडिट

  • Kokoro, Piper, VITS, MeloTTS
  • 500 अक्षर सीमा
  • 3 जन/तास (खाते नाही)
नोंदणी करा

प्रारंभकर्ता

$9/% 1 सेकंद

500 क्रेडिट/महिने

  • सर्व 22+ मॉडेल
  • 5,000 अक्षरांची मर्यादा
  • आवाज क्लोनिंग
सुरू करा
सर्वात लोकप्रिय

प्रो

$29/% 1 सेकंद

2,000 क्रेडिट/महिने

  • स्टार्टअप अंतर्गत सर्वकाही
  • API प्रवेश
  • प्राधान्यता प्रक्रिया
प्रो मिळवा

एंटरप्राइज

$99/% 1 सेकंद

10,000 क्रेडिट/महिने

  • प्रो मध्ये सर्वकाही
  • मोठे API
  • प्राधान्यता कतार
विक्री संपर्क

View all plans including credit packs →

वारंवार विचारले जाणारे प्रश्न

टीटीएस.एआय हे सर्वात व्यापक एआय आवाज प्लॅटफॉर्म आहे, जे 22 + टेक्स्ट-टू-स्पीच मॉडेल्स, आवाज क्लोनिंग, स्पीच-टू-टेक्स्ट आणि ऑडिओ साधने प्रदान करते.

होय! TTS.ai कोकोरो, पाइपर, VITS, आणि MeloTTS मॉडेल्ससह मोफत टेक्स्ट-टू-स्पीच ऑफर करते. खाते आवश्यक नाही. 50 मोफत क्रेडिट मिळविण्यासाठी नोंदणी करा आणि सर्व मॉडेल्सचा वापर करा.

वेगासाठी, Kokoro किंवा Piper चा वापर करा. गुणवत्तेसाठी, CosyVoice2किंवा StyleTTS2चा वापर करा. आवाज क्लोनिंग करीता, Chatterbox किंवा GPT- SoVITS चा वापर करा. संवाद करीता, Dia TTS चा वापर करा. तुलना करीता एकाच पाठ्यावर अनेक मॉडेल्सचा वापर करा.

होय. TTS, STT, आवाज क्लोनिंग, आणि ऑडिओ साधनांसाठी OpenAI-सुसंगत REST API. प्रो ($29/month) आणि एन्टरप्राईज ($99/month) प्लॅनवर उपलब्ध. tts.ai/api/ येथे दस्तऐवज पहा.

आवाजाची गुणवत्ता मॉडेलनुसार बदलते. प्रीमियम मॉडेल्स जसे की कॉसीव्हॉईस2, स्टाइलटीटीएस2आणि चॅटरबॉक्स नैसर्गिक उच्चार व भावनांसह मानवी गुणवत्तेच्या जवळचे भाषण तयार करतात. कोकोरो सारखे मोफत मॉडेल बहुतेक वापरासाठी उत्कृष्ट गुणवत्ता प्रदान करतात.

TTS.ai त्याच्या मॉडेल लायब्ररीमध्ये 30+ भाषांना समर्थन देते. इंग्रजीला सर्वात व्यापक मॉडेल समर्थन आहे, परंतु कोसीव्हॉइस2सारखे मॉडेल चीनी, जपानी आणि कोरियाई समाविष्ट करते; जीपीटी-सोविट्स चीनी, जपानी, कोरियाई आणि इंग्रजी हाताळते; आणि मेलोटीटीएस इंग्रजी, स्पॅनिश, फ्रेंच, चीनी, जपानी आणि कोरियाई समर्थन करते.

होय. सर्व प्रक्रिया आमच्या समर्पित GPU सर्वरवर घडते. आम्ही तुमच्या पाठ्य इनपुट किंवा वितरण नंतर निर्मित ऑडिओ संचयीत करत नाही. क्लोन करीता अपलोड केलेले आवाज नमुने केवळ वर्तमान सत्र करीता वापरले जातात व ठेवले जात नाहीत. आम्ही कधीच तुमची माहिती तिसऱ्या पक्षाशी शेअर करत नाही किंवा मॉडेल प्रशिक्षण करीता वापरत नाही.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai सर्वोत्तम गुणवत्तेसाठी WAV स्वरूपात मुलभूतरित्या ऑडिओ तयार करतो. आपण MP3, FLAC, OGG, किंवा M4A मध्ये आमचे मोफत ऑडिओ कनव्हर्टर साधन वापरून रूपांतरित करू शकता. अनुरोधात थेट आपल्या पसंतीच्या आऊटपुट स्वरूप निश्चित करण्यास API समर्थन देते.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

मोफत मॉडेल (Kokoro, Piper, VITS, MeloTTS) खाते आवश्यक नाही आणि शून्य क्रेडिट खर्च. मानक मॉडेल (2 क्रेडिट / 1K अक्षरे) समावेश Bark, CosyVoice2, F5-TTS, आणि Dia. प्रीमियम मॉडेल (4 क्रेडिट / 1K अक्षरे) समावेश OpenVoice, Chatterbox, StyleTTS2, आणि Tortoise. मोफत मॉडेल सामान्यत: उच्च गुणवत्ता, अधिक आवाज, आणि आवाज क्लोनिंग सारख्या अतिरिक्त वैशिष्ट्ये प्रदान करतात.

होय. मोठ्या प्रमाणावर पाठ्य ते वक्तव्य रूपांतरण करीता API बॅच प्रोसेसिंगला समर्थन देतो. अनेक विनंती सादर करा व कार्य UUIDs वापरून अतुल्यकालिकपणे परिणाम प्राप्त करा. उद्योजक योजना ($99/month) मध्ये वेगवान बॅच प्रोसेसिंग करीता प्राधान्यता कतार प्रवेश समाविष्ट आहे. ऑडिओबुक उत्पादन, कोर्स सामग्री, आणि मोठ्या प्रमाणावर आवाज प्रकल्पांसाठी आदर्श.
5.0/5 (1)

आजच AI आवाज वापरण्यास प्रारंभ करा

TTS.ai वापरून क्रिएटर्स, डेव्हलपर आणि व्यवसायांमध्ये सामील व्हा