مفت AI لکت مان ڳالھائڻName

33+ اوپن سورس ماڊل، 273+ آواز، 33+ ٻوليون. ڪوبه اڪائونٽ نه گھرجي.

17K+
ٺاھيندڙ
70K+
نسل
33+
AI ماڊل
273+
آواز
TTS.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

سڀڪنھن شيءِ جو توھان کي آواز AI جي ضرورت آھي

30+ اوپن سورس اي آءِ ماڊلز سان طاقتور اوزار

33+ AI آواز جا ماڊل

اوپن سورس TTS ماڊلز جو سڀ کان جامع مجموعو هڪ پليٽ فارم ۾

KokoroKokoro مفت

ڪوڪورو هڪ 82 ملين پاراميٽرن وارو متن کان ڳالهائڻ وارو ماڊل آهي جيڪو پنهنجي وزن جي ڪلاس کان مٿي آهي. پنهنجي ننڍڙي سائيز جي باوجود ، اهو تمام گهڻو قدرتي ۽ اظهاري ڳالهائڻ پيدا ڪري ٿو. ڪوڪورو ڪيترن ئي ٻولين کي سپورٽ ڪري ٿو جن ۾ انگريزي ، جاپاني ، چيني ۽ ڪورين شامل آهن جن ۾ اظهاري آوازن جي تنوع آهي. اهو ڏاڍو تيز هلندو آهي - هڪ GPU تي حقيقي وقت جي ڀيٽ ۾ تقريبن 100x تيز آواز پيدا ڪري ٿو.

ھن لاءِ بهترين: اعليٰ معياري TTS گھٽ ۾ گھٽ دير سان ، اسٽريمنگ ايپليڪيشنون

مفت آزمايو

PiperPiper مفت

پيپر هڪ ھلڪو متن کان ڳالھائڻ وارو انجن آهي جيڪو Rhasspy پاران ترقي يافته آهي جيڪو VITS ۽ larynx architectures استعمال ڪري ٿو. اهو مڪمل طور تي سي پي يو تي هلندو آهي، ان کي ايج ڊيوائسز، گھر جي خودڪار، ۽ آف لائن TTS جي ضرورت وارين ايپليڪيشنن لاءِ مثالي بڻائيندو آهي. 30+ ٻولين ۾ 100 کان وڌيڪ آوازن سان، پيپر هڪ Raspberry Pi 4 تي به حقيقي وقت جي رفتار تي طبعي آواز واري ڳالھائڻ مهيا ڪري ٿو.

ھن لاءِ بهترين: جلدي اڳڪٿيون، رسائي، ۽ داخل ٿيل ايپليڪيشنون

مفت آزمايو

VITSVITS مفت

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) هڪ متوازي end-to-end TTS طريقو آهي جيڪو موجوده ٻن مرحلن جي ماڊلن جي ڀيٽ ۾ وڌيڪ قدرتي آواز وارو آڊيو پيدا ڪري ٿو. اهو مختلف انفريشن کي قبول ڪري ٿو جيڪو معمولي وهڪري سان وڌايو ويو آهي ۽ هڪ مقابلي واري تربيت واري عمل سان، طبيعت ۾ وڏي بهتري حاصل ڪري ٿو.

ھن لاءِ بهترين: عام مقصد وارو متن- کان- ڳالھائيءَ ڏانھن

مفت آزمايو

MeloTTSMeloTTS مفت

MyShell.ai طرفان MeloTTS هڪ ٻن ٻولين جي TTS لائبريري آهي جيڪا انگريزي (آمريڪي، برطانوي، هندي، آسٽريليا)، اسپينش، فرانسيسي، چيني، جاپاني ۽ ڪورين کي سپورٽ ڪري ٿي. اهو تمام تيز آهي، صرف سي پي يو تي حقيقي وقت جي رفتار تي متن کي پروسيس ڪري ٿو. MeloTTS پيداوار جي استعمال لاءِ ٺاهيو ويو آهي ۽ سي پي يو ۽ جي پي يو ٻنهي کي سپورٽ ڪري ٿو.

ھن لاءِ بهترين: پيداوار جون ايپليڪيشنون جن کي جلدي، ڪيترن ٻولين جي TTS جي ضرورت آھي

مفت آزمايو

Kani TTS 2Kani TTS 2 مفت

Kani-TTS-2 by NineNineSix هڪ تمام هلڪو وزن 400M پاراميٽر ماڊل آهي جيڪو LiquidAI LFM2 backbone سان Nvidia NanoCodec سان ٺهيل آهي. اهو صرف 3GB VRAM ۾ هلندو آهي ۽ ~2 سيڪنڊن ۾ 10 سيڪنڊن ۾ ڳالهائيندو آهي (RTF 0.2). اسپيڪر embeddings ذريعي zero-shot آواز کلوننگ جي حمايت ڪري ٿو.

ھن لاءِ بهترين: تيز پيدائش، گهٽ وسيلا ماحول، جلدي اڳيون ڏسڻ

مفت آزمايو

OuteTTSOuteTTS مفت

OuteTTS وڏي ٻولي ماڊل سان متن-to-speech صلاحيتن سان وڌائي ٿو جڏهن ته اصل آرڪائيو کي برقرار رکڻ. اهو ڪيترن ئي backends سميت llama.cpp (CPU / GPU) ، Hugging Face Transformers ، ExLlamaV2 ، VLLM ، ۽ Transformers.js ذريعي برائوزر انفريشن جي حمايت ڪري ٿو. JSON طور محفوظ ڪيل اسپيڪر پروفائلن ذريعي صفر-شوٽ آواز کلوننگ جون خاصيتون.

ھن لاءِ بهترين: ايج ڊسپلين، برائوزر تي ٻڌل TTS، گهٽ وسيلا ماحول

مفت آزمايو

Pocket TTSPocket TTS مفت

پوڪ ٽي ٽي ايس ڪيوٽي (موشي جا ٺاھيندڙ) پاران هڪ 100 ايم پي آرٽيڪل-ٽو-سوئچ ماڊل آھي جيڪو پنھنجي وزن کان وڌي ٿو. اھو سي پي يو تي سھڻي طرح هلندو آھي، ھڪ آڊيو نموني مان صفر-شوٽ آواز جي کلوننگ کي مدد ڏيندو آھي، ۽ قدرتي آواز واري ڳالھائي کي پيدا ڪندو آھي. ننڍو ماڊل جي سائيز ان کي ويجھي استعمال ۽ گھٽ وسيلا ماحولن لاءِ مثالي بڻائيندو آھي.

ھن لاءِ بهترين: هلڪو استعمال، صرف سي پي يو ماحول، جلدي آواز جي کلوننگ

مفت آزمايو

Kitten TTSKitten TTS مفت

Kitten TTS by KittenML هڪ تمام هلڪو متن کان ڳالھائڻ وارو ماڊل آهي جيڪو ONNX تي ٺهيل آهي. 15M کان 80M تائين جي پي ايم (25-80 MB ڊسڪ تي) جي مختلف قسمن سان، اهو اعليٰ معيار جي آواز جي سنٿسيٽ کي سي پي يو تي GPU جي ضرورت کانسواءِ فراهم ڪري ٿو. 8 اندروني آوازن جون خاصيتون، ٺاھي سگھندڙ ڳالھائڻ جي رفتار، ۽ اندروني متن جي اڳواٽ پروسيسنگ نمبرن، ڪرنسي ۽ يونٽس لاءِ. ويجھي استعمال ۽ گهٽ دير وارين ايپليڪيشنن لاءِ مثالي.

ھن لاءِ بهترين: تيز تيز TTS، چوٽي جي تعمير، گهٽ- لاٽنٽي ايپليڪيشنون

مفت آزمايو

Ming-Omni TTSMing-Omni TTS مفت

InclusionAI پاران Ming-omni-tts-0.5B هڪ compact omni-modal speech model آهي جيڪو BailingMM جي ڳري backbone تي ٺهيل آهي ۽ هڪ Patch-by-Patch flow-matching audio decoder سان. 44.1kHz جي خروجي (سي ڊي جي معيار جي ويجهو) مهيا ڪري ٿو، 3+ سيڪنڊ جي حوالي کان صفر-شوٽ آواز جي کلوننگ جي حمايت ڪري ٿو، ۽ JSON هدايتن ذريعي ضم ٿيل احساس / ٻولي / BGM ڪنٽرول شامل آهي.

ھن لاءِ بهترين: اعليٰ معيار جي ٻن ٻولين ۾ بيان، احساس ڪنٽرول آواز اداڪار، چيني آڊيو ڪتاب مواد

مفت آزمايو

MOSS-TTS NanoMOSS-TTS Nano مفت

MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.

ھن لاءِ بهترين: Free-tier TTS, high-volume production, low-latency interactive use

مفت آزمايو

BarkBark معياري

ٽرانسميٽر تي ٻڌل متن کان آڊيو ماڊل جيڪو سچي ڳالھائي، موسيقي ۽ آواز جا اثر پيدا ڪري ٿو.

ڊيولپر: Suno · لائسنس: MIT

ڪوشش ڪريو

Bark SmallBark Small معياري

بارڪ جو هلڪو ورزن تيز استنباط ۽ گهٽ يادگار استعمال سان.

ڊيولپر: Suno · لائسنس: MIT

ڪوشش ڪريو

CosyVoice 2CosyVoice 2 معياري

Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency.

ڊيولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0

ڪوشش ڪريو

Dia TTSDia TTS معياري

ملٽي اسپيڪر ڊالوگ پيدا ڪرڻ وارو ماڊل جيڪو اسپيڪر جي وچ ۾ قدرتي گفتگو پيدا ڪري ٿو.

ڊيولپر: Nari Labs · لائسنس: Apache 2.0

ڪوشش ڪريو

Parler TTSParler TTS معياري

اوھان کي گھرجي ته آواز کي قدرتي ٻوليءَ ۾ بيان ڪريو ۽ پارلر مطابقت رکندڙ آواز پيدا ڪندو.

ڊيولپر: Hugging Face · لائسنس: Apache 2.0

ڪوشش ڪريو

IndexTTS-2IndexTTS-2 معياري

Zero-shot TTS fine-grained احساس ڪنٽرول ۽ اعلي اظهار سان.

ڊيولپر: Index Team · لائسنس: Bilibili Model License

ڪوشش ڪريو

Spark TTSSpark TTS معياري

آواز جي ڪلوننگ TTS ڪنٽرول ٿيل احساس ۽ ڳالهائڻ جي انداز سان پروموشنز ذريعي.

ڊيولپر: SparkAudio · لائسنس: CC BY-NC-SA 4.0

ڪوشش ڪريو

GPT-SoVITSGPT-SoVITS معياري

ٿورڙي شاٽ آواز ڪلوننگ TTS جيڪو ڪنهن به آواز کي رڳو 5 سيڪنڊن جي آڊيو مان نقل ڪري ٿو.

ڊيولپر: RVC-Boss · لائسنس: MIT

ڪوشش ڪريو

OrpheusOrpheus معياري

انسان جي سطح جو احساساتي TTS ماڊل 100K ڪلاڪن جي ڳالهائڻ جي ڊيٽا تي تربيت ڏنل.

ڊيولپر: Canopy Labs · لائسنس: Llama 3.2 Community

ڪوشش ڪريو

Qwen3 TTSQwen3 TTS معياري

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ڊيولپر: Alibaba (Qwen) · لائسنس: Apache 2.0

ڪوشش ڪريو

VieNeu-TTS-v2VieNeu-TTS-v2 معياري

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

ڊيولپر: Phạm Nguyễn Ngọc Bảo · لائسنس: Apache 2.0

ڪوشش ڪريو

Chatterbox TurboChatterbox Turbo معياري

200ms جي دير سان تيز چيٽ باڪس ۽ کلڻ، ڪُوڙڻ ۽ وڌيڪ لاءِ پارالنگويسٽڪ ٽيگ.

ڊيولپر: Resemble AI · لائسنس: MIT

ڪوشش ڪريو

VoxCPMVoxCPM معياري

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

ڊيولپر: OpenBMB · لائسنس: Apache 2.0

ڪوشش ڪريو

VibeVoiceVibeVoice معياري

مائڪروسافٽ ماڊل ڊگھي فارم جي ملٽي اسپيڪر مواد جهڙوڪ پوڊ ڪاسٽ ۽ آڊيو ڪتابن لاءِ.

ڊيولپر: Microsoft · لائسنس: MIT

ڪوشش ڪريو

CosyVoice3CosyVoice3 معياري

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ڊيولپر: Alibaba (FunAudioLLM) · لائسنس: Apache 2.0

ڪوشش ڪريو

NAMAA Saudi TTSNAMAA Saudi TTS معياري

پهريون مفت سعودي عرب TTS. چاٽربڪس-ڪواليٽي آواز جي کلوننگ سان مقامي سعودي ٻولي.

ڊيولپر: NAMAA Space · لائسنس: MIT

ڪوشش ڪريو

Darwin TTSDarwin TTS معياري

cross-modal Qwen3-TTS قسم FFN وزن سان Qwen3-1.7B ٻولي ماڊل کان گڏيل وڌيڪ واضح ڪيترن ٻولين جي کلوننگ لاءِ.

ڊيولپر: FINAL-Bench · لائسنس: Apache 2.0

ڪوشش ڪريو

MOSS-TTSDMOSS-TTSD معياري

5 اسپيڪر ۽ 60 منٽن تائين گڏيل آڊيو سان پوڊ ڪاسٽ-شڪل گفتگو پيدا ڪريو.

ڊيولپر: OpenMOSS · لائسنس: Apache 2.0

ڪوشش ڪريو

ChatterboxChatterbox پريميئم

State-of-the-art zero-shot آواز ڪلوننگ احساس ڪنٽرول سان Resemble AI کان.

معيار:

ڪوشش ڪريو

Tortoise TTSTortoise TTS پريميئم

ڪيترن ئي آوازن واري متن کان ڳالهائڻ جي معيار تي ڌيان ڏنو ويو آهي autoregressive architecture سان.

معيار:

ڪوشش ڪريو

StyleTTS 2StyleTTS 2 پريميئم

انسان جي سطح تي لفظن کي ٻوليءَ ۾ تبديل ڪرڻ جو طريقو ۽ مقابلي واري تربيت.

معيار:

ڪوشش ڪريو

OpenVoiceOpenVoice پريميئم

فوري آوازن جو کلوننگ شڪل، احساس، ۽ ڌيان تي ڪنٽرول سان.

معيار:

ڪوشش ڪريو

Sesame CSMSesame CSM پريميئم

گفتگو جو ماڊل جيڪو مناسب وقت ۽ احساس سان قدرتي گفتگو پيدا ڪري ٿو.

معيار:

ڪوشش ڪريو

CosyVoice 2CosyVoice 2

Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency.

ٻوليون: en, zh, ja, ko, fr, de, it, es

آواز کلون ڪريو

IndexTTS-2IndexTTS-2

Zero-shot TTS fine-grained احساس ڪنٽرول ۽ اعلي اظهار سان.

ٻوليون: en, zh

آواز کلون ڪريو

Spark TTSSpark TTS

آواز جي ڪلوننگ TTS ڪنٽرول ٿيل احساس ۽ ڳالهائڻ جي انداز سان پروموشنز ذريعي.

ٻوليون: en, zh

آواز کلون ڪريو

GPT-SoVITSGPT-SoVITS

ٿورڙي شاٽ آواز ڪلوننگ TTS جيڪو ڪنهن به آواز کي رڳو 5 سيڪنڊن جي آڊيو مان نقل ڪري ٿو.

ٻوليون: en, zh, ja, ko

آواز کلون ڪريو

ChatterboxChatterbox

State-of-the-art zero-shot آواز ڪلوننگ احساس ڪنٽرول سان Resemble AI کان.

ٻوليون: en

آواز کلون ڪريو

Tortoise TTSTortoise TTS

ڪيترن ئي آوازن واري متن کان ڳالهائڻ جي معيار تي ڌيان ڏنو ويو آهي autoregressive architecture سان.

ٻوليون: en

آواز کلون ڪريو

OpenVoiceOpenVoice

فوري آوازن جو کلوننگ شڪل، احساس، ۽ ڌيان تي ڪنٽرول سان.

ٻوليون: en, zh, ja, ko, fr, es

آواز کلون ڪريو

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.

ٻوليون: vi, en

آواز کلون ڪريو

Chatterbox TurboChatterbox Turbo

200ms جي دير سان تيز چيٽ باڪس ۽ کلڻ، ڪُوڙڻ ۽ وڌيڪ لاءِ پارالنگويسٽڪ ٽيگ.

ٻوليون: en

آواز کلون ڪريو

VoxCPMVoxCPM

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

ٻوليون: en, zh

آواز کلون ڪريو

OuteTTSOuteTTS

LLM تي ٻڌل TTS جيڪو CPU، GPU، يا برائوزر ذريعي llama.cpp ۽ Transformers.js ذريعي هلندو آهي.

ٻوليون: en

آواز کلون ڪريو

Pocket TTSPocket TTS

ھڪڙي نموني مان آواز جي کلوننگ سان Kyutai طرفان ھڪڙو ھلڪو 100M پاراميٽر ماڊل.

ٻوليون: en, fr

آواز کلون ڪريو

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ٻوليون: en, zh, ja, ko, de, es, fr, it, ru

آواز کلون ڪريو

NAMAA Saudi TTSNAMAA Saudi TTS

پهريون مفت سعودي عرب TTS. چاٽربڪس-ڪواليٽي آواز جي کلوننگ سان مقامي سعودي ٻولي.

ٻوليون: ar

آواز کلون ڪريو

Darwin TTSDarwin TTS

cross-modal Qwen3-TTS قسم FFN وزن سان Qwen3-1.7B ٻولي ماڊل کان گڏيل وڌيڪ واضح ڪيترن ٻولين جي کلوننگ لاءِ.

ٻوليون: en, ko, ja, zh

آواز کلون ڪريو

MOSS-TTSDMOSS-TTSD

5 اسپيڪر ۽ 60 منٽن تائين گڏيل آڊيو سان پوڊ ڪاسٽ-شڪل گفتگو پيدا ڪريو.

ٻوليون: en, zh

آواز کلون ڪريو

Ming-Omni TTSMing-Omni TTS

InclusionAI جو 0.5B Omni-Modal سڏ ماڊل اعليٰ وفاداري 44.1kHz آڪسائيڊ ۽ صفر-شوٽ آواز جي کلوننگ سان.

ٻوليون: en, zh

آواز کلون ڪريو

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.

ٻوليون: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

آواز کلون ڪريو

ڊيولپر-پھرين API

OpenAI-compatible REST API. One endpoint, 22+ models. Streaming support for real-time applications.

  • OpenAI مطابقت رکندڙ شڪل
  • ريئل ٽائيم ايپليڪيشنن لاءِ TTS اسٽريمنگ
  • وڏين ڪمن لاءِ بيٽ پروسيس
  • Webhook اطلاع
API دوکو ڏسو
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

سادو، شفاف قيمت

مفت شروع ڪريو. جيئن وڌي رهيا آهيو.

مفت

$0

15,000 ڪارڪن + 5,000/ ڏينھن

  • ڪوڪورو سميت 7 مفت ماڊل
  • 5000 نشان
  • API رسائي شامل
رجسٽر ڪريو

شروع

$9/مھينو

مهينو

  • سڀ 22+ ماڊل
  • 100,000 ڪارا هر نسل ۾
  • آواز جو کلون
شروع ڪريو
تمام مشهور

پرو

$29/مھينو

مهينو

  • شروع ڪندڙ ۾ سڀ ڪجهه
  • API رسائي
  • پرائيويٽ پروسيس
پرو حاصل ڪريو

واپار

$99/مھينو

مهينو

  • پرو ۾ سڀ ڪجهه
  • بلڪ API
  • ترجيح واري قطار
ڪاروبار حاصل ڪريو

سڀ منصوبا ڏسو جن ۾ ڪريڊٽ پيڪيجز شامل آهن →

گھڻا پڇيا ويندا سوال

TTS.ai سڀ کان وڌيڪ جامع AI آواز پليٽ فارم آهي، 22+ متن-to-speech ماڊل، آواز جي کلوننگ، ڳالهائڻ-to-text، ۽ آڊيو اوزارن جي پيشڪش. سڀ ماڊل آهن اوپن سورس سان ڪو به وڪرو ڪندڙ lock-in.

ها! TTS.ai ڪوڪورو، پيپر، VITS، ۽ MeloTTS ماڊلز سان مفت متن-to-speech پيش ڪري ٿو. ڪوبه اڪائونٽ جي ضرورت ناهي. 15،000 مفت ڪردارن کي حاصل ڪرڻ ۽ سڀني ماڊلز تائين رسائي حاصل ڪرڻ لاءِ رجسٽر ڪريو. ادا ڪيل منصوبا $ 9 / مهيني تي شروع ٿين ٿا.

رفتار لاءِ ڪوڪورو يا پيپر استعمال ڪريو. معيار لاءِ CosyVoice 2 يا StyleTTS 2 استعمال ڪريو. آواز جي کلوننگ لاءِ Chatterbox يا GPT-SoVITS استعمال ڪريو. گفتگو لاءِ Dia TTS استعمال ڪريو. مقابلي لاءِ ھڪ ئي متن تي گھڻا ماڊل استعمال ڪريو.

ها. OpenAI-compatible REST API for TTS, STT, voice cloning, and audio tools. هر منصوبي تي شامل آهي بشمول مفت، تناسب جي حدن سان جيڪي طبقي جي مطابق وڌي ٿو (آزاد: 10 req/min, Lite: 20, Starter: 30, Pro: 60, Business: 300). tts.ai/api/ تي دستاويز ڏسو.

آواز جي معيار ماڊل تي منحصر آهي. پريميئم ماڊل جهڙوڪ CosyVoice 2، StyleTTS 2، ۽ Chatterbox تقريبن انسان جي معيار واري ڳالهائڻ کي قدرتي انداز ۽ احساس سان پيدا ڪن ٿا. مفت ماڊل جهڙوڪ Kokoro اڪثر استعمال جي صورتن لاءِ اعليٰ معيار پيش ڪن ٿا.

TTS.ai پنهنجي ماڊل لائبريري ۾ 30 کان وڌيڪ ٻولين کي سپورٽ ڪري ٿو. انگريزي ۾ سڀ کان وڏي ماڊل جي حمايت آهي، پر CosyVoice 2 وانگر ماڊل چيني، جاپاني ۽ ڪورين کي coverڪي ٿو؛ GPT-SoVITS چيني، جاپاني، ڪورين ۽ انگريزي کي سنڀاليندو آهي؛ ۽ MeloTTS انگريزي، اسپيني، فرانسيسي، چيني، جاپاني ۽ ڪورين کي سپورٽ ڪري ٿو.

ھائو. سمورا عمل اسان جي مخصوص GPU سرور تي ٿيندا آھن. اسان توھان جي متن جي داخلا يا پيدا ڪيل آڊيو کي موڪلڻ کان پوءِ محفوظ نه ڪندا آھيون. ڪلوننگ لاءِ اپ لوڊ ڪيل آواز جا نمونا رڳو ھن سيشن لاءِ استعمال ڪيا ويندا آھن ۽ محفوظ نه ڪيا ويندا آھن. توھان جو ڊيٽا اسين ڪڏهن به ٽئين پارٽي سان ونڊ نه ڪندا آھيون يا ان کي ماڊلز کي تربيت ڏيڻ لاءِ استعمال نه ڪندا آھيون.

ھائو. TTS.ai تي پيدا ڪيل سمورا آڊيو توهان جي تجارتي استعمال لاءِ آهن، بشمول يوٽيوب وڊيوز، پوڊ ڪاسٽس، آڊيو ڪتابن، ايپليڪيشنن، اشتهارن ۽ شين لاءِ. اسان جا ماڊل آزاد ذريعن جي اجازت نامن (MIT، Apache 2.0) تحت آهن. ڪوبه رائيلٽي يا حوالو لازمي ناهي.

TTS.ai WAV فارميٽ ۾ آڊيو پيدا ڪري ٿو. توهان MP3، FLAC، OGG، يا M4A استعمال ڪندي اسان جي مفت آڊيو تبديل ڪرڻ واري اوزار کي تبديل ڪري سگهو ٿا. API درخواست ۾ توهان جي پسنديده آڊيو فارميٽ کي سڌو سنئون بيان ڪرڻ جي حمايت ڪري ٿو.

آواز جو مختصر آڊيو نمونو (5 سيڪنڊن کان ٿورو) اپ لوڊ ڪريو جيڪو توهان کلون ڪرڻ چاهيو ٿا، پوءِ ان آواز ۾ ڳالهائڻ پيدا ڪرڻ لاءِ ڪو به متن لکو. چاٽربڪس، GPT-SoVITS، ۽ CosyVoice 2 جهڙا ماڊل آواز جي کلوننگ کي مدد ڏين ٿا. کلون ٿيل آواز ٽون، ڌڙ ۽ ڳالهائڻ جو انداز وٺندو آهي.

مفت ماڊلز (Kokoro, Piper, VITS, MeloTTS) کي ڪوبه اڪائونٽ جي ضرورت نه آهي ۽ صفر ڪريڊٽ جي قيمت آهي. معياري ماڊلز (2 ڪريڊٽ/1K ڪردار) ۾ Bark, CosyVoice 2, F5-TTS, ۽ Dia شامل آهن. پريميئم ماڊلز (4 ڪريڊٽ/1K ڪردار) ۾ OpenVoice, Chatterbox, StyleTTS 2, ۽ Tortoise شامل آهن. ادا ڪيل ماڊلز عام طور تي وڌيڪ معيار، وڌيڪ آواز، ۽ اضافي خاصيتون جهڙوڪ آواز جي کلوننگ پيش ڪن ٿا.

ھائو. API وڏين مقدارن جي متن کي ڳالهائڻ ۾ تبديل ڪرڻ لاءِ باچ پروسيس کي سپورٽ ڪري ٿو. ڪيتريون درخواستون داخل ڪريو ۽ نتيجا ڪم UUIDs استعمال ڪندي غير هم وقت سازي سان حاصل ڪريو. ڪاروباري منصوبي ($99/month) ۽ مٿي تي جلدي باچ پروسيس لاءِ ترجيحي قطار رسائي شامل آهي. آڊيو بڪ پيداوار، ڪورس مواد، ۽ وڏي پيماني تي وڊيو پروجيڪٽس لاءِ مثالي.
4.1/5 (42)

ڇا بهتر ڪري سگھون ٿا؟ توھان جي راءِ اسان کي مسئلا حل ڪرڻ ۾ مدد ڏيندي.

AI آواز استعمال ڪرڻ اڄ شروع ڪريو

TTS.ai استعمال ڪندي ٺاھيندڙن، ڊيولپرن ۽ ڪاروبار سان شامل ٿيو