TTS Arena — AI آواز ماڊل ليڊر بورڊ

مختلف ماڊلز طرفان ڳالهائيندڙ هڪ ئي متن کي ٻڌو، سڀ کان وڌيڪ قدرتي آواز لاءِ ووٽ ڏيو، ۽ ڏسو ته 24+ TTS ماڊلز اسان جي برادري جي اڳواڻن تي ڪيئن درجه بندي ڪن ٿا.

ماڊل جي درجه بندي ڪميونٽي ووٽ بينچمارڪ A/B آزمائش ليڊر بورڊ

TTS آرينا خاصيتون

AI آواز ماڊلز جو جائزو وٺڻ جو هڪ منصفانه، سوسائٽي ڊرائيو طريقو

سرڪاري بينچ مارڪ

معياري جائزو ميٽرڪ سميت MOS (متوسط راءِ اسڪور)، ڪردار جي غلطي جي شرح، ڳالهائيندڙ جي مشابهت، ۽ سڀني 20+ ماڊلز ۾ ريئل-ٽائم عنصر.

برادري جي تصنيف

حقيقي TTS استعمال ڪندڙن کان استعمال ڪندڙن طرفان داخل ڪيل تصنيفون ۽ جائزو. ڏسو ته ڪهڙا ماڊل خاص استعمال جي صورتن لاءِ بهترين ڪم ڪن ٿا، سوسائٽي جي رپورٽ تي ٻڌل.

پاسي پاسي مقابلو

ٻن مختلف ماڊلن سان ھڪ جھڙو متن پيدا ڪريو ۽ پنھنجي براؤزر ۾ سڌو سنئون آڊيو جي معيار، طبيعت ۽ رفتار جو مقابلو ڪريو.

20+ ماڊل

TTS.ai تي هر ماڊل کي معياري ۽ درجه بندي ڪئي وئي آهي. توهان جي مثالي ماڊل ڳولڻ لاءِ رفتار، معيار، ٻولي مدد، خاصيتون ۽ لائسنس سان فلٽر ڪريو.

تفصيلي ميٽرڪ

هر ماڊل جي ڪارڪردگي ۾ گهمڻ: لاٽنسي، ٽرانسپوٽ، VRAM استعمال، مدد ڏنل ٻوليون، ڪلوننگ جي معيار، ۽ جذباتي رينج اسڪور.

استعمال ڪرڻ لاءِ مفت

ليڊر بورڊ جو دورو ڪريو، ماڊلز جو مقابلو ڪريو، ۽ معيار تي ووٽ ڏيو - سڀ مڪمل طور تي مفت. ڪوبه اڪائونٽ تصنيفن ۽ معيارن کي ڳولڻ جي ضرورت ناهي.

ميدان ۾ ماڊل

سڀ 24+ ماڊل مٿين رتبي لاءِ مٿان مٿان مقابلو ڪندا آهن

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ھن لاءِ بهترين: مٿين درجي وارو مفت ماڊل - بهترين رفتار-ڪواليٽي جو تناسب ليڊر بورڊ تي

ڪوشش ڪريو Kokoro

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 آواز جو کلون

ھن لاءِ بهترين: اعليٰ درجي وارو آواز کلوننگ ماڊل احساس ڪنٽرول جي صلاحيتن سان

ڪوشش ڪريو Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 آواز جو کلون

ھن لاءِ بهترين: انسانن جي برابري جي طبيعت جي اسڪور سان مٿين ڪيترن ٻولين وارو ماڊل

ڪوشش ڪريو CosyVoice 2

StyleTTS 2StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

Medium 5/5

ھن لاءِ بهترين: سڀني اوپن سورس ماڊلن جي وچ ۾ سڀ کان وڏو هڪ اسپيڪر MOS اسڪور

ڪوشش ڪريو StyleTTS 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

ھن لاءِ بهترين: قدرتي گفتگو جي پيدائش لاءِ اڳواڻ گفتگو جو ماڊل

ڪوشش ڪريو Sesame CSM

TTS Arena ڪيئن ڪم ڪري ٿو

آواز جي معيار تي ووٽ ڏيو ۽ بهترين AI ماڊلن کي ترتيب ڏيڻ ۾ مدد ڏيو

1

اڳواڻن جي بورڊ جو دورو ڪريو

سڀني 20+ ماڊلز کي معيار، رفتار ۽ خاصيتن جي مطابق درجه بندي ڪريو. سطح (آزاد، معياري، پريميئم) يا خاص صلاحيتن سان فلٽر ڪريو.

2

ماڊلز جو مقابلو

ٻه ماڊل چونڊيو ۽ ٻنھي سان ھڪ جھڙو متن پيدا ڪريو. نتيجو ٻڌو ۽ ان جو طبعيت، شفافيت ۽ جذباتي اظهار سان مقابلو ڪريو.

3

معيار تي ووٽ ڪريو

مقابلي کان پوءِ، ان ماڊل کي ووٽ ڏيو جيڪو بهتر لڳي ٿو. توهان جا ووٽ سوسائٽي جي درجي بندي ۾ حصو وٺن ٿا ۽ ٻين استعمال ڪندڙن کي چونڊڻ ۾ مدد ڏين ٿا.

4

پنھنجو مثالي ماڊل ڳوليو

توهان جي خاص استعمال جي صورتحال، بجيٽ ۽ معيار جي ضرورتن لاءِ بهترين ماڊل چونڊڻ لاءِ ليڊر بورڊ ڊيٽا ۽ سوسائٽي ريٽنگ استعمال ڪريو.

TTS آرينا ڇا آھي؟

AI آواز ماڊلز جي درجي بندي لاءِ هڪ برادري هلائيندڙ طريقو

Blind A/B مقابلو

هي ميدان ٻن بي ترتيب چونڊيل ماڊلن جي ڳالهائڻ سان هڪڙو ئي متن پيش ڪري ٿو. توهان ٻنهي نمونن کي ٻڌو ٿا ان جي ڄاڻڻ کانسواءِ ته ڪهڙو ماڊل انهن کي پيدا ڪيو آهي، پوءِ ان لاءِ ووٽ ڏيو جيڪو وڌيڪ طبيعي لڳي ٿو. هيءَ انڌو ٽيسٽ برانڊ جي بي انصافي کي ختم ڪري ٿي ۽ صرف آڊيو معيار تي ٻڌل فيصلو ڪرڻ تي زور ڏئي ٿي.

  • ھڪڙو متن، ٻه نامعلوم ماڊل
  • ووٽ ڏيڻ کانپوءِ ماڊل جا نالا ظاهر ڪيا ويا
  • هر دور ۾ تازو بي ترتيب جوڙو
  • ڪوبه برانڊ بياس — خالص آڊيو معيار

رائيٽنگ سسٽم

ماڊل ايلو ريٽنگ سسٽم استعمال ڪندي ريٽنگ ڪيا ويندا آھن، شطرنج جي رانديگرن جي ريٽنگ لاءِ ساڳيو الگورٿم استعمال ڪيو ويندو آھي. اعليٰ ريٽنگ واري ماڊل جي مقابلي ۾ ڪاميابي حاصل ڪرڻ گهٽ ريٽنگ واري ماڊل جي مقابلي ۾ ڪاميابي حاصل ڪرڻ کان وڌيڪ پوائنٽ حاصل ڪندو آھي. هزارين ووٽن کان وڌيڪ، اھو ھڪ معتبر ريٽنگ پيدا ڪندو آھي جيڪو حقيقي برادري جي ترجيح کي ظاھر ڪندو آھي.

  • ايلو تي ٻڌل درجه بندي الگورٿم
  • هر ووٽ سان تصنيفون ترتيب ڏيو
  • انگن اکرن جي اعتماد جي فاصلن
  • وقت سان گڏ تصنيفون مستحڪم ٿين ٿيون

ماڊل مقابلي جي اڳيان ڏسڻ

اسان جا 24+ ماڊل ڪيئن اهم ابعاد ۾ مقابلو ڪن ٿا

ماڊل جانور معيار رفتار ٻوليون کلوننگ
Kokoro مفت 4.5/5 ٺيڪ 8
Bark معياري 4.0/5 ميڊيا 13
CosyVoice2 معياري 4.5/5 ميڊيا 6
Tortoise TTS پريميئم 4.8/5 ھلڪو 1
Chatterbox پريميئم 4.7/5 ميڊيا 1
StyleTTS 2 پريميئم 4.7/5 ٺيڪ 1

ماپ جا معيار

TTS ماڊل کي ميدان ۾ وڌيڪ مرتبو ڇا ڏئي ٿو

فطرت

اھو ھڪ سچي ماڻھوءَ جيان لڳندو آھي ڇا؟ انساني ڳالھائڻ سان ٺھيل قدرتي پروسوڊي، ريتم، ۽ انتونيشن نمونا. ڪوبه روبوٽڪ مصنوعي يا غير طبيعتي وقفو.

اظهار

ڇا آواز مناسب احساس ۽ زور ڏئي ٿو؟ سٺا ماڊل سوالن، اکرن ۽ جذباتي ماحول کي طبعي طور تي هلائيندا آهن.

دقت

سڀ لفظ صحيح طرح اچاريندو آھي ڇا؟ غير معمولي لفظن، نمبرن، مختصر لفظن ۽ غير ملڪي نالن کي غلطين يا اڻ سڌريل آوازن کانسواءِ سنڀاليندو آھي.

بهترين AI آوازن جي درجه بندي ۾ مدد ڪريو

توھان جا ووٽ سڌو سنئون ليڊر بورڊ تي اثر انداز ٿين ٿا. سڀڪو مقابلو سوسائٽي کي بهترين ماڊل ڳولڻ ۾ مدد ڪري ٿو.

TTS ميدان ۾ داخل ٿيو

گھڻا پڇيا ويندا سوال

TTS Arena ۽ ماڊل جي درجي بندي بابت عام سوال

اهو 20+ ماڊلز کي سرڪاري معيارن ۽ برادري جي ووٽ جي بنياد تي درجه بندي ڪري ٿو، استعمال ڪندڙن کي سندن ضرورتن لاءِ بهترين ماڊل ڳولڻ ۾ مدد ڏيندو آهي معياري جائزي ۽ ساڄي پاسي جي مقابلي ذريعي.

ماڊلز کي ڪيترن ئي ميٽرڪ تي جائزو ورتو ويندو آهي: MOS (متوسط راءِ اسڪور) موضوعي معيار لاءِ، حرفن جي غلطي جي شرح آواز جي دقت لاءِ، رفتار لاءِ ريئل ٽائيم فڪٽر، ڪارڪردگي لاءِ VRAM استعمال، ۽ حقيقي دنيا جي ترجيح لاءِ سوسائٽي ووٽ. اسڪور هڪ مجموعي رتيءَ کي پيدا ڪرڻ لاءِ وزن ڪيا ويندا آهن.

MOS ڳالهائڻ جي معيار کي ماپڻ لاءِ معياري ميٽرڪ آهي. انسان ٻڌندڙ ڳالهائڻ جي نمونن کي 1-5 جي پيماني تي طبعيت لاءِ درجه بندي ڪندا آهن. 4.0 کان مٿي جا نمبر انسان جي معيار جي ويجهو سمجهيا ويندا آهن. اسان جا مٿين ماڊل 4.2-4.5 جا MOS نمبر حاصل ڪندا آهن، جيڪي طبعي انسان جي ڳالهائڻ جي رڪارڊنگ جي مقابلي ۾ آهن.

درجه بندي معيار تي منحصر آهي. ڪوڪورو رفتار ۽ معيار جي نسبت ۾ اڳواڻ آهي. StyleTTS 2 اعليٰ هڪ اسپيڪر MOS حاصل ڪري ٿو. چاٽربڪس آواز جي ڪلوننگ جي درجه بندي ۾ اڳواڻ آهي. CosyVoice 2 ڪيترن ٻولين جي معيار ۾ اڳواڻ آهي. هر صنف ۾ موجوده درجي بندي لاءِ اڳواڻن جي لسٽ ڏسو.

ها. پاسي پاسي جي مقابلن کي ٻڌو ۽ ان ماڊل لاءِ ووٽ ڏيو جيڪو بهتر لڳي ٿو. ووٽ ڏيڻ مفت آهي ۽ اڪائونٽ جي ضرورت نه آهي. برادري جا ووٽ سڌو سنئون درجه بندي تي اثر انداز ٿين ٿا ۽ مختلف استعمال جي ڪيسن لاءِ بهترين ماڊل ظاهر ڪرڻ ۾ مدد ڏين ٿا.

جڏهن نئون ماڊل شامل ڪيو ويندو آهي يا موجود ماڊل اهم تازه ڪاري حاصل ڪندا آهن ته سرڪاري معيار اپڊيٽ ڪيا ويندا آهن. برادري جي درجه بندي حقيقي وقت ۾ اپڊيٽ ڪئي ويندي آهي جيئن ووٽ داخل ٿيندا آهن. اسين سڀني ماڊلن جو چوٿين حصي ۾ ٻيهر جائزو وٺندا آهيون ته جيئن مسلسل ۽ منصفانه مقابلو يقيني بڻايو وڃي.

ڪارڪردگي جي غلطي جي شرح (CER) پيدا ڪيل ڳالهائڻ کي نقل ڪري ۽ ان کي داخل ڪيل متن سان موازنہ ڪري ڳالهائڻ جي دقت کي ماپيندي آهي. گهٽ CER جو مطلب آهي ته ماڊل لفظ وڌيڪ دقت سان ڳالهائيندو آهي. GLM-TTS اوپن سورس ماڊلن ۾ تمام گهٽ CER حاصل ڪري ٿو.

متن جو نمونو داخل ڪريو، ٻه ماڊل چونڊيو ۽ ٺاھڻ تي ڪلڪ ڪريو. ٻئي ماڊل ھڪ ئي متن مان آڊيو پيدا ڪندا آھن. ٻنھي آڊيو کي ٻڌو ۽ فيصلو ڪريو ته ڪھڙو وڌيڪ قدرتي، صاف ۽ ظاھر ڪندڙ آھي. پوءِ پنھنجي پسنديده ماڊل لاءِ ووٽ ڏئي سگھو ٿا.

ھائو. اسان پنھنجو معياري طريقيڪار، ٽيسٽ جملا، ۽ جائزو وٺڻ جا معيار شايع ڪندا آھيون. سڀ ماڊل ھڪ ئي GPU هارڊويئر تي ھڪ جھڙن حالتن ۾ آزمايا ويندا آھن. برادري جا ميمبر اسان جي شايع ڪيل ٽيسٽ سيٽن ۽ اسڪورنگ جي عنوانن کي استعمال ڪندي نتيجا ٻيهر پيدا ڪري سگھن ٿا.

ايريا تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي مرڪز تي.

پنھنجن ترجيحن تي غور ڪريو: رفتار (حقيقي وقت جون ضرورتون بيٽ پروسيسنگ جي مقابلي ۾)، معيار (MOS اسڪور)، ٻوليءَ جي حمايت، خاص خاصيتون (آواز جي کلوننگ، احساس ڪنٽرول، گفتگو)، لائسنس جي شرطن، ۽ بجيٽ (آزاد بدران پريميئم سطح). arena filters help narrow options by these criteria.

ڪوڪورو (آزاد) 5/5 معياري اسڪور حاصل ڪري ٿو، ڪيترن پريميئم ماڊلز سان مطابقت رکي ٿو. پريميئم ماڊلز جا بنيادي فائدا خاص خاصيتون آهن جيئن آواز جي کلوننگ (چاٽربڪس)، انداز جي پکيڙ (سٽائل ٽي ٽي ايس 2)، ۽ گفتگو واري ڳالهائڻ (سيسم سي ايس ايم) بجاءِ خام آڊيو معيار.
5.0/5 (1)

TTS ميدان ۾ پنهنجو ووٽ ڏيو

AI جي آوازن کي ٻڌو، بهترين لاءِ ووٽ ڏيو، ۽ اسان جي 24+ ماڊلن جي سوسائٽي ڊرائيو ليڊر بورڊ کي ڳوليو.