رئیل ٹائم TTS
سب-سیکنڈ پہلے آڈیو لاٹیسی کے ساتھ ٹیکس-تو-زبان کی اسٹریمنگ۔ وائٹس ایجنٹ اور لائیو ایپلیکیشنز کے لیے بنایا گیا۔
سٹریمنگ TTS کیسے کام کرتا ہے
متن بھیجیں
/v1/tts/stream/ پر POST متن سرور- بھیجے ہوئے واقعات کی درخواست کے طور پر.
ماڈل پیدا کرتا ہے
Kokoro متن کو ٹکڑے کر تا هے اور GPU پر او ديو نمونے بنا تا هے
3. سٹریم چنکس
Base64-encoded WAV chunks SSE پر آتے ہیں اور فوراً بھڑکتے ہیں
4. لائیو سنیں
صارف کو ایک سیکنڈ کے اندر جملے کی شروعات سنائی جاتی ہے، حتیٰ کہ طویل انپٹوں پر بھی۔
استعمال کے حالات
جہاں سب سیکنڈ latency نئے تجربات کو کھولتا ہے.
آواز کے ایجنٹس
ایک انسان کی طرح تیزی سے جواب دینے کے لئے گفتگو روبوٹ.
لائي و ڈوبنگ
ترجمہ اور ریئل ٹائم میں ایک اسٹریم کو بفرنگ توقف کے بغیر ڈب کریں.
کھیل
NPC ڈائيلاگ جو کھلا ڑي کے انتخاب کو فوري طور پر رد عمل ديتا هے ، کوئی پرينڈرڈ VO نهيں
رسائی
اسکرین ریڈر اور مددگار اوزار جو استعمال کرنے والے کے کلک کرنے کے وقت بولنا شروع کرتے ہیں.
ریل ٹائم TTS منصوبے
مفت شروع کریں، آپ کو مزید ضرورت ہو تو اپگریڈ کریں
- Kokoro سٹریمینگ (آزاد ماڈل)
- 500 حروف پر نسل
- 10 مفت اسٹریمس/دن ہر نامعلوم صارف
- سب سیکنڈ پہلے آڈیو لاٹینسی
- HTTPS پر SSE اسٹریمنگ
- 15,000 حروف پر سائن اپ
- 5000 حروف پر سٹریم
- پروگرامیٹک رسائی کے لیے API کلید
- گزشتہ تاریخ
- کوئی روزانہ سٹریم کیپ نہیں
- MOSS-TTS-Realtime (جب زندہ ہو)
- 100,000 حروف پر سٹریم
- GPU کی ترجیح
- آواز ایجنٹ + Twilio انٹیگریشن
- اعلی حد
بار بار پوچھے گئے سوالات
ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.
رئیل ٹائم میں بولنا
دن میں پہلی دس نسلوں کے لیے مفت. مکمل کریٹر اجازہ اور API رسائی کو کھولنے کے لیے رجسٹر کریں.