ৰিয়েলটাইম TTS
উপ-ছেকেণ্ড প্ৰথম-অডিঅ' লেটেন্সিৰ সৈতে টেক্সট-টু-স্পীচ ষ্ট্ৰীমিং। শব্দ এজেন্ট আৰু জীৱিত এপ্লিকেচনৰ বাবে নিৰ্মিত।
ষ্ট্ৰীমিং TTS কিদৰে কাম কৰে
1. টেক্সট প্ৰেৰণ কৰক
/v1/tts/stream/ লে POST টেক্সটক এটা চাৰ্ভাৰ-প্ৰেৰণ কৰা ঘটনা অনুৰোধ হিচাপে।
২. মডেল সৃষ্টি কৰে
Kokoro এ টেক্সট চুঙ্ক কৰে আৰু GPU ত অডিঅ' নমুনা-বিনা-নমুনা সৃষ্টি কৰে।
৩. স্ট্ৰিম চুঙ্ক
Base64-এংকেড WAV চুঙ্কসমূহ SSE ৰ ওপৰত প্ৰৱেশ কৰে আৰু লগে লগে বজোৱা আৰম্ভ কৰে।
4. লাইভ শুনিব
ব্যৱহাৰকাৰীয়ে এটা ছেকেণ্ডত বাক্যাংশৰ আৰম্ভণি শুনিব পাৰে, লম্বা ইনপুটৰ ক্ষেত্ৰতো।
ব্যৱহাৰৰ ঘটনাসমূহ
যেতিয়া উপ-ছেকেণ্ডৰ লেটেন্সিয়ে নতুন অভিজ্ঞতাসমূহ আনলক কৰে।
শব্দৰ এজেন্টসমূহ
এটা মানৱৰ দৰেই দ্রুত উত্তৰ দিয়া কথোপকথন বটসমূহ।
লাইভ ডুবিং
বাফাৰিং স্থগিত নকৰি ৰিয়েল-টাইমত এটা স্ট্ৰিম অনুবাদ কৰক আৰু ডুব কৰক।
খেলা
খেলোয়াড়ৰ পছন্দৰ প্ৰতি তাৎক্ষণিকভাৱে প্ৰতিক্ৰিয়া কৰা NPC ডাইলগ, কোনো পূৰ্বৰ VO নথিপত্ৰ নাই।
অভিগম
ব্যৱহাৰকাৰীৰ ক্লিক কৰাৰ লগে লগে কথা ক'ব আৰম্ভ কৰা পৰ্দ্দা পঢ়ক আৰু সহায়ক সঁজুলি।
ৰিয়েলটাইম TTS পৰিকল্পনাসমূহ
বিনামূল্যে আৰম্ভ কৰক, আরো প্ৰয়োজন হ'লে উন্নত কৰক
- Kokoro ষ্ট্ৰীমিং (মুক্ত মডেল)
- প্ৰতি প্ৰজন্মত ৫০০ আখৰ
- প্ৰতিজন বেনামী ব্যৱহাৰকাৰীৰ বাবে ১০ মুক্ত স্ট্ৰিম/দিন
- উপ-ছেকেণ্ড প্ৰথম-অডিঅ' লেটেন্সী
- HTTPS ৰ ওপৰত SSE ষ্ট্ৰীমিং
- 15,000 আখৰ
- প্ৰতি স্ট্ৰিম ৫,০০০ আখৰ
- প্ৰগ্ৰামিক অভিগম ব্যৱহাৰৰ বাবে API চাবি
- সৃষ্টিৰ ইতিহাস
- দিনত স্ট্ৰিমৰ সীমা নাই
- MOSS-TTS-Realtime (সত্য সময়ত)
- প্ৰতি স্ট্ৰিম ১০০,০০০ আখৰ
- অগ্ৰাধিকাৰ GPU লাইন
- শব্দ এজেন্ট + Twilio একত্ৰিত
- উচ্চ হাৰ সীমা
সদায় সোধা প্ৰশ্নসমূহ
আমি কি উন্নত কৰিব পাৰো? আপোনাৰ মতামত আমাক সমস্যা সমাধানত সহায় কৰে।
ৰিয়েল টাইমত কথোপকথন প্ৰবাহিত কৰক
দিনত প্ৰথম ১০টা প্ৰজন্মৰ বাবে বিনামূলীয়া। সম্পূৰ্ণ আখৰ অনুমতি আৰু API অভিগম আনলক কৰিবলৈ সাবস্ক্ৰাইব কৰক।