AI শব্দ এজেন্টসমূহ

স্বনিৰ্বাচিত ব্যক্তিত্বসমূহৰ সৈতে বুদ্ধিমান শব্দ এজেন্টসমূহ নিৰ্মাণ কৰক। গ্ৰাহক সমৰ্থন, গ্ৰহণ, টিউটোৰিঙৰ বাবে আৰু অধিক প্ৰয়োগ কৰক।

এজেন্ট নিৰ্মাতা

এজেন্টৰ বৰ্ণনা কৰক

বৈশিষ্ট্যাবলী

Voice Agents কিদৰে কাম কৰে

১. আপুনি কথা কয়

আপোনাৰ এজেন্টৰ সৈতে স্বাভাৱিকভাৱে কথা পাতক। আপোনাৰ বক্তব্য ৰেয়াল টাইমত ৰেকৰ্ড আৰু স্ট্ৰিম কৰা হয়।

২. STT অনুলিপি

Whisper ৰ দ্বাৰা ৯৯টা ভাষাত সঠিকভাৱে আপোনাৰ কথোপকথন লিপিলৈ ৰূপান্তৰ কৰা হ'ব।

LLM প্ৰক্ৰিয়াসমূহ

এজেন্ট

4. TTS প্ৰতিক্ৰিয়া

আপোনাৰ নিৰ্বাচিত কন্ঠ আৰু মডেল ব্যৱহাৰ কৰি প্ৰতিক্ৰিয়াক স্বাভাৱিক কথোপকথনত ৰূপান্তৰ কৰা হয়।

এজেন্টৰ ধৰণ

প্ৰত্যেক উদ্যোগ আৰু ব্যৱহাৰৰ ক্ষেত্ৰত ১৫টা প্ৰস্তুত এজেণ্ট টেমপ্লেট

গ্ৰাহক-মুখী

শিক্ষা আৰু প্ৰশিক্ষণ

সৃষ্টিশীল আৰু বিনোদন

ব্যৱসা আৰু অভ্যন্তৰীণ

ব্যক্তিগত

ভয়েছ এজেণ্ট কিয়?

AI-powered voice agents যি আপোনাৰ প্ৰয়োজন অনুসাৰে স্কেল কৰে

২৪/৭ উপলব্ধতা

ভয়েস এজেন্টসমূহ কেতিয়াও শুব নোৱাৰে। কৰ্মচাৰীৰ অতিৰিক্ত ব্যয় নোহোৱাকৈ কল আৰু কথোপকথনসমূহ ঘড়িৰ কাষত হ্যান্ডেল কৰক।

বহুভাষিক

30+ ভাষাত প্ৰাকৃতিক-স্বৰেৰে গ্ৰাহকসকলক সমৰ্থন কৰক। বহুভাষী কৰ্মচাৰীৰ প্ৰয়োজন নাই।

স্বনিৰ্বাচিত ব্যক্তি

আপোনাৰ এজেন্ট নিৰ্ধাৰণ কৰক

কম লেটেন্সী

অনুকূলিত STT, LLM, আৰু TTS পাইপলাইনসমূহৰ দ্বাৰা সমৰ্থিত সাব-ছেকেণ্ড প্ৰতিক্ৰিয়াৰ সময়সমূহ নিবেদিত GPUs ত।

সদায় সোধা প্ৰশ্নসমূহ

AI শব্দ এজেন্টসমূহ কথোপকথন AI প্ৰণালীসমূহ যেনে ভাষা স্বীকৃতি (STT), এটা ভাষা মডেল (LLM), আৰু টেক্সট-টু-স্পিচ (TTS) একত্ৰিত কৰে প্ৰাকৃতিক শব্দ কথোপকথন ৰখাৰ বাবে। তেওঁলোকে প্ৰশ্নসমূহৰ উত্তৰ দিব পাৰে, নিৰ্দেশসমূহ অনুসৰণ কৰিব পাৰে, আৰু স্বাধীনভাৱে কামসমূহ সম্পূৰ্ণ কৰিব পাৰে - এটা ভাৰ্চুৱেল ৰেস্পেঞ্চিষ্ট বা সমৰ্থন এজেন্টৰ দৰে।

ভয়েস চেট হৈছে AI ৰ সৈতে এটা সাধাৰণ উদ্দেশ্য 1:1 কথোপকথন। এজেন্টসমূহ নিৰ্দিষ্ট কাৰ্য্যসমূহৰ বাবে উদ্দেশ্য-নিৰ্মাণ কৰা হয় - তেওঁলোকৰ এটা নিৰ্দিষ্ট ব্যক্তিত্ব, জ্ঞান ভিত্তি, আৰু কাৰ্য্যপ্ৰবাহ আছে। এটা এজেন্ট এটা গ্ৰাহক সেৱা বট হব পাৰে যি আপোনাৰ FAQ অনুসৰণ কৰে, যেতিয়া ভয়েস চেট এটা উন্মুক্ত-অন্ত কথোপকথন।

গ্ৰাহক সেৱা বট, টেলিফোন আইভিআৰ ব্যৱস্থা, ভাৰ্চুৱেল ৰিচেপশ্যনিষ্ট, টিউটৰিং সহায়ক, বিক্রয় দক্ষতা বট, সাক্ষাৎকাৰৰ সময়সূচী নিৰ্ধাৰণকাৰী, প্ৰতিক্ৰিয়াশীল কাহিনীকাৰ, চিকিৎসা সহায়ক, ভাষা প্ৰয়োগৰ সহযোগী আদি।

কম-লেটেন্সি কথোপকথন এজেন্টসমূহৰ বাবে, Kokoro আদর্শ - ই প্ৰকৃত সময়ৰ তুলনাত প্ৰায় ১০০x দ্ৰুতভাৱে কথোপকথন সৃষ্টি কৰে। অধিক প্ৰাকৃতিক কথোপকথনৰ বাবে, Dia TTS মাল্টি-স্পীকাৰ কথোপকথন সমৰ্থন কৰে। কথোপকথন ক্লোনিংৰ বাবে (এক ব্ৰ্যান্ডৰ কথোপকথন মিলোৱা), Chatterbox অথবা GPT-SoVITS ব্যৱহাৰ কৰক।

হ্যাঁ। STT পাইপলাইন (Faster Whisper) বুজাবুজিৰ বাবে ৯৯টা ভাষা সমৰ্থন কৰে, আৰু CosyVoice ২ আৰু GPT-SoVITS ৰ দৰে TTS মডেলে উত্তৰ দিয়াৰ বাবে ৮+টা ভাষা সমৰ্থন কৰে। আপুনি বহুভাষী এজেন্ট নিৰ্মাণ কৰিব পাৰে যি কলকাৰীৰ ভাষাত চিনাক্ত কৰে আৰু উত্তৰ দিয়ে।

End-to-end latency (speech in → speech out) সাধাৰণতে TTS ৰ বাবে Kokoro আৰু STT ৰ বাবে Faster Whisper ব্যৱহাৰ কৰি ১-৩ ছেকেণ্ড। ইয়াত STT transcription (~২০০ms), LLM response (~৫০০ms-১s), আৰু TTS synthesis (~২০০ms) অন্তৰ্ভুক্ত।

হ্যাঁ। প্ৰত্যেক এজেন্টৰ এটা চিস্টেম প্ৰমপ্ট আছে যি তাৰ ব্যক্তিত্ব, জ্ঞান, টোন, আৰু আচৰণৰ নিয়মসমূহ সংজ্ঞায়িত কৰে। আপুনি ইয়াক আনুষ্ঠানিক অথবা আনুষঙ্গিক কৰিব পাৰে, বিষয়ৰ সীমাবদ্ধতাসমূহ সংহতি কৰক, escalation নিয়মসমূহ সংজ্ঞায়িত কৰক, আৰু অজ্ঞাত প্ৰশ্নসমূহ হ্যান্ডেল কৰা নিয়ন্ত্ৰণ কৰক।

হ্যাঁ। কথা স্বীকৃতিৰ বাবে আমাৰ STT API ব্যৱহাৰ কৰক, বুদ্ধিমত্তাৰ বাবে যিকোনো LLM API, আৰু শব্দ আউটপুটৰ বাবে আমাৰ TTS API। আমাৰ OpenAI-সংগতিপূৰ্ণ এণ্ডপয়েন্টসমূহে একত্ৰীকৰণ সহজ কৰে। প্ৰো আৰু এন্টারপ্ৰাইজ প্লেনত API অভিগম অন্তৰ্ভুক্ত আছে।

হ’ব। ফোন-ভিত্তিক আইভিআৰ ব্যৱস্থা, আউটবউণ্ড কলিং বট আৰু ভাৰ্চুৱেল ৰিচিপচনিষ্ট স্থাপনৰ বাবে আমাৰ ভয়েছ এজেণ্ট এপিআইক টুইলিঅ’, ভোনেজ বা পলিব’ৰ দৰে টেলিফোন প্লেটফৰ্মৰ সৈতে সংযোগ কৰক।

এজেণ্টৰ মূল্য ব্যৱহাৰ কৰা মডেলৰ ওপৰত নিৰ্ভৰ কৰে। ফ্ৰি-টিয়াৰ মডেলৰ (Kokoro, Piper) মূল্য TTS ৰ বাবে0ক্ৰেডিট। STT প্ৰতি মিনিটত 1 ক্ৰেডিট। LLM মূল্য আপোনাৰ প্ৰদানকাৰীৰ ওপৰত নিৰ্ভৰ কৰে। আৰম্ভণি পৰিকল্পনা ($9/mo) ৫০০ ক্ৰেডিট অন্তৰ্ভুক্ত কৰে, শত শত এজেণ্টৰ ক্ৰিয়া-প্ৰতিক্ৰিয়াৰ বাবে যথেষ্ট।

হ্যাঁ। আমাৰ শব্দ ক্লোনিং বৈশিষ্ট্য ব্যৱহাৰ কৰি এটা সংক্ষিপ্ত অডিঅ' নমুনা (৫ ছেকেণ্ডতকৈ কম) ৰ পৰা এটা স্বনিৰ্বাচিত শব্দ সৃষ্টি কৰক। Chatterbox আৰু GPT-SoVITS ৰ দৰে মডেলসমূহে আপোনাৰ শব্দ বা যিকোনো ব্ৰ্যান্ডৰ শব্দক এটা স্থায়ী এজেন্ট অভিজ্ঞতাৰ বাবে ক্লোন কৰিব পাৰে।

হ্যাঁ। সকলো প্ৰক্ৰিয়াকৰণ আমাৰ নিবেদিত GPU চাৰ্ভাৰত ঘটে। প্ৰক্ৰিয়াকৰণৰ পিছত আমি কথোপকথনৰ অনুলিপি বা অডিঅ' সংৰক্ষণ নকৰোঁ। কোনো তথ্য তৃতীয় পক্ষৰ সৈতে ভাগ কৰা নহয় বা প্ৰশিক্ষণৰ বাবে ব্যৱহাৰ কৰা নহয়। এন্টারপ্ৰাইজ প্লেনসমূহে অতিৰিক্ত তথ্য বিচ্ছিন্নকৰণৰ বিকল্পসমূহ প্ৰদান কৰে।
5.0/5 (1)

আপোনাৰ প্ৰথম শব্দ এজেন্ট নিৰ্মাণ কৰক

মিনিটসমূহত বুদ্ধিমান শব্দ এজেন্টসমূহ সৃষ্টি কৰক। বিনামূলীয়াকৈ নিবন্ধন কৰক আৰু নিৰ্মাণ আৰম্ভ কৰিবলৈ ৫০ ক্রেডিট প্ৰাপ্ত কৰক।