Report Bug / Feature Request

AI ভয়েস এজেন্ট - কথোপকথন AI সহকারী নির্মাণ করুন

স্বনির্ধারিত ব্যক্তিত্বের সাথে বুদ্ধিমান ভয়েস এজেন্ট তৈরি করুন। গ্রাহক সমর্থন, অভ্যর্থনা, টিউটোরিয়াল এবং আরও অনেক কিছুর জন্য ব্যবহার করুন।

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

এজেন্ট নির্মাতা

এজেন্টের ভূমিকা, ব্যক্তিত্ব, জ্ঞানের ডোমেইন এবং কথাবার্তার নিয়ম বর্ণনা করুন।

বৈশিষ্ট্য

ভয়েস এজেন্ট কিভাবে কাজ করে

১. তুমি কথা বল

আপনার এজেন্টের সাথে স্বাভাবিকভাবে কথা বলুন। আপনার বক্তব্য রেকর্ড করা হবে এবং বাস্তব সময়ে স্ট্রিম করা হবে।

২. এসটিটি ট্রান্সক্রিপ্ট

উইস্পার ৯৯টি ভাষায় সঠিকভাবে আপনার বক্তব্যকে টেক্সটে রূপান্তর করে।

৩. এলএলএম প্রক্রিয়া

এজেন্টের এলএলএম মস্তিষ্ক আপনার ইনপুট প্রসেস করে তার ব্যক্তিত্ব এবং সিস্টেম প্রম্পট ব্যবহার করে।

৪. TTS সাড়া দেয়

আপনার নির্বাচিত শব্দ এবং মডেল ব্যবহার করে প্রতিক্রিয়াটি প্রাকৃতিক ভাষায় রূপান্তরিত হবে।

এজেন্টের ধরন

প্রতিটি শিল্প এবং ব্যবহারের ক্ষেত্রের জন্য পূর্বনির্মিত এজেন্ট টেমপ্লেট

গ্রাহক-মুখী

শিক্ষা ও প্রশিক্ষণ

সৃজনশীল & বিনোদন

ব্যবসায়িক এবং অভ্যন্তরীণ

ব্যক্তিগত

কেন ভয়েস এজেন্ট?

AI-চালিত ভয়েস এজেন্ট যে আপনার প্রয়োজনের সাথে স্কেল

২৪/৭ উপলব্ধতা

ভয়েস এজেন্টরা কখনো ঘুমায় না। তারা কল এবং কথোপকথন নিয়ন্ত্রণ করে।

বহুভাষিক

৩০+ ভাষায় স্বাভাবিক শব্দের মাধ্যমে গ্রাহকদের সমর্থন করুন। বহুভাষী কর্মীদের প্রয়োজন নেই।

স্বনির্বাচিত ব্যক্তি

আপনার এজেন্টের ব্যক্তিত্ব, টোন এবং বিশেষজ্ঞতা নির্ধারণ করুন। প্রত্যেক এজেন্টকে অসাধারণ এবং ব্র্যান্ডের সাথে যুক্ত মনে হবে।

কম লেটেন্সি

সাব-সেকেন্ড প্রতিক্রিয়া সময় অনুকূলিত STT, LLM, এবং TTS পাইপলাইন দ্বারা চালিত বিশেষ GPUs।

প্রায়শ জিজ্ঞাসিত প্রশ্ন

এআই ভয়েস এজেন্ট হচ্ছে এক ধরনের কথোপকথনমূলক এআই সিস্টেম, যেখানে শব্দ সনাক্তকরণ (এসটিটি), ভাষা মডেল (এলএলএম) এবং টেক্সট-টু-স্পিচ (টিটিএস)-এর সমন্বয় ঘটানো হয়েছে। এরা প্রশ্নের উত্তর দিতে পারে, নির্দেশনা অনুসরণ করতে পারে এবং স্বয়ংক্রিয়ভাবে কাজ সম্পন্ন করতে পারে - যেমন একজন ভার্চুয়াল রিসিভার বা সাপোর্ট এজেন্ট।

ভয়েস চ্যাট হল AI এর সাথে সাধারণ উদ্দেশ্যে ১:১ কথোপকথন। এজেন্টরা নির্দিষ্ট কাজের জন্য নির্মিত হয় - তাদের একটি নির্দিষ্ট ব্যক্তিত্ব, জ্ঞান ভিত্তি এবং কর্মপ্রবাহ থাকে। একজন এজেন্ট হতে পারে একটি কাস্টমার সার্ভিস বট যে আপনার FAQ অনুসরণ করে, যখন ভয়েস চ্যাট একটি উন্মুক্ত-শেষ কথোপকথন।

কাস্টমার সার্ভিস রোবট, ফোন আইভিআর সিস্টেম, ভার্চুয়াল রিসিভার, টিউটরিং সহকারী, বিক্রয় দক্ষতা রোবট, মিটিং প্ল্যানার, মিথস্ক্রিয় গল্পকার, চিকিৎসা সহযোগী, ভাষা প্রশিক্ষণ সহযোগী এবং আরো অনেক কিছু।

কম-লাটেন্সি কথোপকথন এজেন্টের জন্য, Kokoro আদর্শ - এটি বাস্তব-সময়ের চেয়ে প্রায় ১০০ গুণ দ্রুত শব্দ তৈরি করে। আরও প্রাকৃতিক ডায়ালগের জন্য, Dia TTS বহু-স্পিকার কথোপকথন সমর্থন করে। শব্দ ক্লোন করার জন্য (ব্যানার শব্দের সাথে মিল রেখে), Chatterbox অথবা GPT-SoVITS ব্যবহার করুন।

হ্যাঁ। STT পাইপলাইন (Faster Whisper) ৯৯টি ভাষা বুঝতে সমর্থন করে, এবং CosyVoice ২ এবং GPT-SoVITS এর মত TTS মডেল ৮+ ভাষার উত্তর দিতে সমর্থন করে। আপনি মাল্টি-ল্যাঙ্গুয়েজ এজেন্ট তৈরি করতে পারেন যা কলারের ভাষায় সনাক্ত করে এবং উত্তর দেয়।

TTS এর জন্য Kokoro এবং STT এর জন্য Faster Whisper ব্যবহার করে শেষ-থেকে-শেষের স্থবিরতা (ভাষা প্রবেশ → ভাষা প্রস্থান) সাধারণত ১-৩ সেকেন্ড। এতে STT অনুবাদ (~২০০মি. সে.), LLM প্রতিক্রিয়া (~৫০০মি. সে.-১ সে.), এবং TTS সংশ্লেষণ (~২০০মি. সে.) অন্তর্ভুক্ত।

হ্যাঁ, প্রত্যেক এজেন্টের একটি সিস্টেম প্রম্পট আছে যা তার ব্যক্তিত্ব, জ্ঞান, টোন এবং আচরণের নিয়ম নির্ধারণ করে। আপনি এটিকে আনুষ্ঠানিক বা অব্যবহিত করতে পারেন, বিষয় সীমানা নির্ধারণ করতে পারেন, উন্নতির নিয়ম নির্ধারণ করতে পারেন এবং অজানা প্রশ্নের ব্যবস্থাপনা নিয়ন্ত্রণ করতে পারেন।

হ্যাঁ। কথা বলার জন্য আমাদের STT API ব্যবহার করুন, বুদ্ধিমত্তার জন্য যেকোনো LLM API এবং শব্দ আউটপুট করার জন্য আমাদের TTS API। আমাদের OpenAI-সমর্থিত এনডপয়েন্টগুলি সংযোগ সহজ করে তোলে। প্রো এবং এন্টারপ্রাইজ প্ল্যানগুলিতে API অ্যাক্সেস অন্তর্ভুক্ত।

হ্যাঁ, আমাদের ভয়েস এজেন্ট অ্যাপআইকে টুইলিয়া, ভোনাজ বা প্লিবোর মতো টেলিফোন প্ল্যাটফর্মের সাথে সংযুক্ত করে ফোন ভিত্তিক আইভিআর সিস্টেম, আউটব্যান্ড কলিং বট এবং ভার্চুয়াল রিসিভার তৈরি করা যায়, যারা ২৪/৭ কল পরিচালনা করে।

এজেন্ট খরচ ব্যবহার করা মডেল উপর নির্ভর করে। ফ্রি-স্তর মডেল (Kokoro, Piper) জন্য খরচ 0অক্ষর TTS। STT প্রতি মিনিটে 1,000 অক্ষর। LLM খরচ আপনার প্রদানকারী উপর নির্ভর করে। শুরুর পরিকল্পনা ($9/মাস) অন্তর্ভুক্ত500,000 অক্ষর, শত শত এজেন্টের যোগাযোগের জন্য যথেষ্ট।

হ্যাঁ। একটি সংক্ষিপ্ত অডিও নমুনা থেকে একটি স্বনির্ধারিত কণ্ঠ তৈরি করতে আমাদের কণ্ঠ ক্লোনিং বৈশিষ্ট্য ব্যবহার করুন (৫ সেকেন্ডের মধ্যে)। Chatterbox এবং GPT-SoVITS এর মতো মডেলগুলি আপনার কণ্ঠ বা যেকোনো ব্র্যান্ডের কণ্ঠের ক্লোন করতে পারে একটি স্থায়ী এজেন্ট অভিজ্ঞতার জন্য।

হ্যাঁ। সমস্ত প্রক্রিয়াকরণ আমাদের নিবেদিত GPU সার্ভারে ঘটে। প্রক্রিয়াকরণের পরে আমরা কথোপকথনের ট্রান্সক্রিপ্ট বা অডিও সংরক্ষণ করি না। কোনো তথ্য তৃতীয় পক্ষের সাথে শেয়ার করা হয় না বা প্রশিক্ষণের জন্য ব্যবহার করা হয় না। এন্টারপ্রাইজ প্ল্যান অতিরিক্ত তথ্য বিচ্ছিন্ন করার অপশন প্রদান করে।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

আপনার প্রথম ভয়েস এজেন্ট নির্মাণ করুন

মিনিটের মধ্যে বুদ্ধিমান ভয়েস এজেন্ট তৈরি করুন। বিনামূল্যে নিবন্ধন করুন এবং নির্মাণ শুরু করতে ৫০ ক্রেডিট পান।