Report Bug / Feature Request

AI وائٹس ایجنٹس - کلام AI معاون بناؤ

خود ساختہ شخصیتوں کے ساتھ ذہین آواز ایجنٹس بنائیں۔ کلائنٹ سہولت، رسیپشن، ٹیوٹرنگ، اور مزید کے لئے استعمال کریں۔

آپ کی زبان میں اب تک ہمارے پاس TTS آوازیں نہیں ہیں. ہمیں آپ کی آوازیں شامل کرنے میں مدد کریں! آپ کی آواز فروخت کریں

ایجنٹ بلڈر

ایجنٹ کے کردار، شخصیت، علم ڈومین، اور گفتگو کے اصول بیان کریں.

ترتیبات

وائس ایجنٹس کیسے کام کرتے ہیں

آپ بولتے ہیں

آپ کے ایجنٹ کے ساتھ فطری طور پر بات کریں. آپ کی بات واقعی وقت میں پکڑ کر اور سٹریم کیا جاتا ہے.

2. ایس ٹی ٹی ترنسکریپس

خفیہ 99 زبانوں میں صحیح طور پر متن میں آپ کی بات تبدیل کرتا ہے.

ایل ایل ایم کے عمل

ایجنٹ کے LLM دماغ اس کی شخصیت اور نظام پروموشن استعمال کر کے آپ کی انپٹ پروسیسنگ.

4. TTS جواب

جواب آپ کی منتخب آواز اور ماڈل کے استعمال سے قدرتی بولنے میں تبدیل کیا جاتا ہے.

ایجنٹ

ہر صنعت اور استعمال کے معاملے کے لئے پہلے سے بنائی گئی ایجنٹ ٹیمپلیٹز

کلائنٹ کے سامنے

تعلیم اور تربیت

تخلیقی اور تفریحی

کاروباري اور اندروني

ذاتی

وائس ایجنٹ کیوں؟

AI-powered آواز ایجنٹس کہ آپ کی ضرورتوں کے ساتھ پیمانے

24/7 دستیابی

آواز ایجنٹس کبھی نہیں سوتے. کلوں اور بات چیت کے حوالے سے سٹاف کے بغیر گھڑی بھر میں.

چند زبانوں والا

30+ زبانوں میں فطری آوازوں کے ساتھ کلائنٹس کی مدد کریں. متعدد زبانوں کے اسٹیف کے لئے کوئی ضرورت نہیں.

ذاتي

اپنے ایجنٹ کی شخصیت، آواز، اور ماہرین کی تعریف. ہر ایجنٹ منفرد اور برانڈ پر محسوس.

کم وقفہ

سب سیکنڈ ردعمل کے وقت وقف GPUs پر بہتر STT، LLM، اور TTS پائپ لائنز سے طاقتور.

بار بار پوچھے گئے سوالات

اے آئی وائٹس ایجنٹ گفتگو کے ای آئی سسٹم ہیں جو کہ زبانی شناخت (STT)، زبانی ماڈل (LLM)، اور فطری آواز کی گفتگو کے لئے ٹیکس-ٹو-سپیچ (TTS) کو جوڑتے ہیں۔ وہ سوالوں کا جواب دے سکتے ہیں، اشاروں کی پیروی کرسکتے ہیں، اور خودمختاری سے کام پورا کرسکتے ہیں۔ جیسے ایک ورچوئل ریسپکٹر یا سہولت ایجنٹ۔

وائٹ چٹ ایک عام مقصد 1:1 AI کے ساتھ بات چیت ہے. ایجنٹس خاص کاموں کے لیے مقصد سے بنائے گئے ہیں - ان کے پاس ایک معین شخصیت، علم کی بنیاد اور ورک فلو ہے. ایک ایجنٹ ایک کلائنٹ سروس بوت ہو سکتا ہے جو آپ کے FAQ کی پیروی کرتا ہے، جبکہ وائٹ چٹ کھلے-انڈینگ بات چیت ہے.

کلائنٹ سروس بوت، فون IVR سسٹم، ورچوئل ریسپٹیشنسٹ، ٹیوٹرنگ اسسٹنٹ، بیلز کیو کیو بیٹ، میٹنگ شیڈولرز، انٹریکٹیو اسٹوری ٹیلر، تھراپی کامیون، زبانی عملہ شریک، اور مزید.

کم لاتنس کے کلام کرنے والے ایجنٹس کے لیے، کوکورو مثالی ہے - یہ رئل ٹائم سے تقریباً 100x تیزی سے کلام پیدا کرتا ہے. زیادہ قدرتی گفتگو کے لیے، Dia TTS ملٹی اسپیکر کلام کو مدد دیتا ہے. آواز کے کلوننگ کے لیے (برانڈ آواز سے ملتا جلتا)، Chatterbox یا GPT-SoVITS استعمال کریں.

ہاں۔ STT پائپ لائن (فسٹر وسپرز) سمجھنے کے لئے 99 زبانوں کی مدد کرتا ہے اور TTS ماڈل جیسے CosyVoice2 اور GPT-SoVITS جواب دینے کے لئے 8+ زبانوں کی مدد کرتے ہیں۔ آپ متعدد زبانوں کے ایجنٹس بنا سکتے ہیں جو کالر کی زبان میں دریافت اور جواب دیتے ہیں۔

آخري سے آخري لاٹنسی (زبان اندر → زبان باہر) عام طور پر 1-3 سیکنڈ ہے TTS کے لیے Kokoro اور STT کے لیے Faster Whisper کا استعمال کرتے ہوئے. اس میں STT ترنسکریپشن (~200ms)، LLM جواب (~500ms-1s) اور TTS ترکیب (~200ms) شامل ہیں.

ہاں ہر ایجنٹ کے پاس نظام پروموشن ہے جو اس کی شخصيت، علم، آواز اور رویے کے اصول کو بیان کرتا ہے آپ اسے رسمی یا غیر رسمی بنا سکتے ہیں، موضوع کے حدود کو مقرر کرسکتے ہیں، اسکالیشن کے اصول کو بیان کرسکتے ہیں اور نامعلوم سوالات کو کیسے ہینڈل کرتے ہیں اس کو کنٹرول کرسکتے ہیں.

ہاں۔ ہم بولنے کی شناخت کے لئے STT API استعمال کرتے ہیں، ذہانت کے لئے کوئی بھی LLM API اور آواز کے خروج کے لئے ہمارا TTS API۔ ہمارے OpenAI-compatible endpoints انٹیگریشن کو آسان بناتے ہیں۔ پرو اور انٹرپرائز پلانوں میں API رسائی شامل ہے۔

ہاں، ہمارے وائٹ ایجنٹ اے پی آئی کو ٹویلیو، ووناجی یا پلیو جیسے ٹیلی فونی پلیٹ فارم سے جوڑ کر فون پر مبنی آئی وی آر سسٹم، آؤٹ بانڈ کالنگ بوت اور ورچوئل ریسپٹیشنسٹ بنائے جو 24/7 کالوں کو ہینڈل کر سکے۔

ایجنٹ کی لاگت استعمال شدہ ماڈلز پر منحصر ہے۔ فری ٹیئر ماڈلز (Kokoro، Piper) TTS کے لئے 0 حروف لگتے ہیں۔ STT 1000 حروف پر منٹ ہے۔ LLM کی لاگت آپ کے سپلائرز پر منحصر ہے۔ اسٹارٹ اپ پلان ($9/mo) میں 500,000 حروف شامل ہیں، جو سینکڑوں ایجنٹ تعاملات کے لئے کافی ہیں۔

جی ہاں. ایک مختصر آڈیو نمونے سے ایک مخصوص آواز بنانے کے لئے ہماری آواز کلوننگ خصوصیت استعمال کریں (5 سیکنڈ سے کم). Chatterbox اور GPT-SoVITS جیسے ماڈل آپ کی آواز یا ایک مستقل ایجنٹ تجربے کے لئے کسی بھی برانڈ کی آواز کو کلون کر سکتے ہیں۔

جی ہاں. تمام پروسیسنگ ہمارے وقف GPU سرور پر ہوتا ہے. ہم پروسیسنگ کے بعد بات چیت کی نقل یا آڈیو محفوظ نہیں کرتے. کوئی ڈیٹا تیسری پارٹیوں کے ساتھ شریک نہیں کیا جاتا یا تربیت کے لئے استعمال نہیں کیا جاتا. انٹرپرائز پلان اضافی ڈیٹا ایزولیشن اختیارات فراہم کرتا ہے.
5.0/5 (1)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

اپنا پہلا آواز ایجنٹ بنائیں

منٹوں ميں ذہين آواز ايجنٹس بنايں مفت ميں رجسٽري کريں اور بنانا شروع کر نے کے ليے 50 کريٹس حاصل کريں