Dia 2

Default

ডিফল্ট ইংরেজি Neutral Dia 2

Default একটি neutral AI কন্ঠ যা Dia 2 টেক্সট-টু-স্পিচ মডেল দ্বারা চালিত। এই স্তর কন্ঠটি ইংরেজি ভাষায় কথা বলে এবং উচ্চ-মানের শব্দ সংশ্লেষণ প্রদান করে। প্রায়-অবিলম্বে উৎপাদন গতি এবং 4/5 গুণগত মান সহ, Default real-time voice agents, dialogue generation, streaming applications-এর জন্য উপযুক্ত। Dia 2 ইঞ্জিনটি Nari Labs under the Apache 2.0 license দ্বারা উন্নত করা হয়েছে, যা এটিকে বাণিজ্যিক ব্যবহারের জন্য নিরাপদ করে তোলে। এর প্রধান বৈশিষ্ট্যগুলো হল: streaming output, multi-speaker, low latency, paralinguistic cues, up to 2 min output।

এখনো কোনো রেটিং নেই

Dia 2মডেল তথ্য

মডেল Dia 2
ডেভেলপার Nari Labs
গুণমান
গতি স্থির
লাইসেন্স Apache 2.0
ক্লোনিং উপলব্ধ নয়
টাইমার স্ট্যান্ডার্ড (২ ক্রেডিট/১K অক্ষর)
পরামিতি 2B
স্থাপত্য Streaming Transformer
বছর 2025

এর জন্য সেরা ব্যবহারের ঘটনা Default

এই শব্দের বৈশিষ্ট্য অনুযায়ী সুপারিশকৃত অ্যাপ্লিকেশন

অডিওবই এবং বর্ণনা

Default ব্যবহার করে প্রাকৃতিক প্রসৌদি এবং অভিব্যক্তি সহ দীর্ঘ-ফর্ম বিষয়বস্তু বর্ণনা করুন।

ভিডিও ভয়েস-অভার

ইউটিউব ভিডিও, বিজ্ঞাপন এবং সামাজিক মিডিয়া বিষয়বস্তুতে পেশাদার বর্ণনা যোগ করুন।

অ্যাপলিকেশন এবং প্রবেশযোগ্যতা

দ্রুত উৎপাদন এই শব্দটিকে বাস্তব-সময়ের অ্যাপস, স্ক্রীন রিডার এবং প্রবেশযোগ্যতা টুলস এর জন্য আদর্শ করে তোলে।

ই- শিক্ষা ও প্রশিক্ষণ

স্পষ্ট AI বর্ণনা সহ আকর্ষণীয় প্রশিক্ষণ সামগ্রী, কোর্স এবং শিক্ষামূলক বিষয়বস্তু তৈরি করুন।

প্রায়শ জিজ্ঞাসিত প্রশ্ন

Nari Labs-এর Dia2 Dia-র একটি স্ট্রিমিং-প্রথম আপগ্রেড, ১বি এবং ২বি প্যারামিটার বৈচিত্র্যতে উপলব্ধ। এটি প্রথম কয়েকটি টোকেন থেকে অডিও সংশ্লেষণ শুরু করে, যা এটিকে বাস্তব-সময়ের ভয়েস এজেন্ট এবং কথা-থেকে-বাক্য পাইপলাইনের জন্য আদর্শ করে তোলে। [S1]/[S2] ট্যাগ এবং (হাসি), (কাশি) এর মতো প্যারালিঙ্গুইস্টিক চিহ্ন সহ বহু-স্পিকার ডায়ালগ সমর্থন করে।

ডায়া ২ তৈরি করেছে নারি ল্যাবস এবং এটি অ্যাপাচি ২. ০ লাইসেন্সের অধীনে প্রকাশিত হয়েছে, যা বাণিজ্যিকভাবে তৈরি অডিও ব্যবহারের অনুমতি দেয়।

Dia2একটি ভাষা সমর্থন করে: ইংরেজি ।

Dia2প্রমিত স্তরে আছে — প্রতি ১০০০ অক্ষরে ২টি ক্রেডিট। আপনি যেকোন Dia2অডিও তৈরি করার আগে বিনামূল্যে প্রাকদর্শন করতে পারেন।

Dia2এর খুব দ্রুত উৎপাদন গতি আছে। এটি প্রায় বাস্তব- সময়ে চলছে, এটি স্ট্রিমিং এবং মিথস্ক্রিয়ামূলক অ্যাপ্লিকেশনের জন্য উপযুক্ত করে তোলে।

Dia 2 is rated 4/5 for audio quality on TTS.ai. It produces high-quality, natural-sounding speech.

না, Dia2একটি নির্দিষ্ট সংখ্যক অভ্যন্তরীণ কণ্ঠস্বর ব্যবহার করে। কণ্ঠস্বর ক্লোন করার জন্য, CosyVoice2, GPT-SoVITS, অথবা Chatterbox এর মত মডেল ব্যবহার করুন।

হ্যাঁ, Dia2বিশেষত বাস্তব- সময়ের ভয়েস এজেন্ট, ডায়ালগ উৎপাদন, স্ট্রিমিং অ্যাপ্লিকেশনের জন্য সুপারিশ করা হয়। এর স্ট্রিমিং আউটপুট, বহু- স্পিকার, কম ল্যাটেন্সি ক্ষমতা এটিকে এই ব্যবহারের ক্ষেত্রে একটি চমৎকার পছন্দ করে তোলে।

হ্যাঁ, Dia2আপাচি ২.০ এর অধীনে লাইসেন্সকৃত, যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। Dia2এর শব্দ দ্বারা উত্পাদিত অডিও ভিডিও, পডকাস্ট, অ্যাপলিকেশন, খেলা এবং অন্যান্য বাণিজ্যিক প্রকল্পে ব্যবহার করা যেতে পারে।

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

মডেল নাম এবং ভয়েস আইডি সহ /api/v1/tts/-এ একটি POST অনুরোধ প্রেরণ করুন। পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এর কোডের উদাহরণের জন্য আমাদের API ডকুমেন্টেশন পাতা দেখুন।

হ্যাঁ, একটি নমুনা শুনতে এই পৃষ্ঠায় চালাও বাটন ক্লিক করুন । আপনিও টেক্সট- টু- স্পীচ পৃষ্ঠায় স্বনির্বাচিত টেক্সট টাইপ করতে পারেন এবং যে কোন শব্দের সাথে একটি বিনামূল্যে প্রাকদর্শন তৈরি করতে পারেন ।

চেষ্টা করো Default এখন

যেকোন টেক্সট টাইপ করুন এবং শুনুন Default. ব্যবহারের জন্য মুক্ত.