VITS

MAI (Polish)

মুক্ত পোলিশName Female VITS

MAI (Polish) একটি মহিলা AI কন্ঠ যা VITS টেক্সট-টু-স্পিচ মডেল দ্বারা চালিত। এই স্তর কন্ঠটি পোলিশName ভাষায় কথা বলে এবং ভাল-মানের শব্দ সংশ্লেষণ প্রদান করে। প্রায়-অবিলম্বে উৎপাদন গতি এবং 3/5 গুণগত মান সহ, MAI (Polish) general-purpose text-to-speech with natural prosody-এর জন্য উপযুক্ত। VITS ইঞ্জিনটি Jaehyeon Kim et al. under the MIT license দ্বারা উন্নত করা হয়েছে, যা এটিকে বাণিজ্যিক ব্যবহারের জন্য নিরাপদ করে তোলে। এর প্রধান বৈশিষ্ট্যগুলো হল: end-to-end synthesis, natural prosody, fast inference, multiple speakers।

এখনো কোনো রেটিং নেই

VITSমডেল তথ্য

মডেল VITS
ডেভেলপার Jaehyeon Kim et al.
গুণমান
গতি স্থির
লাইসেন্স MIT
ক্লোনিং উপলব্ধ নয়
টাইমার মুক্ত (কোন অক্ষর ব্যবহার করা হয়নি)
পরামিতি 25M
স্থাপত্য VAE + Normalizing Flows + GAN
প্রশিক্ষণ তথ্য 585 ঘন্টা
বছর 2021

এর জন্য সেরা ব্যবহারের ঘটনা MAI (Polish)

এই শব্দের বৈশিষ্ট্য অনুযায়ী সুপারিশকৃত অ্যাপ্লিকেশন

অডিওবই এবং বর্ণনা

MAI (Polish) ব্যবহার করে প্রাকৃতিক প্রসৌদি এবং অভিব্যক্তি সহ দীর্ঘ-ফর্ম বিষয়বস্তু বর্ণনা করুন।

ভিডিও ভয়েস-অভার

ইউটিউব ভিডিও, বিজ্ঞাপন এবং সামাজিক মিডিয়া বিষয়বস্তুতে পেশাদার বর্ণনা যোগ করুন।

অ্যাপলিকেশন এবং প্রবেশযোগ্যতা

দ্রুত উৎপাদন এই শব্দটিকে বাস্তব-সময়ের অ্যাপস, স্ক্রীন রিডার এবং প্রবেশযোগ্যতা টুলস এর জন্য আদর্শ করে তোলে।

ই- শিক্ষা ও প্রশিক্ষণ

স্পষ্ট AI বর্ণনা সহ আকর্ষণীয় প্রশিক্ষণ সামগ্রী, কোর্স এবং শিক্ষামূলক বিষয়বস্তু তৈরি করুন।

আরো VITS আওয়াজ

একই TTS মডেল থেকে অন্যান্য শব্দ

CSS10 (Dutch)

ডাচName Neutral

CSS10 (Finnish)

ফিনিশName Neutral

CSS10 (French)

ফরাসিName Neutral

CSS10 (German)

জার্মান Neutral

CSS10 (Hungarian)

হাঙ্গেরীয়Name Neutral

CSS10 (Spanish)

স্প্যানিশName Neutral

প্রায়শ জিজ্ঞাসিত প্রশ্ন

VITS (এন্ড- টু- এন্ড টেক্সট- টু- স্পিকারের জন্য প্রতিদ্বন্দ্বী শিখতে সহযোগিতাকারী বৈচিত্র্যমূলক অনুমান) একটি সমান্তরাল শেষ- থেকে- শেষ TTS পদ্ধতি যা বর্তমান দুই- পর্যায়ের মডেলের চেয়ে আরও প্রাকৃতিক শব্দের অডিও উৎপাদন করে। এটি স্বাভাবিক প্রবাহ এবং প্রতিদ্বন্দ্বী প্রশিক্ষণ প্রক্রিয়ার সাথে উন্নত বৈচিত্র্যমূলক অনুমান গ্রহণ করে, প্রাকৃতিকতার একটি উল্লেখযোগ্য উন্নতি অর্জন করে।

ভিটিএস তৈরি করেছেন জাহেয়ন কিম এবং অন্যান্যরা এবং এটি এমআইটি লাইসেন্সের অধীনে প্রকাশিত হয়েছে, যা বাণিজ্যিকভাবে তৈরি অডিও ব্যবহারের অনুমতি দেয়।

VITS চারটি ভাষা সমর্থন করে: ইংরেজি, চীনা, জাপানি, কোরীয়।

VITS মুক্ত স্তরে রয়েছে — বিনামূল্যে — কোন ক্রেডিট প্রয়োজন নেই। আপনি সম্পূর্ণ অডিও তৈরির পূর্বে যেকোন VITS শব্দ বিনামূল্যে প্রাকদর্শন করতে পারেন।

VITS এর খুব দ্রুত উৎপাদন গতি আছে। এটি প্রায় বাস্তব- সময়ে চলছে, এটি স্ট্রিমিং এবং মিথস্ক্রিয়ামূলক অ্যাপ্লিকেশনের জন্য উপযুক্ত করে তোলে।

VITS is rated 3/5 for audio quality on TTS.ai. It delivers good quality speech suitable for most applications.

না, VITS একটি নির্দিষ্ট সংখ্যক অভ্যন্তরীণ কণ্ঠস্বর ব্যবহার করে। কণ্ঠস্বর ক্লোন করার জন্য CosyVoice2, GPT-SoVITS, অথবা Chatterbox এর মত মডেল ব্যবহার করুন।

হ্যাঁ, VITS বিশেষভাবে সাধারণ উদ্দেশ্যে টেক্সট- টু- স্পিকারের জন্য সুপারিশ করা হয়, যেখানে প্রাকৃতিক শব্দভাণ্ডার ব্যবহার করা হয় । এর শেষ- থেকে- শেষ সংশ্লেষণ, প্রাকৃতিক শব্দভাণ্ডার, দ্রুত অনুমান ক্ষমতা এই ব্যবহারের ক্ষেত্রে এটিকে একটি চমৎকার পছন্দ করে তোলে ।

হ্যাঁ, VITS MIT-এর লাইসেন্সের অধীনে রয়েছে, যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। VITS-এর শব্দ দ্বারা উৎপাদিত অডিও ভিডিও, পডকাস্ট, অ্যাপলিকেশন, খেলা এবং অন্যান্য বাণিজ্যিক প্রকল্পে ব্যবহার করা যেতে পারে।

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

মডেল নাম এবং ভয়েস আইডি সহ /api/v1/tts/-এ একটি POST অনুরোধ প্রেরণ করুন। পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এর কোডের উদাহরণের জন্য আমাদের API ডকুমেন্টেশন পাতা দেখুন।

হ্যাঁ, একটি নমুনা শুনতে এই পৃষ্ঠায় চালাও বাটন ক্লিক করুন । আপনিও টেক্সট- টু- স্পীচ পৃষ্ঠায় স্বনির্বাচিত টেক্সট টাইপ করতে পারেন এবং যে কোন শব্দের সাথে একটি বিনামূল্যে প্রাকদর্শন তৈরি করতে পারেন ।

চেষ্টা করো MAI (Polish) এখন

যেকোন টেক্সট টাইপ করুন এবং শুনুন MAI (Polish). ব্যবহারের জন্য মুক্ত অক্ষর প্রয়োজন নেই.