VITS

Baker (Chinese)

মুক্ত চীনাName Neutral VITS

Baker (Chinese) একটি neutral AI কন্ঠ যা VITS টেক্সট-টু-স্পিচ মডেল দ্বারা চালিত। এই স্তর কন্ঠটি চীনাName ভাষায় কথা বলে এবং ভাল-মানের শব্দ সংশ্লেষণ প্রদান করে। প্রায়-অবিলম্বে উৎপাদন গতি এবং 3/5 গুণগত মান সহ, Baker (Chinese) general-purpose text-to-speech with natural prosody-এর জন্য উপযুক্ত। VITS ইঞ্জিনটি Jaehyeon Kim et al. under the MIT license দ্বারা উন্নত করা হয়েছে, যা এটিকে বাণিজ্যিক ব্যবহারের জন্য নিরাপদ করে তোলে। এর প্রধান বৈশিষ্ট্যগুলো হল: end-to-end synthesis, natural prosody, fast inference, multiple speakers।

এখনো কোনো রেটিং নেই

VITSমডেল তথ্য

মডেল VITS
ডেভেলপার Jaehyeon Kim et al.
গুণমান
গতি স্থির
লাইসেন্স MIT
ক্লোনিং উপলব্ধ নয়
টাইমার মুক্ত (কোন অক্ষর ব্যবহার করা হয়নি)
পরামিতি 25M
স্থাপত্য VAE + Normalizing Flows + GAN
প্রশিক্ষণ তথ্য 585 ঘন্টা
বছর 2021

এর জন্য সেরা ব্যবহারের ঘটনা Baker (Chinese)

এই শব্দের বৈশিষ্ট্য অনুযায়ী সুপারিশকৃত অ্যাপ্লিকেশন

অডিওবই এবং বর্ণনা

Baker (Chinese) ব্যবহার করে প্রাকৃতিক প্রসৌদি এবং অভিব্যক্তি সহ দীর্ঘ-ফর্ম বিষয়বস্তু বর্ণনা করুন।

ভিডিও ভয়েস-অভার

ইউটিউব ভিডিও, বিজ্ঞাপন এবং সামাজিক মিডিয়া বিষয়বস্তুতে পেশাদার বর্ণনা যোগ করুন।

অ্যাপলিকেশন এবং প্রবেশযোগ্যতা

দ্রুত উৎপাদন এই শব্দটিকে বাস্তব-সময়ের অ্যাপস, স্ক্রীন রিডার এবং প্রবেশযোগ্যতা টুলস এর জন্য আদর্শ করে তোলে।

ই- শিক্ষা ও প্রশিক্ষণ

স্পষ্ট AI বর্ণনা সহ আকর্ষণীয় প্রশিক্ষণ সামগ্রী, কোর্স এবং শিক্ষামূলক বিষয়বস্তু তৈরি করুন।

আরো VITS আওয়াজ

একই TTS মডেল থেকে অন্যান্য শব্দ

Default

ইংরেজি Neutral

প্রায়শ জিজ্ঞাসিত প্রশ্ন

VITS (এন্ড- টু- এন্ড টেক্সট- টু- স্পিকারের জন্য প্রতিদ্বন্দ্বী শিখতে সহযোগিতাকারী বৈচিত্র্যমূলক অনুমান) একটি সমান্তরাল শেষ- থেকে- শেষ TTS পদ্ধতি যা বর্তমান দুই- পর্যায়ের মডেলের চেয়ে আরও প্রাকৃতিক শব্দের অডিও উৎপাদন করে। এটি স্বাভাবিক প্রবাহ এবং প্রতিদ্বন্দ্বী প্রশিক্ষণ প্রক্রিয়ার সাথে উন্নত বৈচিত্র্যমূলক অনুমান গ্রহণ করে, প্রাকৃতিকতার একটি উল্লেখযোগ্য উন্নতি অর্জন করে।

ভিটিএস তৈরি করেছেন জাহেয়ন কিম এবং অন্যান্যরা এবং এটি এমআইটি লাইসেন্সের অধীনে প্রকাশিত হয়েছে, যা বাণিজ্যিকভাবে তৈরি অডিও ব্যবহারের অনুমতি দেয়।

VITS চারটি ভাষা সমর্থন করে: ইংরেজি, চীনা, জাপানি, কোরীয়।

VITS মুক্ত স্তরে রয়েছে — বিনামূল্যে — কোন ক্রেডিট প্রয়োজন নেই। আপনি সম্পূর্ণ অডিও তৈরির পূর্বে যেকোন VITS শব্দ বিনামূল্যে প্রাকদর্শন করতে পারেন।

VITS এর খুব দ্রুত উৎপাদন গতি আছে। এটি প্রায় বাস্তব- সময়ে চলছে, এটি স্ট্রিমিং এবং মিথস্ক্রিয়ামূলক অ্যাপ্লিকেশনের জন্য উপযুক্ত করে তোলে।

VITS is rated 3/5 for audio quality on TTS.ai. It delivers good quality speech suitable for most applications.

না, VITS একটি নির্দিষ্ট সংখ্যক অভ্যন্তরীণ কণ্ঠস্বর ব্যবহার করে। কণ্ঠস্বর ক্লোন করার জন্য CosyVoice2, GPT-SoVITS, অথবা Chatterbox এর মত মডেল ব্যবহার করুন।

হ্যাঁ, VITS বিশেষভাবে সাধারণ উদ্দেশ্যে টেক্সট- টু- স্পিকারের জন্য সুপারিশ করা হয়, যেখানে প্রাকৃতিক শব্দভাণ্ডার ব্যবহার করা হয় । এর শেষ- থেকে- শেষ সংশ্লেষণ, প্রাকৃতিক শব্দভাণ্ডার, দ্রুত অনুমান ক্ষমতা এই ব্যবহারের ক্ষেত্রে এটিকে একটি চমৎকার পছন্দ করে তোলে ।

হ্যাঁ, VITS MIT-এর লাইসেন্সের অধীনে রয়েছে, যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। VITS-এর শব্দ দ্বারা উৎপাদিত অডিও ভিডিও, পডকাস্ট, অ্যাপলিকেশন, খেলা এবং অন্যান্য বাণিজ্যিক প্রকল্পে ব্যবহার করা যেতে পারে।

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

মডেল নাম এবং ভয়েস আইডি সহ /api/v1/tts/-এ একটি POST অনুরোধ প্রেরণ করুন। পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এর কোডের উদাহরণের জন্য আমাদের API ডকুমেন্টেশন পাতা দেখুন।

হ্যাঁ, একটি নমুনা শুনতে এই পৃষ্ঠায় চালাও বাটন ক্লিক করুন । আপনিও টেক্সট- টু- স্পীচ পৃষ্ঠায় স্বনির্বাচিত টেক্সট টাইপ করতে পারেন এবং যে কোন শব্দের সাথে একটি বিনামূল্যে প্রাকদর্শন তৈরি করতে পারেন ।

চেষ্টা করো Baker (Chinese) এখন

যেকোন টেক্সট টাইপ করুন এবং শুনুন Baker (Chinese). ব্যবহারের জন্য মুক্ত অক্ষর প্রয়োজন নেই.