VITS

Baker (Chinese)

মুক্ত চীনাName Neutral VITS

Baker (Chinese) এটা neutral AI কন্ঠ যি VITS টেক্সট-টু-স্পিক মডেল দ্বাৰা শক্তি প্ৰদান কৰা হয়। এই free-tier কন্ঠে চীনাName ক কয় আৰু ভাল-গুণমানৰ কথোপকথন সংমিশ্ৰণ প্ৰদান কৰে। নিউ-ইনস্ট্যান্ট উৎপাদন গতি আৰু 3/5 ৰ গুণগত মানৰ সৈতে, Baker (Chinese) general-purpose text-to-speech with natural prosody ৰ বাবে উপযুক্ত। VITS ইঞ্জিন Jaehyeon Kim et al. under the MIT license দ্বাৰা উন্নত কৰা হৈছে, যাৰ ফলত বাণিজ্যিক ব্যৱহাৰৰ বাবে ইয়াক নিৰাপদ কৰা হৈছে। মূল ক্ষমতাসমূহৰ ভিতৰত আছে: end-to-end synthesis, natural prosody, fast inference, multiple speakers।

এতিয়াও কোনো গুৰুত্বৰ হাৰ নাই

VITSআৰ্হিৰ তথ্য

আৰ্হি VITS
বিকাশক Jaehyeon Kim et al.
গুণমান
গতি স্থায়ী
প্ৰমাণপত্ৰ MIT
ক্লোন কৰা হৈছে উপলব্ধ নহয়
টাইৰ মুক্ত (কোনো ক্ৰেডিট নাই)
প্ৰাচলসমূহ 25M
স্থাপত্য VAE + Normalizing Flows + GAN
প্ৰশিক্ষণ তথ্য 585 ঘন্টা
বছৰ 2021

সৰ্বোত্তম ব্যৱহাৰৰ ক্ষেত্ৰত Baker (Chinese)

এই শব্দৰ ওপৰত ভিত্তি কৰি প্ৰস্তাবিত এপ্লিকেচনসমূহ

অডিঅ'বই আৰু বৰ্ণনা

স্বাভাৱিক প্ৰোসোডি আৰু অভিব্যক্তিৰ সৈতে দীঘল-ৰূপৰ সমলসমূহ বৰ্ণনা কৰিবলৈ Baker (Chinese) ব্যৱহাৰ কৰক।

ভিডিঅ' ভয়েসঅভাৰ

YouTube ভিডিঅ', বিজ্ঞাপন, আৰু সামাজিক মিডিয়া সামগ্ৰীসমূহত পেশাদাৰী বৰ্ণনা যোগ কৰক।

অনুপ্ৰয়োগ আৰু অভিগম্যতা

দ্ৰুত উৎপাদন এই শব্দক ৰিয়েল-টাইম এপ্লিকেচন, পৰ্দা পাঠক, আৰু অভিগম্যতা সঁজুলিৰ বাবে আদর্শ কৰে।

ই-লৰ্নিং আৰু প্ৰশিক্ষণ

AI ৰ দ্বাৰা স্পষ্টভাৱে বৰ্ণনা কৰা প্ৰশিক্ষণ সামগ্ৰী, পাঠ্যক্ৰম আৰু শিক্ষামূলক বিষয়বস্তু সৃষ্টি কৰক।

অধিক VITS ধ্বনি

একে TTS আৰ্হিৰ পৰা অন্যান্য শব্দ

Default

ইংৰাজীName Neutral

সদায় সোধা প্ৰশ্নসমূহ

VITS (অনুপ্ৰয়োগিক অনুমানৰ সৈতে প্ৰতিদ্বন্দ্বী শিকোৱা বাবে শেষ-থেকে-অন্ত টেক্সট-টু-স্পীচ) এটা সমান্তৰাল শেষ-থেকে-অন্ত TTS পদ্ধতি যি বৰ্তমান দুটা-পৰিস্থিতিৰ মডেলৰ তুলনাত অধিক প্ৰাকৃতিকভাৱে শব্দ কৰা অডিঅ' প্ৰস্তুত কৰে। ই প্ৰস্তুত কৰা প্ৰবাহ আৰু প্ৰতিদ্বন্দ্বী প্ৰশিক্ষণ প্ৰক্ৰিয়াৰ সৈতে বৃদ্ধি কৰা অনুপ্ৰয়োগিক অনুমান গ্ৰহণ কৰে, প্ৰাকৃতিকতাত উল্লেখযোগ্য উন্নতি সাধন কৰে।

VITS Jaehyeon Kim et al. দ্বাৰা উন্নত কৰা হৈছে আৰু MIT লাইচেঞ্চৰ অধীনত মুক্তি দিয়া হৈছে, যিয়ে সৃষ্টি কৰা অডিঅ'ৰ বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে।

VITS এ ৪টা ভাষা সমৰ্থন কৰে: ইংৰাজী, চীনা, জাপানি, কোৰীয়।

VITS মুক্ত স্তৰত আছে - মুক্ত - কোনো ক্রেডিটৰ প্ৰয়োজন নাই। সম্পূৰ্ণ অডিঅ' সৃষ্টি কৰাৰ পূৰ্বে আপুনি যিকোনো VITS শব্দ বিনামূলীয়াকৈ পূৰ্বদৰ্শন কৰিব পাৰিব।

VITS ৰ সৃষ্টিৰ গতি অতি দ্রুত। ই প্ৰায় ৰিয়েল-টাইমত চলায়, যাৰ ফলত ষ্ট্ৰীমিং আৰু প্ৰতিক্ৰিয়াশীল এপ্লিকেচনৰ বাবে উপযুক্ত।

VITS ৰ অডিঅ'ৰ গুণগত মান TTS.ai ত 3/5 ৰ মানত আছে। ই অধিকাংশ এপ্লিকেচনৰ বাবে উপযুক্ত ভাল গুণগতমানৰ কথন প্ৰদান কৰে।

নহয়, VITS এ অন্তৰ্নিহিত শব্দৰ এটা নিৰ্দিষ্ট সেট ব্যৱহাৰ কৰে। শব্দ ক্লোন কৰাৰ বাবে, CosyVoice2, GPT-SoVITS, অথবা Chatterbox ৰ দৰে মডেলসমূহ চেষ্টা কৰক।

হ্যাঁ, VITS বিশেষভাৱে প্ৰাকৃতিক শব্দৰ সৈতে সাধাৰণ উদ্দেশ্যে টেক্সট-টু-স্পীচৰ বাবে সুপারিশ কৰা হয়। ইয়াৰ শেষ-থেকে-অন্ত সংশ্লেষণ, প্ৰাকৃতিক শব্দ, দ্রুত অনুমান ক্ষমতা এই ব্যৱহাৰৰ ক্ষেত্ৰত এটি এক উত্তম পছন্দ কৰে।

হ্যাঁ, VITS MIT ৰ অধীনে লাইচেঞ্চ কৰা হৈছে, যি বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। VITS শব্দসমূহৰ সৈতে সৃষ্টি কৰা অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল, আৰু যিকোনো বাণিজ্যিক প্ৰকল্পত ব্যৱহাৰ কৰিব পাৰিব।

হ্যাঁ, TTS.ai ৰ সকলো শব্দ বাণিজ্যিকভাৱে লাইচেঞ্চ কৰা মুক্ত উৎসৰ মডেল (MIT, Apache 2.0) ব্যৱহাৰ কৰে। নিৰ্মিত অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল আৰু অন্য বাণিজ্যিক এপ্লিকেচনত ব্যৱহাৰৰ বাবে আপোনাৰ।

/api/v1/tts/ লে মডেল নাম আৰু ভয়েস ID ৰ সৈতে এটা POST অনুৰোধ পঠাওক। Python, JavaScript, Go, আৰু cURL ৰ কোডৰ উদাহৰণসমূহৰ বাবে আমাৰ API দস্তাবেজ পৃষ্ঠা চাওক।

হ্যাঁ, এটা নমুনা শুনিবলৈ এই পৃষ্ঠাত বজোৱা বুটাম ক্লিক কৰক। আপুনি লিখনীৰ পৰা কথা পাতৰ ওপৰত স্বনিৰ্বাচিত লিখনীও লিখিব পাৰিব আৰু যিকোনো শব্দৰ সৈতে এটা বিনামূলীয়া পূৰ্বদৰ্শন সৃষ্টি কৰিব পাৰিব।

চেষ্টা কৰক Baker (Chinese) এতিয়া

যিকোনো টেক্সট টাইপ কৰক আৰু ইয়াক উচ্চাৰণ কৰক Baker (Chinese). ব্যৱহাৰৰ বাবে মুক্ত কোনো ক্ৰেডিটৰ প্ৰয়োজন নাই.