VITS

Default

মুক্ত ইংৰাজীName Neutral VITS

Default এটা neutral AI কন্ঠ যি VITS টেক্সট-টু-স্পিক মডেল দ্বাৰা শক্তি প্ৰদান কৰা হয়। এই free-tier কন্ঠে ইংৰাজীName ক কয় আৰু ভাল-গুণমানৰ কথোপকথন সংমিশ্ৰণ প্ৰদান কৰে। নিউ-ইনস্ট্যান্ট উৎপাদন গতি আৰু 3/5 ৰ গুণগত মানৰ সৈতে, Default general-purpose text-to-speech with natural prosody ৰ বাবে উপযুক্ত। VITS ইঞ্জিন Jaehyeon Kim et al. under the MIT license দ্বাৰা উন্নত কৰা হৈছে, যাৰ ফলত বাণিজ্যিক ব্যৱহাৰৰ বাবে ইয়াক নিৰাপদ কৰা হৈছে। মূল ক্ষমতাসমূহৰ ভিতৰত আছে: end-to-end synthesis, natural prosody, fast inference, multiple speakers।

এতিয়াও কোনো গুৰুত্বৰ হাৰ নাই

VITSআৰ্হিৰ তথ্য

আৰ্হি VITS
বিকাশক Jaehyeon Kim et al.
গুণমান
গতি স্থায়ী
প্ৰমাণপত্ৰ MIT
ক্লোন কৰা হৈছে উপলব্ধ নহয়
টাইৰ মুক্ত (কোনো ক্ৰেডিট নাই)
প্ৰাচলসমূহ 25M
স্থাপত্য VAE + Normalizing Flows + GAN
প্ৰশিক্ষণ তথ্য 585 ঘন্টা
বছৰ 2021

সৰ্বোত্তম ব্যৱহাৰৰ ক্ষেত্ৰত Default

এই শব্দৰ ওপৰত ভিত্তি কৰি প্ৰস্তাবিত এপ্লিকেচনসমূহ

অডিঅ'বই আৰু বৰ্ণনা

স্বাভাৱিক প্ৰোসোডি আৰু অভিব্যক্তিৰ সৈতে দীঘল-ৰূপৰ সমলসমূহ বৰ্ণনা কৰিবলৈ Default ব্যৱহাৰ কৰক।

ভিডিঅ' ভয়েসঅভাৰ

YouTube ভিডিঅ', বিজ্ঞাপন, আৰু সামাজিক মিডিয়া সামগ্ৰীসমূহত পেশাদাৰী বৰ্ণনা যোগ কৰক।

অনুপ্ৰয়োগ আৰু অভিগম্যতা

দ্ৰুত উৎপাদন এই শব্দক ৰিয়েল-টাইম এপ্লিকেচন, পৰ্দা পাঠক, আৰু অভিগম্যতা সঁজুলিৰ বাবে আদর্শ কৰে।

ই-লৰ্নিং আৰু প্ৰশিক্ষণ

AI ৰ দ্বাৰা স্পষ্টভাৱে বৰ্ণনা কৰা প্ৰশিক্ষণ সামগ্ৰী, পাঠ্যক্ৰম আৰু শিক্ষামূলক বিষয়বস্তু সৃষ্টি কৰক।

অধিক VITS ধ্বনি

একে TTS আৰ্হিৰ পৰা অন্যান্য শব্দ

Baker (Chinese)

চীনাName Neutral

সদায় সোধা প্ৰশ্নসমূহ

VITS (অনুপ্ৰয়োগিক অনুমানৰ সৈতে প্ৰতিদ্বন্দ্বী শিকোৱা বাবে শেষ-থেকে-অন্ত টেক্সট-টু-স্পীচ) এটা সমান্তৰাল শেষ-থেকে-অন্ত TTS পদ্ধতি যি বৰ্তমান দুটা-পৰিস্থিতিৰ মডেলৰ তুলনাত অধিক প্ৰাকৃতিকভাৱে শব্দ কৰা অডিঅ' প্ৰস্তুত কৰে। ই প্ৰস্তুত কৰা প্ৰবাহ আৰু প্ৰতিদ্বন্দ্বী প্ৰশিক্ষণ প্ৰক্ৰিয়াৰ সৈতে বৃদ্ধি কৰা অনুপ্ৰয়োগিক অনুমান গ্ৰহণ কৰে, প্ৰাকৃতিকতাত উল্লেখযোগ্য উন্নতি সাধন কৰে।

VITS Jaehyeon Kim et al. দ্বাৰা উন্নত কৰা হৈছে আৰু MIT লাইচেঞ্চৰ অধীনত মুক্তি দিয়া হৈছে, যিয়ে সৃষ্টি কৰা অডিঅ'ৰ বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে।

VITS এ ৪টা ভাষা সমৰ্থন কৰে: ইংৰাজী, চীনা, জাপানি, কোৰীয়।

VITS মুক্ত স্তৰত আছে - মুক্ত - কোনো ক্রেডিটৰ প্ৰয়োজন নাই। সম্পূৰ্ণ অডিঅ' সৃষ্টি কৰাৰ পূৰ্বে আপুনি যিকোনো VITS শব্দ বিনামূলীয়াকৈ পূৰ্বদৰ্শন কৰিব পাৰিব।

VITS ৰ সৃষ্টিৰ গতি অতি দ্রুত। ই প্ৰায় ৰিয়েল-টাইমত চলায়, যাৰ ফলত ষ্ট্ৰীমিং আৰু প্ৰতিক্ৰিয়াশীল এপ্লিকেচনৰ বাবে উপযুক্ত।

VITS ৰ অডিঅ'ৰ গুণগত মান TTS.ai ত 3/5 ৰ মানত আছে। ই অধিকাংশ এপ্লিকেচনৰ বাবে উপযুক্ত ভাল গুণগতমানৰ কথন প্ৰদান কৰে।

নহয়, VITS এ অন্তৰ্নিহিত শব্দৰ এটা নিৰ্দিষ্ট সেট ব্যৱহাৰ কৰে। শব্দ ক্লোন কৰাৰ বাবে, CosyVoice2, GPT-SoVITS, অথবা Chatterbox ৰ দৰে মডেলসমূহ চেষ্টা কৰক।

হ্যাঁ, VITS বিশেষভাৱে প্ৰাকৃতিক শব্দৰ সৈতে সাধাৰণ উদ্দেশ্যে টেক্সট-টু-স্পীচৰ বাবে সুপারিশ কৰা হয়। ইয়াৰ শেষ-থেকে-অন্ত সংশ্লেষণ, প্ৰাকৃতিক শব্দ, দ্রুত অনুমান ক্ষমতা এই ব্যৱহাৰৰ ক্ষেত্ৰত এটি এক উত্তম পছন্দ কৰে।

হ্যাঁ, VITS MIT ৰ অধীনে লাইচেঞ্চ কৰা হৈছে, যি বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। VITS শব্দসমূহৰ সৈতে সৃষ্টি কৰা অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল, আৰু যিকোনো বাণিজ্যিক প্ৰকল্পত ব্যৱহাৰ কৰিব পাৰিব।

হ্যাঁ, TTS.ai ৰ সকলো শব্দ বাণিজ্যিকভাৱে লাইচেঞ্চ কৰা মুক্ত উৎসৰ মডেল (MIT, Apache 2.0) ব্যৱহাৰ কৰে। নিৰ্মিত অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল আৰু অন্য বাণিজ্যিক এপ্লিকেচনত ব্যৱহাৰৰ বাবে আপোনাৰ।

/api/v1/tts/ লে মডেল নাম আৰু ভয়েস ID ৰ সৈতে এটা POST অনুৰোধ পঠাওক। Python, JavaScript, Go, আৰু cURL ৰ কোডৰ উদাহৰণসমূহৰ বাবে আমাৰ API দস্তাবেজ পৃষ্ঠা চাওক।

হ্যাঁ, এটা নমুনা শুনিবলৈ এই পৃষ্ঠাত বজোৱা বুটাম ক্লিক কৰক। আপুনি লিখনীৰ পৰা কথা পাতৰ ওপৰত স্বনিৰ্বাচিত লিখনীও লিখিব পাৰিব আৰু যিকোনো শব্দৰ সৈতে এটা বিনামূলীয়া পূৰ্বদৰ্শন সৃষ্টি কৰিব পাৰিব।

চেষ্টা কৰক Default এতিয়া

যিকোনো টেক্সট টাইপ কৰক আৰু ইয়াক উচ্চাৰণ কৰক Default. ব্যৱহাৰৰ বাবে মুক্ত কোনো ক্ৰেডিটৰ প্ৰয়োজন নাই.