VITS

MAI (Polish)

মুক্ত পোলেণ্ডName Female VITS

MAI (Polish) এটা মহিলা AI কন্ঠ যি VITS টেক্সট-টু-স্পিক মডেল দ্বাৰা শক্তি প্ৰদান কৰা হয়। এই free-tier কন্ঠে পোলেণ্ডName ক কয় আৰু ভাল-গুণমানৰ কথোপকথন সংমিশ্ৰণ প্ৰদান কৰে। নিউ-ইনস্ট্যান্ট উৎপাদন গতি আৰু 3/5 ৰ গুণগত মানৰ সৈতে, MAI (Polish) general-purpose text-to-speech with natural prosody ৰ বাবে উপযুক্ত। VITS ইঞ্জিন Jaehyeon Kim et al. under the MIT license দ্বাৰা উন্নত কৰা হৈছে, যাৰ ফলত বাণিজ্যিক ব্যৱহাৰৰ বাবে ইয়াক নিৰাপদ কৰা হৈছে। মূল ক্ষমতাসমূহৰ ভিতৰত আছে: end-to-end synthesis, natural prosody, fast inference, multiple speakers।

এতিয়াও কোনো গুৰুত্বৰ হাৰ নাই

VITSআৰ্হিৰ তথ্য

আৰ্হি VITS
বিকাশক Jaehyeon Kim et al.
গুণমান
গতি স্থায়ী
প্ৰমাণপত্ৰ MIT
ক্লোন কৰা হৈছে উপলব্ধ নহয়
টাইৰ মুক্ত (কোনো ক্ৰেডিট নাই)
প্ৰাচলসমূহ 25M
স্থাপত্য VAE + Normalizing Flows + GAN
প্ৰশিক্ষণ তথ্য 585 ঘন্টা
বছৰ 2021

সৰ্বোত্তম ব্যৱহাৰৰ ক্ষেত্ৰত MAI (Polish)

এই শব্দৰ ওপৰত ভিত্তি কৰি প্ৰস্তাবিত এপ্লিকেচনসমূহ

অডিঅ'বই আৰু বৰ্ণনা

স্বাভাৱিক প্ৰোসোডি আৰু অভিব্যক্তিৰ সৈতে দীঘল-ৰূপৰ সমলসমূহ বৰ্ণনা কৰিবলৈ MAI (Polish) ব্যৱহাৰ কৰক।

ভিডিঅ' ভয়েসঅভাৰ

YouTube ভিডিঅ', বিজ্ঞাপন, আৰু সামাজিক মিডিয়া সামগ্ৰীসমূহত পেশাদাৰী বৰ্ণনা যোগ কৰক।

অনুপ্ৰয়োগ আৰু অভিগম্যতা

দ্ৰুত উৎপাদন এই শব্দক ৰিয়েল-টাইম এপ্লিকেচন, পৰ্দা পাঠক, আৰু অভিগম্যতা সঁজুলিৰ বাবে আদর্শ কৰে।

ই-লৰ্নিং আৰু প্ৰশিক্ষণ

AI ৰ দ্বাৰা স্পষ্টভাৱে বৰ্ণনা কৰা প্ৰশিক্ষণ সামগ্ৰী, পাঠ্যক্ৰম আৰু শিক্ষামূলক বিষয়বস্তু সৃষ্টি কৰক।

অধিক VITS ধ্বনি

একে TTS আৰ্হিৰ পৰা অন্যান্য শব্দ

CSS10 (Dutch)

ডাচName Neutral

CSS10 (Finnish)

ফিনিশ্বName Neutral

CSS10 (French)

ফৰাচীName Neutral

CSS10 (German)

জাৰ্মানName Neutral

CSS10 (Hungarian)

হাঙ্গেৰিName Neutral

CSS10 (Spanish)

স্পেনিশ্বName Neutral

সদায় সোধা প্ৰশ্নসমূহ

VITS (অনুপ্ৰয়োগিক অনুমানৰ সৈতে প্ৰতিদ্বন্দ্বী শিকোৱা বাবে শেষ-থেকে-অন্ত টেক্সট-টু-স্পীচ) এটা সমান্তৰাল শেষ-থেকে-অন্ত TTS পদ্ধতি যি বৰ্তমান দুটা-পৰিস্থিতিৰ মডেলৰ তুলনাত অধিক প্ৰাকৃতিকভাৱে শব্দ কৰা অডিঅ' প্ৰস্তুত কৰে। ই প্ৰস্তুত কৰা প্ৰবাহ আৰু প্ৰতিদ্বন্দ্বী প্ৰশিক্ষণ প্ৰক্ৰিয়াৰ সৈতে বৃদ্ধি কৰা অনুপ্ৰয়োগিক অনুমান গ্ৰহণ কৰে, প্ৰাকৃতিকতাত উল্লেখযোগ্য উন্নতি সাধন কৰে।

VITS Jaehyeon Kim et al. দ্বাৰা উন্নত কৰা হৈছে আৰু MIT লাইচেঞ্চৰ অধীনত মুক্তি দিয়া হৈছে, যিয়ে সৃষ্টি কৰা অডিঅ'ৰ বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে।

VITS এ ৪টা ভাষা সমৰ্থন কৰে: ইংৰাজী, চীনা, জাপানি, কোৰীয়।

VITS মুক্ত স্তৰত আছে - মুক্ত - কোনো ক্রেডিটৰ প্ৰয়োজন নাই। সম্পূৰ্ণ অডিঅ' সৃষ্টি কৰাৰ পূৰ্বে আপুনি যিকোনো VITS শব্দ বিনামূলীয়াকৈ পূৰ্বদৰ্শন কৰিব পাৰিব।

VITS ৰ সৃষ্টিৰ গতি অতি দ্রুত। ই প্ৰায় ৰিয়েল-টাইমত চলায়, যাৰ ফলত ষ্ট্ৰীমিং আৰু প্ৰতিক্ৰিয়াশীল এপ্লিকেচনৰ বাবে উপযুক্ত।

VITS ৰ অডিঅ'ৰ গুণগত মান TTS.ai ত 3/5 ৰ মানত আছে। ই অধিকাংশ এপ্লিকেচনৰ বাবে উপযুক্ত ভাল গুণগতমানৰ কথন প্ৰদান কৰে।

নহয়, VITS এ অন্তৰ্নিহিত শব্দৰ এটা নিৰ্দিষ্ট সেট ব্যৱহাৰ কৰে। শব্দ ক্লোন কৰাৰ বাবে, CosyVoice2, GPT-SoVITS, অথবা Chatterbox ৰ দৰে মডেলসমূহ চেষ্টা কৰক।

হ্যাঁ, VITS বিশেষভাৱে প্ৰাকৃতিক শব্দৰ সৈতে সাধাৰণ উদ্দেশ্যে টেক্সট-টু-স্পীচৰ বাবে সুপারিশ কৰা হয়। ইয়াৰ শেষ-থেকে-অন্ত সংশ্লেষণ, প্ৰাকৃতিক শব্দ, দ্রুত অনুমান ক্ষমতা এই ব্যৱহাৰৰ ক্ষেত্ৰত এটি এক উত্তম পছন্দ কৰে।

হ্যাঁ, VITS MIT ৰ অধীনে লাইচেঞ্চ কৰা হৈছে, যি বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। VITS শব্দসমূহৰ সৈতে সৃষ্টি কৰা অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল, আৰু যিকোনো বাণিজ্যিক প্ৰকল্পত ব্যৱহাৰ কৰিব পাৰিব।

হ্যাঁ, TTS.ai ৰ সকলো শব্দ বাণিজ্যিকভাৱে লাইচেঞ্চ কৰা মুক্ত উৎসৰ মডেল (MIT, Apache 2.0) ব্যৱহাৰ কৰে। নিৰ্মিত অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল আৰু অন্য বাণিজ্যিক এপ্লিকেচনত ব্যৱহাৰৰ বাবে আপোনাৰ।

/api/v1/tts/ লে মডেল নাম আৰু ভয়েস ID ৰ সৈতে এটা POST অনুৰোধ পঠাওক। Python, JavaScript, Go, আৰু cURL ৰ কোডৰ উদাহৰণসমূহৰ বাবে আমাৰ API দস্তাবেজ পৃষ্ঠা চাওক।

হ্যাঁ, এটা নমুনা শুনিবলৈ এই পৃষ্ঠাত বজোৱা বুটাম ক্লিক কৰক। আপুনি লিখনীৰ পৰা কথা পাতৰ ওপৰত স্বনিৰ্বাচিত লিখনীও লিখিব পাৰিব আৰু যিকোনো শব্দৰ সৈতে এটা বিনামূলীয়া পূৰ্বদৰ্শন সৃষ্টি কৰিব পাৰিব।

চেষ্টা কৰক MAI (Polish) এতিয়া

যিকোনো টেক্সট টাইপ কৰক আৰু ইয়াক উচ্চাৰণ কৰক MAI (Polish). ব্যৱহাৰৰ বাবে মুক্ত কোনো ক্ৰেডিটৰ প্ৰয়োজন নাই.