VoxCPM

Default

অবিকল্পিত ইংৰাজীName Neutral VoxCPM

Default এটা neutral AI কন্ঠ যি VoxCPM টেক্সট-টু-স্পিক মডেল দ্বাৰা শক্তি প্ৰদান কৰা হয়। এই প্ৰমিত স্তৰ কন্ঠে ইংৰাজীName ক কয় আৰু স্টুডিঅ'-গুণমানৰ কথোপকথন সংমিশ্ৰণ প্ৰদান কৰে। নিউ-ইনস্ট্যান্ট উৎপাদন গতি আৰু 5/5 ৰ গুণগত মানৰ সৈতে, Default high-fidelity audio, audiobooks, long-form content with voice consistency ৰ বাবে উপযুক্ত। VoxCPM ইঞ্জিন OpenBMB under the Apache 2.0 license দ্বাৰা উন্নত কৰা হৈছে, যাৰ ফলত বাণিজ্যিক ব্যৱহাৰৰ বাবে ইয়াক নিৰাপদ কৰা হৈছে। মূল ক্ষমতাসমূহৰ ভিতৰত আছে: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning। VoxCPM আৰ্হিটোৱেও শব্দ ক্লোনিং সমৰ্থন কৰে - একই গুণগত মান বজাই ৰখা এটা স্বনিৰ্বাচিত শব্দ সৃষ্টি কৰিবলৈ এটা সংক্ষিপ্ত অডিঅ' নমুনা আপলোড কৰক।

এতিয়াও কোনো গুৰুত্বৰ হাৰ নাই

VoxCPMআৰ্হিৰ তথ্য

আৰ্হি VoxCPM
বিকাশক OpenBMB
গুণমান
গতি স্থায়ী
প্ৰমাণপত্ৰ Apache 2.0
ক্লোন কৰা হৈছে সমৰ্থিত
টাইৰ প্ৰমিত (২ ক্রেডিট/১K আখৰ)
প্ৰাচলসমূহ 500M
স্থাপত্য Continuous Space + Flow Matching
প্ৰশিক্ষণ তথ্য 1800000 ঘন্টা
বছৰ 2025

সৰ্বোত্তম ব্যৱহাৰৰ ক্ষেত্ৰত Default

এই শব্দৰ ওপৰত ভিত্তি কৰি প্ৰস্তাবিত এপ্লিকেচনসমূহ

অডিঅ'বই আৰু বৰ্ণনা

স্বাভাৱিক প্ৰোসোডি আৰু অভিব্যক্তিৰ সৈতে দীঘল-ৰূপৰ সমলসমূহ বৰ্ণনা কৰিবলৈ Default ব্যৱহাৰ কৰক।

ভিডিঅ' ভয়েসঅভাৰ

YouTube ভিডিঅ', বিজ্ঞাপন, আৰু সামাজিক মিডিয়া সামগ্ৰীসমূহত পেশাদাৰী বৰ্ণনা যোগ কৰক।

অনুপ্ৰয়োগ আৰু অভিগম্যতা

দ্ৰুত উৎপাদন এই শব্দক ৰিয়েল-টাইম এপ্লিকেচন, পৰ্দা পাঠক, আৰু অভিগম্যতা সঁজুলিৰ বাবে আদর্শ কৰে।

পডকাস্ট আৰু প্ৰচাৰ

পডকাস্ট, ৰেডিঅ' আৰু পেছাদাৰী প্ৰচাৰৰ বাবে উপযুক্ত স্টুডিঅ'-গুণমানৰ আউটপুট।

অধিক VoxCPM ধ্বনি

একে TTS আৰ্হিৰ পৰা অন্যান্য শব্দ

Default Chinese

চীনাName Neutral

সদায় সোধা প্ৰশ্নসমূহ

OpenBMB ৰ VoxCPM 1.5 এটা নতুন tokenizer-free TTS মডেল যি বিচ্ছিন্ন টোকেনৰ পৰিবৰ্তে অবিচ্ছিন্ন স্থানত কাম কৰে। ই উচ্চ-প্ৰতিষ্ঠাৰ 44.1kHz অডিঅ' প্ৰস্তুত কৰে, ৩-১০ ছেকেণ্ডৰ পৰা শূণ্য-শট শব্দ ক্লোনিং সমৰ্থন কৰে, আৰু অনুচ্ছেদসমূহত স্থায়িত্ব বজাই ৰাখে। ক্ৰচ-লেংগুৱেজ ক্লোনিংয়ে আপুনি ইংৰাজী শব্দ চীনা ভাষাত ব্যৱহাৰ কৰিব পাৰে আৰু বিপৰীত দিশত।

VoxCPM OpenBMB দ্বাৰা উন্নত কৰা হৈছে আৰু Apache 2.0 লাইচেঞ্চৰ অধীনত মুক্তি দিয়া হৈছে, যিয়ে সৃষ্টি কৰা অডিঅ'ৰ বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে।

VoxCPM এ ২টা ভাষা সমৰ্থন কৰে: ইংৰাজী, চীনা।

VoxCPM প্ৰমিত স্তৰৰ - প্ৰতি ১,০০০ আখৰ ২ ক্রেডিটত আছে। সম্পূৰ্ণ অডিঅ' সৃষ্টি কৰাৰ পূৰ্বে আপুনি যিকোনো VoxCPM শব্দ বিনামূলীয়াকৈ পূৰ্বদৰ্শন কৰিব পাৰিব।

VoxCPM ৰ সৃষ্টিৰ গতি অতি দ্রুত। ই প্ৰায় ৰিয়েল-টাইমত চলায়, যাৰ ফলত ই ষ্ট্ৰীমিং আৰু প্ৰতিক্ৰিয়াশীল এপ্লিকেচনৰ বাবে উপযুক্ত।

VoxCPM ৰ অডিঅ'ৰ গুণগত মান TTS.ai ত ৫/৫ ৰ মান প্ৰদান কৰা হৈছে। ই স্টুডিঅ'-গ্ৰেড, মানৱ-সদৃশ কথন প্ৰদান কৰে।

হ্যাঁ, VoxCPM এ zero-shot voice clone সমৰ্থন কৰে। এটা স্বনিৰ্বাচিত শব্দ সৃষ্টি কৰিবলৈ ৫-৩০ ছেকেণ্ডৰ reference audio আপলোড কৰক।

হ্যাঁ, VoxCPM বিশেষভাৱে উচ্চ-প্ৰমাণিত অডিঅ', অডিঅ'বই, শব্দৰ স্থিতিশীলতাৰ সৈতে দীঘল-ৰূপৰ সমলসমূহৰ বাবে সুপারিশ কৰা হয়। ইয়াৰ 44.1khz অডিঅ', tokenizer-free, cross-language cloning ক্ষমতাসমূহে ইয়াক এই ব্যৱহাৰৰ ক্ষেত্ৰত এটা উত্তম পছন্দ কৰে।

হ্যাঁ, VoxCPM Apache 2.0 ৰ অধীনে লাইচেঞ্চ কৰা হৈছে, যি বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। VoxCPM শব্দসমূহৰ সৈতে সৃষ্টি কৰা অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেলা, আৰু যিকোনো বাণিজ্যিক প্ৰকল্পত ব্যৱহাৰ কৰিব পাৰিব।

হ্যাঁ, TTS.ai ৰ সকলো শব্দ বাণিজ্যিকভাৱে লাইচেঞ্চ কৰা মুক্ত উৎসৰ মডেল (MIT, Apache 2.0) ব্যৱহাৰ কৰে। নিৰ্মিত অডিঅ' ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল আৰু অন্য বাণিজ্যিক এপ্লিকেচনত ব্যৱহাৰৰ বাবে আপোনাৰ।

/api/v1/tts/ লে মডেল নাম আৰু ভয়েস ID ৰ সৈতে এটা POST অনুৰোধ পঠাওক। Python, JavaScript, Go, আৰু cURL ৰ কোডৰ উদাহৰণসমূহৰ বাবে আমাৰ API দস্তাবেজ পৃষ্ঠা চাওক।

হ্যাঁ, এটা নমুনা শুনিবলৈ এই পৃষ্ঠাত বজোৱা বুটাম ক্লিক কৰক। আপুনি লিখনীৰ পৰা কথা পাতৰ ওপৰত স্বনিৰ্বাচিত লিখনীও লিখিব পাৰিব আৰু যিকোনো শব্দৰ সৈতে এটা বিনামূলীয়া পূৰ্বদৰ্শন সৃষ্টি কৰিব পাৰিব।

চেষ্টা কৰক Default এতিয়া

যিকোনো টেক্সট টাইপ কৰক আৰু ইয়াক উচ্চাৰণ কৰক Default. ব্যৱহাৰৰ বাবে মুক্ত.