VoxCPM

Default

ডিফল্ট ইংরেজি Neutral VoxCPM

Default একটি neutral AI কন্ঠ যা VoxCPM টেক্সট-টু-স্পিচ মডেল দ্বারা চালিত। এই স্তর কন্ঠটি ইংরেজি ভাষায় কথা বলে এবং স্টুডিও-মানের শব্দ সংশ্লেষণ প্রদান করে। প্রায়-অবিলম্বে উৎপাদন গতি এবং 5/5 গুণগত মান সহ, Default high-fidelity audio, audiobooks, long-form content with voice consistency-এর জন্য উপযুক্ত। VoxCPM ইঞ্জিনটি OpenBMB under the Apache 2.0 license দ্বারা উন্নত করা হয়েছে, যা এটিকে বাণিজ্যিক ব্যবহারের জন্য নিরাপদ করে তোলে। এর প্রধান বৈশিষ্ট্যগুলো হল: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning। VoxCPM মডেলটি শব্দের ক্লোনিংও সমর্থন করে — স্বনির্বাচিত শব্দ তৈরি করতে একটি সংক্ষিপ্ত অডিও নমুনা আপলোড করুন যা একই গুণগত বৈশিষ্ট্য বজায় রাখে।

এখনো কোনো রেটিং নেই

VoxCPMমডেল তথ্য

মডেল VoxCPM
ডেভেলপার OpenBMB
গুণমান
গতি স্থির
লাইসেন্স Apache 2.0
ক্লোনিং সমর্থিত
টাইমার স্ট্যান্ডার্ড (২ ক্রেডিট/১K অক্ষর)
পরামিতি 500M
স্থাপত্য Continuous Space + Flow Matching
প্রশিক্ষণ তথ্য 1800000 ঘন্টা
বছর 2025

এর জন্য সেরা ব্যবহারের ঘটনা Default

এই শব্দের বৈশিষ্ট্য অনুযায়ী সুপারিশকৃত অ্যাপ্লিকেশন

অডিওবই এবং বর্ণনা

Default ব্যবহার করে প্রাকৃতিক প্রসৌদি এবং অভিব্যক্তি সহ দীর্ঘ-ফর্ম বিষয়বস্তু বর্ণনা করুন।

ভিডিও ভয়েস-অভার

ইউটিউব ভিডিও, বিজ্ঞাপন এবং সামাজিক মিডিয়া বিষয়বস্তুতে পেশাদার বর্ণনা যোগ করুন।

অ্যাপলিকেশন এবং প্রবেশযোগ্যতা

দ্রুত উৎপাদন এই শব্দটিকে বাস্তব-সময়ের অ্যাপস, স্ক্রীন রিডার এবং প্রবেশযোগ্যতা টুলস এর জন্য আদর্শ করে তোলে।

পডকাস্ট এবং সম্প্রচার

স্টুডিও-মানের আউটপুট পডকাস্ট, রেডিও এবং পেশাদার সম্প্রচারের জন্য উপযুক্ত।

আরো VoxCPM আওয়াজ

একই TTS মডেল থেকে অন্যান্য শব্দ

Default Chinese

চীনাName Neutral

প্রায়শ জিজ্ঞাসিত প্রশ্ন

VoxCPM ১.৫ একটি নতুন tokenizer-free TTS মডেল যা অবিচ্ছিন্ন টোকেন বদলে অবিচ্ছিন্ন স্থানে কাজ করে। এটি উচ্চ-সত্যতা ৪৪.১kHz অডিও উৎপাদন করে, ৩-১০ সেকেন্ড থেকে শূন্য-শট ভয়েস ক্লোনিং সমর্থন করে, এবং অনুচ্ছেদগুলির মধ্যে স্থিরতা বজায় রাখে। ক্রস-ভাষা ক্লোনিং আপনাকে চীনা ভাষায় একটি ইংরেজি শব্দ প্রয়োগ করতে এবং বিপরীতভাবে।

ভক্সসিপিএম ওপেনবিএমবি দ্বারা তৈরি করা হয়েছে এবং এটি অ্যাপাচি ২. ০ লাইসেন্সের অধীনে প্রকাশিত হয়েছে, যা বাণিজ্যিকভাবে তৈরি অডিও ব্যবহারের অনুমতি দেয়।

ভক্সসিপিএম ২টি ভাষা সমর্থন করে: ইংরেজি, চীনা।

VoxCPM হল স্ট্যান্ডার্ড স্তরের — প্রতি ১০০০ অক্ষর ২ ক্রেডিট। আপনি যেকোন VoxCPM শব্দ বিনামূল্যে প্রাকদর্শন করতে পারেন সম্পূর্ণ অডিও তৈরি করার আগে।

VoxCPM এর খুব দ্রুত উৎপাদন গতি আছে। এটি প্রায় বাস্তব-সময়ে চলছে, যা এটি স্ট্রিমিং এবং মিথস্ক্রিয় অ্যাপ্লিকেশনের জন্য উপযুক্ত করে তোলে।

VoxCPM is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

হ্যাঁ, VoxCPM জিনিস-শট কণ্ঠস্বর ক্লোন সমর্থন করে। একটি স্বনির্বাচিত কণ্ঠস্বর তৈরি করতে ৫-৩০ সেকেন্ডের রেফারেন্স অডিও আপলোড করুন।

হ্যাঁ, VoxCPM বিশেষভাবে উচ্চ-মানের অডিও, অডিওবুক, দীর্ঘ-ফর্মের বিষয়বস্তু এবং শব্দের স্থায়িত্বের জন্য সুপারিশ করা হয়। এর ৪৪.১ কিলোহার্টজ অডিও, টোকেনাইজারের বিনামূল্যে, ক্রস-লিঙ্গুইস্টিক ক্লোনিং ক্ষমতা এটিকে এই ব্যবহারের ক্ষেত্রে একটি চমৎকার পছন্দ করে তোলে।

হ্যাঁ, VoxCPM অ্যাপাচি ২.০ এর অধীনে লাইসেন্সকৃত, যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। VoxCPM শব্দ দ্বারা উত্পাদিত অডিও ভিডিও, পডকাস্ট, অ্যাপলিকেশন, খেলা এবং অন্যান্য বাণিজ্যিক প্রকল্পে ব্যবহার করা যেতে পারে।

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

মডেল নাম এবং ভয়েস আইডি সহ /api/v1/tts/-এ একটি POST অনুরোধ প্রেরণ করুন। পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এর কোডের উদাহরণের জন্য আমাদের API ডকুমেন্টেশন পাতা দেখুন।

হ্যাঁ, একটি নমুনা শুনতে এই পৃষ্ঠায় চালাও বাটন ক্লিক করুন । আপনিও টেক্সট- টু- স্পীচ পৃষ্ঠায় স্বনির্বাচিত টেক্সট টাইপ করতে পারেন এবং যে কোন শব্দের সাথে একটি বিনামূল্যে প্রাকদর্শন তৈরি করতে পারেন ।

চেষ্টা করো Default এখন

যেকোন টেক্সট টাইপ করুন এবং শুনুন Default. ব্যবহারের জন্য মুক্ত.