MOSS-TTSD

Default Speaker

ডিফল্ট ইংরেজি Neutral MOSS-TTSD

Default Speaker একটি neutral AI কন্ঠ যা MOSS-TTSD টেক্সট-টু-স্পিচ মডেল দ্বারা চালিত। এই স্তর কন্ঠটি ইংরেজি ভাষায় কথা বলে এবং স্টুডিও-মানের শব্দ সংশ্লেষণ প্রদান করে। মাঝারি উৎপাদন গতি এবং 5/5 গুণগত মান সহ, Default Speaker podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices-এর জন্য উপযুক্ত। MOSS-TTSD ইঞ্জিনটি OpenMOSS under the Apache 2.0 license দ্বারা উন্নত করা হয়েছে, যা এটিকে বাণিজ্যিক ব্যবহারের জন্য নিরাপদ করে তোলে। এর প্রধান বৈশিষ্ট্যগুলো হল: multi-speaker dialogue, up to 5 speakers, 60min coherent audio, voice cloning, 20 languages। MOSS-TTSD মডেলটি শব্দের ক্লোনিংও সমর্থন করে — স্বনির্বাচিত শব্দ তৈরি করতে একটি সংক্ষিপ্ত অডিও নমুনা আপলোড করুন যা একই গুণগত বৈশিষ্ট্য বজায় রাখে।

এখনো কোনো রেটিং নেই

MOSS-TTSDমডেল তথ্য

মডেল MOSS-TTSD
ডেভেলপার OpenMOSS
গুণমান
গতি মধ্যম
লাইসেন্স Apache 2.0
ক্লোনিং সমর্থিত
টাইমার স্ট্যান্ডার্ড (২ ক্রেডিট/১K অক্ষর)
পরামিতি 7B
স্থাপত্য MOSS-TTS-Delay + dialogue continuation head
বছর 2026

এর জন্য সেরা ব্যবহারের ঘটনা Default Speaker

এই শব্দের বৈশিষ্ট্য অনুযায়ী সুপারিশকৃত অ্যাপ্লিকেশন

অডিওবই এবং বর্ণনা

Default Speaker ব্যবহার করে প্রাকৃতিক প্রসৌদি এবং অভিব্যক্তি সহ দীর্ঘ-ফর্ম বিষয়বস্তু বর্ণনা করুন।

ভিডিও ভয়েস-অভার

ইউটিউব ভিডিও, বিজ্ঞাপন এবং সামাজিক মিডিয়া বিষয়বস্তুতে পেশাদার বর্ণনা যোগ করুন।

পডকাস্ট এবং সম্প্রচার

স্টুডিও-মানের আউটপুট পডকাস্ট, রেডিও এবং পেশাদার সম্প্রচারের জন্য উপযুক্ত।

স্বনির্বাচিত ব্র্যান্ডের শব্দ

একটি অনন্য ব্র্যান্ডেড TTS কন্ঠ তৈরি করতে এই শব্দের শৈলী আপনার নিজের অডিও সহ ক্লোন করুন।

আরো MOSS-TTSD আওয়াজ

একই TTS মডেল থেকে অন্যান্য শব্দ

Default (Chinese)

চীনাName Neutral

প্রায়শ জিজ্ঞাসিত প্রশ্ন

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

মডেল নাম এবং ভয়েস আইডি সহ /api/v1/tts/-এ একটি POST অনুরোধ প্রেরণ করুন। পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এর কোডের উদাহরণের জন্য আমাদের API ডকুমেন্টেশন পাতা দেখুন।

হ্যাঁ, একটি নমুনা শুনতে এই পৃষ্ঠায় চালাও বাটন ক্লিক করুন । আপনিও টেক্সট- টু- স্পীচ পৃষ্ঠায় স্বনির্বাচিত টেক্সট টাইপ করতে পারেন এবং যে কোন শব্দের সাথে একটি বিনামূল্যে প্রাকদর্শন তৈরি করতে পারেন ।

চেষ্টা করো Default Speaker এখন

যেকোন টেক্সট টাইপ করুন এবং শুনুন Default Speaker. ব্যবহারের জন্য মুক্ত.