MOSS-TTSD

Default Speaker

መደበኛ እንግሊዝኛ Neutral MOSS-TTSD

Default Speaker በMOSS-TTSD ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ መደበኛ-ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ መካከለኛ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Default Speaker ለ podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices ተስማሚ ነው የ MOSS-TTSD ማሽን በ OpenMOSS under the Apache 2.0 license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: multi-speaker dialogue, up to 5 speakers, 60min coherent audio, voice cloning, 20 languages. MOSS-TTSD ሞዴሉ የድምፅ ክሎኒንግንም ይደግፋል - የድምፅ ቅርጸት ተመሳሳይ ጥራት ያለውን የራሱን ድምፅ ለመፍጠር ከፍ አድርግ

ደረጃ አልተሰጠም

MOSS-TTSDየሞዴል መረጃ

ሞዴል MOSS-TTSD
አዘጋጅ OpenMOSS
ጥራት
ፍጥነት መሀከል
ፈቃድ Apache 2.0
መተላለፊያ የተደገፈ
ዐምድ መደበኛ (2 ክሬዲቶች/1K ፊደላት)
መለኪያዎች 7B
አርክቴክቸር MOSS-TTS-Delay + dialogue continuation head
ዓመት 2026

ምርጥ የጠቀሙበት ሁኔታዎች Default Speaker

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Default Speakerን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

ብሮድካስት

የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.

የራሱን ድምፅ

የድምፅ ዓይነትን በራስዎ ድምፅ ላይ በመመስረት የራሱን የTTS ድምፅ ይፈጥሩ

ተጨማሪ MOSS-TTSD ድምጾች

ሌሎች ድምጾች ከአንድ TTS ሞዴል

Default (Chinese)

ቻይንኛ Neutral

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Default Speaker አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Default Speaker. ለመጠቀም ነጻ.