MOSS-TTSD

Default Speaker

Arferol Saesneg Neutral MOSS-TTSD

Mae Default Speaker yn lais neutral AI a bwerir gan y model testun-i-leferydd MOSS-TTSD. Mae'r standard-level lais hwn yn siarad Saesneg ac yn darparu cyfansoddiad lleferydd stiwdio-quality. Gyda chyflymder creu canolig a gradd ansawdd o 5/5, mae Default Speaker yn addas iawn ar gyfer podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Mae'r peiriant MOSS-TTSD wedi ei ddatblygu gan OpenMOSS under the Apache 2.0 license, gan ei wneud yn ddiogel ar gyfer defnydd masnachol. Mae'r galluoedd allweddol yn cynnwys: multi-speaker dialogue, up to 5 speakers, 60min coherent audio, voice cloning, 20 languages. Mae'r model MOSS-TTSD hefyd yn cynnal clôn llais — lanlwythwch sampl sain byr i greu llais addasiedig sy'n cadw'r un nodweddion ansawdd.

Dim graddau eto

MOSS-TTSDGwybodaeth Model

Model MOSS-TTSD
Datblygwr OpenMOSS
Ansawdd
Cyflymder Canolig
Trwydded Apache 2.0
Clonio Cynhelir
o Fawrth Arferol (2 credyd/1K o nodau)
Paramedrau 7B
Pensaernïaeth MOSS-TTS-Delay + dialogue continuation head
Blwyddyn 2026

Casgliadau Defnyddiol Default Speaker

Cymhwysiadau a argymhellir yn seiliedig ar y llais yma

Llyfrau Sain a ChyflwyniadName

Defnyddiwch Default Speaker i ddweud cynnwys ffurf hir gydag ysgrifennu naturiol a mynegiant.

Llywio Fideo

Ychwanegu naws broffesiynol i fideos YouTube, hysbysebion, a chynnwys cyfryngau cymdeithasol.

Podiau a Chyhoeddi

Allbwn ansawdd stiwdio addas ar gyfer podlediadau, radio, a darlledu proffesiynol.

Llythyren Addasiedig

Cloni'r arddull llais yma gyda'ch sain eich hun i greu llais TTS unigryw.

Mwy MOSS-TTSD Llais

Llygaid eraill o'r un model TTS

Default (Chinese)

Tsieinëeg Neutral

Cwestiynau a Ofynnir yn Aml

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

Ydy, mae pob llais ar TTS.ai yn defnyddio modelau ffynhonnell agored gyda thrwydded fasnachol (MIT, Apache 2.0). Eich llais chi yw'r sain a gynhyrchir i'w ddefnyddio mewn fideos, podiau, rhaglenni, gemau, a phob rhaglen fasnachol arall.

Anfonwch gais POST i /api/v1/tts/ gyda'r enw model a'r ID llais. Gweler ein tudalen Dogfennaeth API am enghreifftiau o godau mewn Python, JavaScript, Go, a cURL.

Ie, cliciwch y botwm chwarae ar y dudalen hon i glywed enghraifft. Gallwch hefyd deipio testun addasiedig ar y dudalen Testun- i- Leferydd a chreu rhagolwg am ddim gydag unrhyw lais.

Ceisio Default Speaker Nawr

Teipiwch unrhyw destun a'i glywed yn cael ei ddweud gan Default Speaker. Am ddim i'w ddefnyddio.