MOSS-TTSD

Default (Chinese)

Standardni Kineski Neutral MOSS-TTSD

Default (Chinese) je neutral AI glas podržan od MOSS-TTSD tekst-u-govor modela. Ovaj standardni nivo glas govori Kineski i pruža studio-kvalitetnu sintezu govora. Sa umjeren brzinom generiranja i kvalitetom od 5/5, Default (Chinese) je dobro prikladan za podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Motor je razvijen od strane OpenMOSS under the Apache 2.0 license, što ga čini sigurnim za komercijalnu upotrebu. Ključne osobine su: multi-speaker dialogue, up to 5 speakers, 60min coherent audio, voice cloning, 20 languages. Model MOSS-TTSD također podržava kloniranje glasa - upload kratkih audio uzoraka za stvaranje prilagođenog glasa koji zadržava iste kvalitetne karakteristike.

Još nema ocjena

MOSS-TTSDInformacije o modelu

Model MOSS-TTSD
Programer OpenMOSS
Kvaliteta
Brzina Srednje
Licenca Apache 2.0
Kloniranje Podržano
Životinje Standardno (2 kredita/1K znakova)
Parametri 7B
Arhitektura MOSS-TTS-Delay + dialogue continuation head
Godina 2026

Najbolji slučajevi upotrebe za Default (Chinese)

Preporučeni programi zasnovani na karakteristikama ovog glasa

Audioknjige i pripovijetke

Koristi Default (Chinese) za narječje dugog oblika sadržaja sa prirodnom prozodijom i izrazom.

Video Voiceover

Dodajte profesionalnu naraciju na YouTube videozapise, oglase i sadržaj društvenih medija.

Podcasti i emitiranje

Radio-televizija je medij koji se koristi za emitiranje radio-programa, radio-programskih sadržaja i za emitiranje televizijskih programa.

Prilagođeni glas

Kloniraj ovaj stil glasa sa svojim vlastitim zvukom da bi stvorio jedinstveni TTS glas.

Više MOSS-TTSD Glasovi

Drugi glasovi iz istog TTS modela

Default Speaker

Engleski Neutral

Često postavljana pitanja

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

Da, svi glasovi na TTS.ai koriste komercijalno licencirane modele otvorenog koda (MIT, Apache 2.0). Generirani zvuk je vaš za upotrebu u videozapisima, podcastima, aplikacijama, igrama i bilo kojoj drugoj komercijalnoj aplikaciji.

Pošaljite POST zahtjev na /api/v1/tts/ sa imenom modela i ID-om glasa. Pogledajte našu API dokumentaciju za primjere koda u Pythonu, JavaScriptu, Go-u i cURL-u.

Da, kliknite na dugme za reprodukciju na ovoj stranici da biste čuli uzorak. Također možete utipkati prilagođeni tekst na stranici Tekst za govor i generirati besplatni pregled sa bilo kojim glasom.

Pokušaj. Default (Chinese) Sad

Unesite bilo koji tekst i slušajte ga izgovorenog Default (Chinese). Slobodno za upotrebu.