Rapportér fejl / funktionsanmodning

Dia TTS TTS

A 1.6B-parameter model purpose-built for generating natural multi-speaker dialogue, not just single-voice narration.

Tekst
Filer

0/500 tegn · Tilmeld dig 5.000 pr. generation →

Tilmeld dig for 5.000 tegngrænse

SSML- tilstand (Talesyntese Markup Sprog til fin kontrol)

Wrap din tekst i SSML tags for præcis kontrol:

<speak><prosody rate="slow">Slow speech</prosody></speak>

Emotion / Style Tags

Tags den valgte model forstår! klik for at droppe en i din tekst, hvor det sker:

Udtale ordbog

Definer brugerdefinerede udtaler (ord = udtale):

Stenkulstjærebeg og anden mineraltjærebeg 0

-12 +12

AI-model

Stemme

Sprog

Outputformat

Hastighed 1.0x

0.5x 2.0x

Gratis med Piper, VITS, MeloTTS

Din genererede lyd vises her. Vælg en model, indtast tekst, og klik på Generér.

Om Dia TTS

Dia by Nari Labs is a 1.6-billion-parameter text-to-speech model designed from the ground up for dialogue rather than monologue. It generates conversations between two speakers with realistic turn-taking, prosody, and emotional expression, producing audio that sounds like a real exchange instead of two voices read separately. Architecturally it pairs an autoregressive transformer with the Descript Audio Codec (DAC) for waveform generation. Dia is a strong fit for podcast-style content, scripted audiobook dialogue, and conversational scenes, and is released under Apache 2.0. Generations are heavier than single-voice models, so it favors quality over raw speed.

Bedst for: Podcasts, audiobook dialogues, conversational content

Gennemse alle Dia TTS stemmer

Et blik

Udvikler: Nari Labs
Licens: Apache 2.0
Metodetrin: standard
Hastighed: medium
Stemmekloning: Nej
Sprog: English
Maks. tegn: 800

Dia TTS stemmer

Speaker 1

English

Standard Neutral

Speaker 2

English

Standard Neutral

Dia TTS Ofte stillede spørgsmål om TTS

Multi-speaker dialogue. Unlike most TTS models that read one voice at a time, Dia generates a two-speaker conversation with natural turn-taking, prosody, and emotion in a single pass — ideal for podcasts and scripted scenes.

It is a 1.6-billion-parameter model from Nari Labs, built on an autoregressive transformer with the Descript Audio Codec for audio generation.

On TTS.ai, Dia is configured for English. Its strength is dialogue generation rather than broad multilingual coverage.

← Alle stemmer

Dia TTS TTS

Elsker TTS.ai? Fortæl dine venner!

Om Dia TTS

Et blik

Dia TTS stemmer

Speaker 1

Speaker 2

Dia TTS Ofte stillede spørgsmål om TTS

What is Dia TTS designed for?

How big is the Dia model?

Does Dia support languages other than English?