<speak>
<voice name="it-IT-Standard-A">
<prosody rate="95%" pitch="0%">
Pensavo che bastasse una foto
<break time="500ms"/>
per non perdere questo momento.
<break time="700ms"/>
Ma non conserva ciò che ho sentito.
<break time="700ms"/>
Solo un’immagine.
<break time="800ms"/>
E io voglio qualcosa di più.
</prosody>
</voice>
</speak>