English Text to Speech

Turn English text into natural speech with AI voices. 93 voices. Free, no signup — download as MP3 or WAV.

English text-to-speech spans a wide accent range — General American, Received Pronunciation, Scottish, Irish, Australian, Indian and others — and the choice materially changes vowel quality and rhythm. English is stress-timed, so a natural voice must reduce unstressed syllables to schwa and place sentence stress correctly rather than giving every word equal weight. Its deep orthography (where "ough" reads six different ways) makes a strong pronunciation dictionary and number/abbreviation normalization the hardest part of good English synthesis.

Open the English voice editor

Sample — English

“The quick brown fox jumps over the lazy dog while the morning sun rises slowly above the quiet valley.”

Native name
English
Speakers
1.5 billion total speakers (about 380 million native)
Language family
West Germanic branch of Indo-European
Script
Latin
Spoken in
United States, United Kingdom, Canada, Australia, India, Nigeria, Ireland, New Zealand, South Africa

93 English AI Voices

English Female 1

Bark
Standardvärde Female
Användning

English Female 2

Bark
Standardvärde Female
Användning

English Female 3

Bark
Standardvärde Female
Användning

English Female 4

Bark
Standardvärde Female
Användning

English Male 1

Bark
Standardvärde Male
Användning

English Male 2

Bark
Standardvärde Male
Användning

English Male 3

Bark
Standardvärde Male
Användning

English Male 4

Bark
Standardvärde Male
Användning

English Male 5

Bark
Standardvärde Male
Användning

English Male 6

Bark
Standardvärde Male
Användning

English Female 1

Bark Small
Standardvärde Female
Användning

English Female 2

Bark Small
Standardvärde Female
Användning

English Male 1

Bark Small
Standardvärde Male
Användning

Default

Chatterbox
Bidrag Neutral
Användning
Standardvärde Neutral
Användning

English Female

CosyVoice 2
Standardvärde Female
Användning

English Male

CosyVoice 2
Standardvärde Male
Användning

English Female

CosyVoice3
Standardvärde Female
Användning

English Male

CosyVoice3
Standardvärde Male
Användning

Default

Darwin TTS
Standardvärde Neutral
Användning

Speaker 1

Dia TTS
Standardvärde Neutral
Användning

Speaker 2

Dia TTS
Standardvärde Neutral
Användning

English Default

GPT-SoVITS
Standardvärde Neutral
Användning

Default

IndexTTS-2
Standardvärde Neutral
Användning
Standardvärde Neutral
Användning

Default

Kani TTS 2
Standardvärde Neutral
Användning

Bella

Kitten TTS
Avgiftsfri Female
Användning

Bruno

Kitten TTS
Avgiftsfri Male
Användning

Hugo

Kitten TTS
Avgiftsfri Male
Användning

Jasper

Kitten TTS
Avgiftsfri Male
Användning

Kiki

Kitten TTS
Avgiftsfri Female
Användning
Avgiftsfri Male
Användning

Luna

Kitten TTS
Avgiftsfri Female
Användning

Rosie

Kitten TTS
Avgiftsfri Female
Användning

Adam

Kokoro
Avgiftsfri Male
Användning

Bella

Kokoro
Avgiftsfri Female
Användning

Emma (British)

Kokoro
Avgiftsfri Female
Användning

George (British)

Kokoro
Avgiftsfri Male
Användning

Heart

Kokoro
Avgiftsfri Female
Användning

Isabella (British)

Kokoro
Avgiftsfri Female
Användning

Lewis (British)

Kokoro
Avgiftsfri Male
Användning

Michael

Kokoro
Avgiftsfri Male
Användning

Nicole

Kokoro
Avgiftsfri Female
Användning

Sarah

Kokoro
Avgiftsfri Female
Användning

Sky

Kokoro
Avgiftsfri Female
Användning

English British

MeloTTS
Avgiftsfri Female
Användning

English US

MeloTTS
Avgiftsfri Female
Användning

Default

Ming-Omni TTS
Avgiftsfri Neutral
Användning

Default

MOSS-TTS Nano
Standardvärde Neutral
Användning

Default Speaker

MOSS-TTSD
Standardvärde Neutral
Användning

Default

OpenVoice
Bidrag Neutral
Användning

Dan

Orpheus
Standardvärde Male
Användning

Jess

Orpheus
Standardvärde Female
Användning

Leah

Orpheus
Standardvärde Female
Användning

Leo

Orpheus
Standardvärde Male
Användning

Mia

Orpheus
Standardvärde Female
Användning

Tara

Orpheus
Standardvärde Female
Användning

Zac

Orpheus
Standardvärde Male
Användning

Zoe

Orpheus
Standardvärde Female
Användning

Female 1 (Neutral)

OuteTTS
Avgiftsfri Female
Användning

Default

Parler TTS
Standardvärde Neutral
Användning

Alan (UK)

Piper
Avgiftsfri Male
Användning

Alba (UK)

Piper
Avgiftsfri Female
Användning

Amy (US)

Piper
Avgiftsfri Female
Användning

Jenny (UK)

Piper
Avgiftsfri Female
Användning

Joe (US)

Piper
Avgiftsfri Male
Användning

Lessac (US)

Piper
Avgiftsfri Male
Användning

Ryan (US)

Piper
Avgiftsfri Male
Användning

Alba

Pocket TTS
Avgiftsfri Female
Användning

Azelma

Pocket TTS
Avgiftsfri Female
Användning

Cosette

Pocket TTS
Avgiftsfri Female
Användning

Eponine

Pocket TTS
Avgiftsfri Female
Användning

Fantine

Pocket TTS
Avgiftsfri Female
Användning

Javert

Pocket TTS
Avgiftsfri Male
Användning

Jean

Pocket TTS
Avgiftsfri Male
Användning

Marius

Pocket TTS
Avgiftsfri Male
Användning

Aiden

Qwen3 TTS
Standardvärde Male
Användning

Dylan

Qwen3 TTS
Standardvärde Male
Användning

Eric

Qwen3 TTS
Standardvärde Male
Användning

Ryan

Qwen3 TTS
Standardvärde Male
Användning

Serena

Qwen3 TTS
Standardvärde Female
Användning

Vivian

Qwen3 TTS
Standardvärde Female
Användning

Speaker 0

Sesame CSM
Bidrag Neutral
Användning

Speaker 1

Sesame CSM
Bidrag Neutral
Användning

Default

Spark TTS
Standardvärde Neutral
Användning

Default

StyleTTS 2
Bidrag Neutral
Användning

Random

Tortoise TTS
Bidrag Neutral
Användning

Speaker 1

VibeVoice
Standardvärde Neutral
Användning

Speaker 2

VibeVoice
Standardvärde Neutral
Användning

Speaker 3

VibeVoice
Standardvärde Neutral
Användning

Speaker 4

VibeVoice
Standardvärde Neutral
Användning

Default

VITS
Avgiftsfri Neutral
Användning

Default

VoxCPM
Standardvärde Neutral
Användning

What people use English text to speech for

Audiobook and e-learning narration
YouTube and podcast voiceover
IVR and call-center prompts
Screen readers and accessibility tools
E-commerce and explainer video voiceover

English Text to Speech — FAQ

Voices cover American, British (RP), Australian, Irish, Scottish and Indian English among others, so you can match the accent to your target audience.

Yes. The engine normalizes text first, so "$19.99", "Dr.", "2024" and "St." are expanded to the words a human would actually say in context.

Both are supported. Spellings like "colour/color" or "realise/realize" are read identically; only the selected accent changes how the words sound.

Yes — punctuation drives natural pausing, and supported voices respond to SSML tags for stress, rate and inserted breaks.

Related languages