English Text to Speech

Turn English text into natural speech with AI voices. 93 voices. Free, no signup — download as MP3 or WAV.

English text-to-speech spans a wide accent range — General American, Received Pronunciation, Scottish, Irish, Australian, Indian and others — and the choice materially changes vowel quality and rhythm. English is stress-timed, so a natural voice must reduce unstressed syllables to schwa and place sentence stress correctly rather than giving every word equal weight. Its deep orthography (where "ough" reads six different ways) makes a strong pronunciation dictionary and number/abbreviation normalization the hardest part of good English synthesis.

Open the English voice editor

Sample — English

“The quick brown fox jumps over the lazy dog while the morning sun rises slowly above the quiet valley.”

Native name
English
Speakers
1.5 billion total speakers (about 380 million native)
Language family
West Germanic branch of Indo-European
Script
Latin
Spoken in
United States, United Kingdom, Canada, Australia, India, Nigeria, Ireland, New Zealand, South Africa

93 English AI Voices

English Female 1

Bark
Стандартен Female
Използване

English Female 2

Bark
Стандартен Female
Използване

English Female 3

Bark
Стандартен Female
Използване

English Female 4

Bark
Стандартен Female
Използване

English Male 1

Bark
Стандартен Male
Използване

English Male 2

Bark
Стандартен Male
Използване

English Male 3

Bark
Стандартен Male
Използване

English Male 4

Bark
Стандартен Male
Използване

English Male 5

Bark
Стандартен Male
Използване

English Male 6

Bark
Стандартен Male
Използване

English Female 1

Bark Small
Стандартен Female
Използване

English Female 2

Bark Small
Стандартен Female
Използване

English Male 1

Bark Small
Стандартен Male
Използване

Default

Chatterbox
Премиум Neutral
Използване
Стандартен Neutral
Използване

English Female

CosyVoice 2
Стандартен Female
Използване

English Male

CosyVoice 2
Стандартен Male
Използване

English Female

CosyVoice3
Стандартен Female
Използване

English Male

CosyVoice3
Стандартен Male
Използване

Default

Darwin TTS
Стандартен Neutral
Използване

Speaker 1

Dia TTS
Стандартен Neutral
Използване

Speaker 2

Dia TTS
Стандартен Neutral
Използване

English Default

GPT-SoVITS
Стандартен Neutral
Използване

Default

IndexTTS-2
Стандартен Neutral
Използване
Стандартен Neutral
Използване

Default

Kani TTS 2
Стандартен Neutral
Използване

Bella

Kitten TTS
Безплатен Female
Използване

Bruno

Kitten TTS
Безплатен Male
Използване

Hugo

Kitten TTS
Безплатен Male
Използване

Jasper

Kitten TTS
Безплатен Male
Използване

Kiki

Kitten TTS
Безплатен Female
Използване
Безплатен Male
Използване

Luna

Kitten TTS
Безплатен Female
Използване

Rosie

Kitten TTS
Безплатен Female
Използване

Adam

Kokoro
Безплатен Male
Използване

Bella

Kokoro
Безплатен Female
Използване

Emma (British)

Kokoro
Безплатен Female
Използване

George (British)

Kokoro
Безплатен Male
Използване

Heart

Kokoro
Безплатен Female
Използване

Isabella (British)

Kokoro
Безплатен Female
Използване

Lewis (British)

Kokoro
Безплатен Male
Използване

Michael

Kokoro
Безплатен Male
Използване

Nicole

Kokoro
Безплатен Female
Използване

Sarah

Kokoro
Безплатен Female
Използване

Sky

Kokoro
Безплатен Female
Използване

English British

MeloTTS
Безплатен Female
Използване

English US

MeloTTS
Безплатен Female
Използване

Default

Ming-Omni TTS
Безплатен Neutral
Използване

Default

MOSS-TTS Nano
Стандартен Neutral
Използване

Default Speaker

MOSS-TTSD
Стандартен Neutral
Използване

Default

OpenVoice
Премиум Neutral
Използване

Dan

Orpheus
Стандартен Male
Използване

Jess

Orpheus
Стандартен Female
Използване

Leah

Orpheus
Стандартен Female
Използване

Leo

Orpheus
Стандартен Male
Използване

Mia

Orpheus
Стандартен Female
Използване

Tara

Orpheus
Стандартен Female
Използване

Zac

Orpheus
Стандартен Male
Използване

Zoe

Orpheus
Стандартен Female
Използване

Female 1 (Neutral)

OuteTTS
Безплатен Female
Използване

Default

Parler TTS
Стандартен Neutral
Използване

Alan (UK)

Piper
Безплатен Male
Използване

Alba (UK)

Piper
Безплатен Female
Използване

Amy (US)

Piper
Безплатен Female
Използване

Jenny (UK)

Piper
Безплатен Female
Използване

Joe (US)

Piper
Безплатен Male
Използване

Lessac (US)

Piper
Безплатен Male
Използване

Ryan (US)

Piper
Безплатен Male
Използване

Alba

Pocket TTS
Безплатен Female
Използване

Azelma

Pocket TTS
Безплатен Female
Използване

Cosette

Pocket TTS
Безплатен Female
Използване

Eponine

Pocket TTS
Безплатен Female
Използване

Fantine

Pocket TTS
Безплатен Female
Използване

Javert

Pocket TTS
Безплатен Male
Използване

Jean

Pocket TTS
Безплатен Male
Използване

Marius

Pocket TTS
Безплатен Male
Използване

Aiden

Qwen3 TTS
Стандартен Male
Използване

Dylan

Qwen3 TTS
Стандартен Male
Използване

Eric

Qwen3 TTS
Стандартен Male
Използване

Ryan

Qwen3 TTS
Стандартен Male
Използване

Serena

Qwen3 TTS
Стандартен Female
Използване

Vivian

Qwen3 TTS
Стандартен Female
Използване

Speaker 0

Sesame CSM
Премиум Neutral
Използване

Speaker 1

Sesame CSM
Премиум Neutral
Използване

Default

Spark TTS
Стандартен Neutral
Използване

Default

StyleTTS 2
Премиум Neutral
Използване

Random

Tortoise TTS
Премиум Neutral
Използване

Speaker 1

VibeVoice
Стандартен Neutral
Използване

Speaker 2

VibeVoice
Стандартен Neutral
Използване

Speaker 3

VibeVoice
Стандартен Neutral
Използване

Speaker 4

VibeVoice
Стандартен Neutral
Използване

Default

VITS
Безплатен Neutral
Използване

Default

VoxCPM
Стандартен Neutral
Използване

What people use English text to speech for

Audiobook and e-learning narration
YouTube and podcast voiceover
IVR and call-center prompts
Screen readers and accessibility tools
E-commerce and explainer video voiceover

English Text to Speech — FAQ

Voices cover American, British (RP), Australian, Irish, Scottish and Indian English among others, so you can match the accent to your target audience.

Yes. The engine normalizes text first, so "$19.99", "Dr.", "2024" and "St." are expanded to the words a human would actually say in context.

Both are supported. Spellings like "colour/color" or "realise/realize" are read identically; only the selected accent changes how the words sound.

Yes — punctuation drives natural pausing, and supported voices respond to SSML tags for stress, rate and inserted breaks.

Related languages