Biblioteca de voz

Examine, previsualice e compare máis de 100 voces de IA en máis de 24 modelos. Encontre a voz perfecta para o seu proxecto.

101+ Vozes

101 atopouse ningunha voz

--
Estándar Chinese Female
Estándar Chinese Male
Estándar English Female
Estándar English Female
Estándar English Female
Estándar English Female
Estándar English Male
Estándar English Male
Estándar English Male
Estándar English Male
Estándar English Male
Estándar English Male
Estándar French Female
Estándar French Male
Estándar German Female
Estándar German Male
Estándar Hindi Male
Estándar Italian Male
Estándar Japanese Female
Estándar Japanese Male
Estándar Korean Female
Estándar Korean Male
Estándar Polish Male
Estándar Portuguese Male
Estándar Russian Male
Estándar Spanish Female
Estándar Spanish Male
Estándar Turkish Male
Premium English Neutral
Estándar Chinese Female
Estándar Chinese Male
Estándar English Female
Estándar English Male
Estándar Japanese Female
Estándar English Neutral
Estándar English Neutral
Estándar Chinese Neutral
Estándar English Neutral
Libre English Male
Libre Portuguese Male
Libre Spanish Male
Libre Hindi Female
Libre Japanese Female
Libre English Female
Libre Spanish Female
Libre Portuguese Female
Libre English Female
Libre Japanese Female
Libre English Female
Libre English Male
Libre Italian Male
Libre English Female
Libre Hindi Male
Libre Italian Female
Libre English Female
Libre French Female
Libre English Female
Libre Chinese Female
Libre Chinese Female
Libre Chinese Female
Libre Chinese Male
Libre Chinese Female
Libre English Female
Libre English Female
Libre French Female
Libre Japanese Female
Libre Korean Female
Libre Spanish Female
Premium English Neutral
Estándar English Male
Estándar English Female
Estándar English Female
Estándar English Male
Estándar English Female
Estándar English Female
Estándar English Male
Estándar English Female
Estándar English Neutral
Libre English Male
Libre English Female
Libre English Female
Libre English Female
Libre English Male
Libre English Male
Libre English Male
Estándar English Male
Estándar English Male
Estándar English Male
Estándar Japanese Female
Estándar English Male
Estándar English Female
Estándar Korean Female
Estándar Chinese Male
Estándar English Female
Estándar English Neutral
Premium English Neutral
Premium English Neutral
Libre English Neutral

Non hai voces que coincidan cos seus filtros. Probe a axustar os seus criterios de procura.

Vozes por modelo de IA

Cada modelo de TTS ten o seu propio conxunto de voces con características únicas. Algúns modelos admiten a clonación de voz, o que lle permite usar calquera voz como referencia.

BarkBark 28 voces Estándar

Probar o modelo

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Chinese Female 1

Chinese

Chinese Male 1

Chinese

English Female 1

English

English Female 2

English

English Female 3

English

English Female 4

English

English Male 1

English

English Male 2

English

Ver todo 28 Bark voces

ChatterboxChatterbox 1 voces Premium

Probar o modelo

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Default

English

CosyVoice 2CosyVoice 2 5 voces Estándar

Probar o modelo

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Chinese Female

Chinese

Chinese Male

Chinese

English Female

English

English Male

English

Japanese Female

Japanese

Dia TTSDia TTS 2 voces Estándar

Probar o modelo

Multi-speaker dialog generation model that creates natural conversations between speakers.

Speaker 1

English

Speaker 2

English

GPT-SoVITSGPT-SoVITS 1 voces Estándar

Probar o modelo

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Default

Chinese

IndexTTS-2IndexTTS-2 1 voces Estándar

Probar o modelo

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Default

English

KokoroKokoro 26 voces Libre

Probar o modelo

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Adam

English

Alex

Portuguese

Alex

Spanish

Alpha

Hindi

Alpha

Japanese

Bella

English

Dora

Spanish

Dora

Portuguese

Ver todo 26 Kokoro voces

MeloTTSMeloTTS 7 voces Libre

Probar o modelo

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Chinese

Chinese

English British

English

English US

English

French

French

Japanese

Japanese

Korean

Korean

Spanish

Spanish

OpenVoiceOpenVoice 1 voces Premium

Probar o modelo

Instant voice cloning with granular control over style, emotion, and accent.

Default

English

OrpheusOrpheus 8 voces Estándar

Probar o modelo

Human-level emotional TTS model trained on 100K hours of speech data.

Dan

English

Jess

English

Leah

English

Leo

English

Mia

English

Tara

English

Zac

English

Zoe

English

Parler TTSParler TTS 1 voces Estándar

Probar o modelo

Describe the voice you want in natural language and Parler generates matching speech.

Default

English

PiperPiper 7 voces Libre

Probar o modelo

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Alan (UK)

English

Alba (UK)

English

Amy (US)

English

Jenny (UK)

English

Joe (US)

English

Lessac (US)

English

Ryan (US)

English

Qwen3 TTSQwen3 TTS 9 voces Estándar

Probar o modelo

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Aiden

English

Dylan

English

Eric

English

Ono Anna

Japanese

Ryan

English

Serena

English

Sohee

Korean

Uncle Fu

Chinese

Ver todo 9 Qwen3 TTS voces

Spark TTSSpark TTS 1 voces Estándar

Probar o modelo

Voice cloning TTS with controllable emotion and speaking style via prompts.

Default

English

StyleTTS 2StyleTTS 2 1 voces Premium

Probar o modelo

Human-level text-to-speech through style diffusion and adversarial training.

Default

English

Tortoise TTSTortoise TTS 1 voces Premium

Probar o modelo

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Random

English

VITSVITS 1 voces Libre

Probar o modelo

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Default

English

Entender as voces da IA

Niveis de calidade da voz

TTS. ai ofrece voces en tres niveis de calidade. As voces de nivel libre de Piper, VITS e MeloTTS ofrecen unha síntese rápida e de boa calidade sen custo. As voces de nivel estándar de modelos como Kokoro e CosyVoice 2 ofrecen unha prosodia e emoción máis naturais. As voces de nivel premium de OpenVoice, Chatterbox e StyleTTS 2 proporcionan a fala máis realista e humana dispoñíbel en TTS de código aberto.

Vozes multilingüesName

Moitas voces admiten múltiples linguas. Algúns modelos como CosyVoice 2 e GPT- SoVITS admiten a síntese entre linguas, onde unha voz adestrada nunha lingua pode falar naturalmente noutra. O filtro de linguas de riba permítelle atopar voces que admitan nativamente a lingua de destino, asegurando a mellor pronuncia e entoación.

Clonaxe de voz

Algúns modelos admiten a clonación de voz, o que significa que pode usar calquera voz como referencia para crear un discurso que soe como esa persoa. Envíe unha mostra de son curta (10- 30 segundos) e o modelo adaptarase para coincidir coas características da voz. Os modelos que admiten a clonación son GPT- SoVITS, CosyVoice 2 e Chatterbox.

Escoller a voz correcta

A mellor voz depende do seu caso de uso. Para audiolibros e podcasts, empregue voces premium con prosodia natural. Para personaxes de xogos, explore voces diversas a través de modelos. Para accesibilidade e lectores de pantalla, escolla voces claras e axeitadas. Para prototipos rápidos, as voces de nivel libre ofrecen resultados instantáneos sen custo de crédito. Previsualice cada voz co botón de reprodución antes de facer a súa escolla.

Preguntas frecuentes

TTS. ai ofrece máis de 100 voces de IA en 24 modelos de síntese de voz. As voces abarcan varias linguas, xéneros, acentos e estilos de fala. Engándanse novas voces regularmente á medida que ampliamos a nosa biblioteca de modelos.

Si, moitas voces teñen vistas previas de son que pode escoitar directamente nesta páxina. Prema o botón de reprodución xunto a calquera voz cunha vista previa para escoitar unha mostra. Tamén pode probar calquera voz na páxina Texto a voz co seu propio texto.

Empregue os controles de filtro na parte superior da páxina para restrinxir as voces por modelo, lingua ou xénero. Pode combinar filtros para atopar exactamente a voz que precisa, por exemplo, voces femininas inglesas do modelo Kokoro.

As voces libres (Kokoro, Piper, VITS, MeloTTS) non requiren créditos. As voces estándar (Bark, CosyVoice 2, Dia, Fish Speech) custan 2 créditos por 1K caracteres. As voces premium (Chatterbox, Tortoise) custan 4 créditos por 1K caracteres e ofrecen a mellor calidade.

Kokoro (nivel libre) ten unha puntuación de 5/ 5 pola calidade e é a opción libre que soa máis natural. Para unha calidade superior, Chatterbox e Tortoise ofrecen unha naturalidade excepcional co soporte de clonación de voz. Escoite as vistas previas para xulgar que voz se axusta mellor ás súas necesidades.

Si, todas as voces poden usarse comercialmente. Os nosos modelos usan licenzas de código aberto (MIT, Apache 2. 0). O son xerado é seu para usar en vídeos, podcasts, aplicacións, xogos e calquera outra aplicación comercial.

A nosa biblioteca de voz cobre máis de 30 idiomas, incluíndo inglés, español, francés, alemán, italiano, portugués, chinés, xaponés, coreano, árabe, ruso, hindi, holandés, polaco, turco e moitos máis. A disponibilidade de idiomas varía segundo o modelo.

Si, use a nosa ferramenta de clonación de voz para crear unha voz personalizada a partir de só 5- 30 segundos de audio de referencia. As voces clonadas aparecen na súa conta baixo « As miñas voces » e poden ser reutilizadas para futuras xeracións de texto- a- voz.

Considere o seu caso de uso: para audiolibros, escolla voces expresivas como as de Bark ou Chatterbox. Para aplicacións e IVR, escolla voces claras de Kokoro ou MeloTTS. Para contido multilingüe, use CosyVoice 2 ou GPT- SoVITS. Previsualice varias opcións para atopar a que mellor se adapte.

Si, varios modelos ofrecen variedades de acentos. MeloTTS fornece acentos de inglés americano, británico, indio e australiano. Outros modelos teñen variantes de voz rexionais para español, francés, portugués e chinés. Filtre pola lingua para explorar as opcións de acentos.

Si, todas as voces son accesíbeis a través da nosa API REST. Especifique o modelo e o ID da voz na súa solicitude de API para xerar fala con calquera voz por programación. Consulte a nosa páxina de documentación da API para obter exemplos de código e referencias de ID da voz.

Engadimos regularmente novas voces á medida que integramos modelos TTS adicionais e ampliamos os existentes. Siga as nosas actualizacións para manterse informado sobre novas engadidas de voz, melloras nos modelos e expansións de linguaxe.

Grave, mellore e transforme a súa voz

Empregue o gravador de voz co noso conxunto completo de ferramentas de son de IA. Clone a súa voz, transcríbaa, mellore a calidade e moito máis.