Biblioteca de veu

Navegar, previsualitzar, i comparar 100+AI veus a través de 24+ models. Trobar la veu perfecta pel vostre projecte.

101+ Voices

101 S' han trobat veus

--
Estàndard Chinese Female
Estàndard Chinese Male
Estàndard English Female
Estàndard English Female
Estàndard English Female
Estàndard English Female
Estàndard English Male
Estàndard English Male
Estàndard English Male
Estàndard English Male
Estàndard English Male
Estàndard English Male
Estàndard French Female
Estàndard French Male
Estàndard German Female
Estàndard German Male
Estàndard Hindi Male
Estàndard Italian Male
Estàndard Japanese Female
Estàndard Japanese Male
Estàndard Korean Female
Estàndard Korean Male
Estàndard Polish Male
Estàndard Portuguese Male
Estàndard Russian Male
Estàndard Spanish Female
Estàndard Spanish Male
Estàndard Turkish Male
Premium English Neutral
Estàndard Chinese Female
Estàndard Chinese Male
Estàndard English Female
Estàndard English Male
Estàndard Japanese Female
Estàndard English Neutral
Estàndard English Neutral
Estàndard Chinese Neutral
Estàndard English Neutral
Lliure English Male
Lliure Portuguese Male
Lliure Spanish Male
Lliure Hindi Female
Lliure Japanese Female
Lliure English Female
Lliure Spanish Female
Lliure Portuguese Female
Lliure English Female
Lliure English Male
Lliure Japanese Female
Lliure English Female
Lliure English Female
Lliure English Male
Lliure English Male
Lliure Italian Male
Lliure English Female
Lliure Hindi Male
Lliure Italian Female
Lliure English Female
Lliure French Female
Lliure English Female
Lliure Chinese Female
Lliure Chinese Female
Lliure Chinese Female
Lliure Chinese Male
Lliure Chinese Female
Lliure English Female
Lliure English Female
Lliure French Female
Lliure Japanese Female
Lliure Korean Female
Lliure Spanish Female
Premium English Neutral
Estàndard English Male
Estàndard English Female
Estàndard English Female
Estàndard English Male
Estàndard English Female
Estàndard English Female
Estàndard English Male
Estàndard English Female
Estàndard English Neutral
Lliure English Male
Lliure English Female
Lliure English Female
Lliure English Female
Lliure English Male
Lliure English Male
Lliure English Male
Estàndard English Male
Estàndard English Male
Estàndard English Male
Estàndard Japanese Female
Estàndard English Male
Estàndard English Female
Estàndard Korean Female
Estàndard Chinese Male
Estàndard English Female
Estàndard English Neutral
Premium English Neutral
Premium English Neutral
Lliure English Neutral

No hi ha veus que coincideixin amb els vostres filtres. Intenteu ajustar els vostres criteris de cerca.

Global Voices per model IA

Cada model TTS té el seu propi conjunt de veus amb característiques úniques. Alguns models permeten clonar veu, permetent- vos usar qualsevol veu com a referència.

BarkBark 28 veus Estàndard

Prova el model

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Chinese Female 1

Chinese
Ús

Chinese Male 1

Chinese
Ús

English Female 1

English
Ús

English Female 2

English
Ús

English Female 3

English
Ús

English Female 4

English
Ús

English Male 1

English
Ús

English Male 2

English
Ús

Visualitza- ho tot 28 Bark veus

ChatterboxChatterbox 1 veus Premium

Prova el model

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Default

English
Ús

CosyVoice 2CosyVoice 2 5 veus Estàndard

Prova el model

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Chinese Female

Chinese
Ús

Chinese Male

Chinese
Ús

English Female

English
Ús

English Male

English
Ús

Japanese Female

Japanese
Ús

Dia TTSDia TTS 2 veus Estàndard

Prova el model

Multi-speaker dialog generation model that creates natural conversations between speakers.

Speaker 1

English
Ús

Speaker 2

English
Ús

GPT-SoVITSGPT-SoVITS 1 veus Estàndard

Prova el model

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Default

Chinese
Ús

IndexTTS-2IndexTTS-2 1 veus Estàndard

Prova el model

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Default

English
Ús

KokoroKokoro 26 veus Lliure

Prova el model

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Adam

English
Ús

Alex

Portuguese
Ús

Alex

Spanish
Ús

Alpha

Hindi
Ús

Alpha

Japanese
Ús

Bella

English
Ús

Dora

Spanish
Ús

Dora

Portuguese
Ús

Visualitza- ho tot 26 Kokoro veus

MeloTTSMeloTTS 7 veus Lliure

Prova el model

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Chinese

Chinese
Ús

English British

English
Ús

English US

English
Ús

French

French
Ús

Japanese

Japanese
Ús

Korean

Korean
Ús

Spanish

Spanish
Ús

OpenVoiceOpenVoice 1 veus Premium

Prova el model

Instant voice cloning with granular control over style, emotion, and accent.

Default

English
Ús

OrpheusOrpheus 8 veus Estàndard

Prova el model

Human-level emotional TTS model trained on 100K hours of speech data.

Dan

English
Ús

Jess

English
Ús

Leah

English
Ús

Leo

English
Ús

Mia

English
Ús

Tara

English
Ús

Zac

English
Ús

Zoe

English
Ús

Parler TTSParler TTS 1 veus Estàndard

Prova el model

Describe the voice you want in natural language and Parler generates matching speech.

Default

English
Ús

PiperPiper 7 veus Lliure

Prova el model

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Alan (UK)

English
Ús

Alba (UK)

English
Ús

Amy (US)

English
Ús

Jenny (UK)

English
Ús

Joe (US)

English
Ús

Lessac (US)

English
Ús

Ryan (US)

English
Ús

Qwen3 TTSQwen3 TTS 9 veus Estàndard

Prova el model

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Aiden

English
Ús

Dylan

English
Ús

Eric

English
Ús

Ono Anna

Japanese
Ús

Ryan

English
Ús

Serena

English
Ús

Sohee

Korean
Ús

Uncle Fu

Chinese
Ús

Visualitza- ho tot 9 Qwen3 TTS veus

Spark TTSSpark TTS 1 veus Estàndard

Prova el model

Voice cloning TTS with controllable emotion and speaking style via prompts.

Default

English
Ús

StyleTTS 2StyleTTS 2 1 veus Premium

Prova el model

Human-level text-to-speech through style diffusion and adversarial training.

Default

English
Ús

Tortoise TTSTortoise TTS 1 veus Premium

Prova el model

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Random

English
Ús

VITSVITS 1 veus Lliure

Prova el model

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Default

English
Ús

Entenent I'AI de Global Voices

Tiers de qualitat de veu

TTS.ai ofereix veus a través de tres corbatas de qualitat. Les veus més lliures de Canonador, VITS, i MeloTTS l' entre les quals proporcionaven ràpid, de qualitat a costa. Les veus estàndard de models com Kokoro i CosyVoice 2 ofereixen més veus naturals i emocions. Premium- tetter des de OpenVice, Chat, Caixa de xat, i estil TTS 2 proporcionen el discurs humà més realista, com ara el de Kokoro, disponible en el codi obert TTS.

Multilingüe Voices

Moltes veus donen suport a diversos idiomes. Alguns models com CosyVoice 2 i GPTT-SoVITS permeten la pronunciació creuària, on una veu entrenada en un idioma pot parlar naturalment en un altre. El filtre de l' idioma de dalt us permet trobar veus que el funcionament natiu de la vostra llengua de destí, assegurant la millor pronunciació i innació.

Clon de veu

Alguns models permeten la clonació de veu, el qual vol dir que podeu usar qualsevol veu com a referència per a crear un discurs que sona com aquesta persona. Carrega una mostra d' àudio curta (10- 30 segons) i el model s' adaptarà a coincidir amb les característiques de la veu. Models que permeten la clonació inclou el GPT- STITVS, CosyVice 2, i Caixa Chatter.

Triant la veu de la dreta

La millor veu depèn del vostre cas d' ús. Per als podcasts d' àudio i podcasts, useu veus primes amb prosodi natural. Per als caràcters de joc, exploreu veus diverses en models. Per a l' accessibilitat i els lectors de pantalla, escolliu les veus ben netas, ben refinada. Per a un prototip ràpid, ofereix resultats instantanis sense cost de crèdit. Vista prèvia cada veu amb el botó de joc abans de fer la vostra elecció.

Preguntes més freqüents

TTS.ai ofereix veus 100+A a través de 24 models de text a veu. Les xarxes inclouen múltiples llengües, gèneres, accents i parlant d' estils. Les noves veus s' afegeixen regularment mentre expandim la nostra biblioteca de models.

Sí, moltes veus tenen vistes prèvies d' àudio podeu escoltar directament en aquesta pàgina. Cliqueu el botó de reproducció al costat de qualsevol veu amb una vista prèvia per escoltar una mostra. També podeu provar qualsevol veu a la pàgina Text a veu amb el vostre text.

Useu els controls de filtre a la part superior de la pàgina per reduir les veus amb model, idioma o gènere. Podeu combinar filtres per a trobar exactament la veu que necessiteu per exemple, dones veus en anglès del model Kokoro.

Les veus lliures (Kokoro, Poner, VITS, MeloTTS) no requereixen crèdits. Les veus estàndard (Bark, CosyVoice 2, Dia, veu de peix) costen 2 crèdits per 1 KB caràcters. La veu Premiumum (Chomalbox, Torose) costen 4 crèdits per 1K caràcters i ofereixen la qualitat més alta.

Kokoro (free tier) s' incrementa 5/ 5 per a qualitat i és l' opció més natural de la qualitat, la caixa de xat i la Tortose ofereix una naturalitat excepcional amb suport de veu clonada. Escolteu les vistes prèvies al jutge quina veu s' ajusta a les vostres millors necessitats.

Sí, totes les veus es poden utilitzar comercialment. Els nostres models usen llicències de codi obert (MIT, Apache 2.0). L' àudio generat és el vostre per usar en vídeos, podcasts, aplicacions, jocs i qualsevol altra aplicació comercial.

La nostra biblioteca de veu cobreix 30 o llengües en anglès, espanyol, alemany, italià, portuguès, xinès, japonès, coreana, àrab, rus, hindi, holandès, polonès, turc i molts més. La disponibilitat del llenguatge varia pel model.

Sí, useu l' eina Clon de veu per crear una veu personalitzada des de només 5- 30 segons d' àudio de referència. Les veus clonades apareixen en el vostre compte sota "My Voices" i es poden tornar a utilitzar per a futures generacions de text a veu.

Considereu el vostre cas d' ús: per a llibres d' àudio, escolliu veus expressives com aquelles de la caixa Barrak o Chatterbox. Per a aplicacions i IVR, escolliu Neteja les veus de Kokoro o MeloTTS. Per a contingut multilingüe, useu CosyVoice 2 o GPT- STITS. Vista prèvia de diverses opcions per a trobar el millor funcionament.

Sí, diversos models ofereixen varietats d' accents. MeloTTS proveeix nord-americans, britànics, indis, i els accents en anglès australià. Altres models tenen variants de veu regionals per espanyol, francès, portuguès i Xina. Filtre per l' idioma per explorar opcions d' accent.

Sí, totes les veus són accessibles a través de la nostra API REST. Especifiqueu l' ID del model i veu en la vostra petició d' API per generar el discurs amb qualsevol veu programada. Vegeu la pàgina de documentació de l' API per a exemples de codi i referències ID de veu.

Sovint afegeixem noves veus mentre intergim models TTS addicionals i expandim les existents. Després de que les nostres actualitzacions siguin informates sobre les noves sumes de veu, millores del model, i les expansió del llenguatge.

Enregistrar, millorar, i transformar la vostra veu

Utilitza l' enregistrament de veu amb la nostra completa suite d' eines d'àudio de la IA. Clona la veu, transcripció de veu, millora la qualitat, i més.