Biblioteca de voz

Examine, previsualice e compare máis de 100 voces de IA en máis de 24 modelos. Encontre a voz perfecta para o seu proxecto.

101+ Vozes

Voces destacadas

1 atopouse ningunha voz

--
Estándar Chinese Neutral

Non hai voces que coincidan cos seus filtros. Probe a axustar os seus criterios de procura.

Vozes por modelo de IA

Cada modelo de TTS ten o seu propio conxunto de voces con características únicas. Algúns modelos admiten a clonación de voz, o que lle permite usar calquera voz como referencia.

GPT-SoVITSGPT-SoVITS 1 voces Estándar

Probar o modelo

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Default

Chinese

Entender as voces da IA

Niveis de calidade da voz

TTS. ai ofrece voces en tres niveis de calidade. As voces de nivel libre de Piper, VITS e MeloTTS ofrecen unha síntese rápida e de boa calidade sen custo. As voces de nivel estándar de modelos como Kokoro e CosyVoice 2 ofrecen unha prosodia e emoción máis naturais. As voces de nivel premium de OpenVoice, Chatterbox e StyleTTS 2 proporcionan a fala máis realista e humana dispoñíbel en TTS de código aberto.

Vozes multilingüesName

Moitas voces admiten múltiples linguas. Algúns modelos como CosyVoice 2 e GPT- SoVITS admiten a síntese entre linguas, onde unha voz adestrada nunha lingua pode falar naturalmente noutra. O filtro de linguas de riba permítelle atopar voces que admitan nativamente a lingua de destino, asegurando a mellor pronuncia e entoación.

Clonaxe de voz

Algúns modelos admiten a clonación de voz, o que significa que pode usar calquera voz como referencia para crear un discurso que soe como esa persoa. Envíe unha mostra de son curta (10- 30 segundos) e o modelo adaptarase para coincidir coas características da voz. Os modelos que admiten a clonación son GPT- SoVITS, CosyVoice 2 e Chatterbox.

Escoller a voz correcta

A mellor voz depende do seu caso de uso. Para audiolibros e podcasts, empregue voces premium con prosodia natural. Para personaxes de xogos, explore voces diversas a través de modelos. Para accesibilidade e lectores de pantalla, escolla voces claras e axeitadas. Para prototipos rápidos, as voces de nivel libre ofrecen resultados instantáneos sen custo de crédito. Previsualice cada voz co botón de reprodución antes de facer a súa escolla.

Preguntas frecuentes

TTS. ai ofrece máis de 100 voces de IA en 24 modelos de síntese de voz. As voces abarcan varias linguas, xéneros, acentos e estilos de fala. Engándanse novas voces regularmente á medida que ampliamos a nosa biblioteca de modelos.

Si, moitas voces teñen vistas previas de son que pode escoitar directamente nesta páxina. Prema o botón de reprodución xunto a calquera voz cunha vista previa para escoitar unha mostra. Tamén pode probar calquera voz na páxina Texto a voz co seu propio texto.

Empregue os controles de filtro na parte superior da páxina para restrinxir as voces por modelo, lingua ou xénero. Pode combinar filtros para atopar exactamente a voz que precisa, por exemplo, voces femininas inglesas do modelo Kokoro.

As voces libres (Kokoro, Piper, VITS, MeloTTS) non requiren créditos. As voces estándar (Bark, CosyVoice 2, Dia, Fish Speech) custan 2 créditos por 1K caracteres. As voces premium (Chatterbox, Tortoise) custan 4 créditos por 1K caracteres e ofrecen a mellor calidade.

Kokoro (nivel libre) ten unha puntuación de 5/ 5 pola calidade e é a opción libre que soa máis natural. Para unha calidade superior, Chatterbox e Tortoise ofrecen unha naturalidade excepcional co soporte de clonación de voz. Escoite as vistas previas para xulgar que voz se axusta mellor ás súas necesidades.

Si, todas as voces poden usarse comercialmente. Os nosos modelos usan licenzas de código aberto (MIT, Apache 2. 0). O son xerado é seu para usar en vídeos, podcasts, aplicacións, xogos e calquera outra aplicación comercial.

A nosa biblioteca de voz cobre máis de 30 idiomas, incluíndo inglés, español, francés, alemán, italiano, portugués, chinés, xaponés, coreano, árabe, ruso, hindi, holandés, polaco, turco e moitos máis. A disponibilidade de idiomas varía segundo o modelo.

Si, use a nosa ferramenta de clonación de voz para crear unha voz personalizada a partir de só 5- 30 segundos de audio de referencia. As voces clonadas aparecen na súa conta baixo « As miñas voces » e poden ser reutilizadas para futuras xeracións de texto- a- voz.

Considere o seu caso de uso: para audiolibros, escolla voces expresivas como as de Bark ou Chatterbox. Para aplicacións e IVR, escolla voces claras de Kokoro ou MeloTTS. Para contido multilingüe, use CosyVoice 2 ou GPT- SoVITS. Previsualice varias opcións para atopar a que mellor se adapte.

Si, varios modelos ofrecen variedades de acentos. MeloTTS fornece acentos de inglés americano, británico, indio e australiano. Outros modelos teñen variantes de voz rexionais para español, francés, portugués e chinés. Filtre pola lingua para explorar as opcións de acentos.

Si, todas as voces son accesíbeis a través da nosa API REST. Especifique o modelo e o ID da voz na súa solicitude de API para xerar fala con calquera voz por programación. Consulte a nosa páxina de documentación da API para obter exemplos de código e referencias de ID da voz.

Engadimos regularmente novas voces á medida que integramos modelos TTS adicionais e ampliamos os existentes. Siga as nosas actualizacións para manterse informado sobre novas engadidas de voz, melloras nos modelos e expansións de linguaxe.

Grave, mellore e transforme a súa voz

Empregue o gravador de voz co noso conxunto completo de ferramentas de son de IA. Clone a súa voz, transcríbaa, mellore a calidade e moito máis.