Sesame CSM

Speaker 0

Premium Inglês Neutral Sesame CSM

{nome} é uma voz de IA alimentada pelo modelo {modelo} de texto a voz. Esta voz Número de prémios fala {linguagem} e fornece a síntese de fala {qualidade}-qualidade. Com velocidade de geração {velocidade} e uma classificação de qualidade de 5/5, {nome} é bem adequado para {bet_for}. O motor {modelo} é desenvolvido por Sesame under the Apache 2.0 license, tornando-o seguro para uso comercial. As capacidades principais incluem: {características}.

Ainda não há avaliações

Sesame CSMInformações do modelo

Modelo Sesame CSM
Desenvolvedor Sesame
Qualidade
Velocidade Devagar
Licença Apache 2.0
Clonagem Não disponível
Tier Premium (4 créditos/1K caracteres)
Parâmetros 1B
Arquitetura Llama Backbone + Audio Codec
Ano 2025

Melhores casos de utilização para Speaker 0

Aplicações recomendadas com base nas características desta voz

Audiobooks & Narração

Use {nome} para narrar conteúdo de forma longa com prosodia natural e expressão.

Vídeo Voiceovers

Adicione narração profissional para vídeos, anúncios e conteúdos de mídia social do YouTube.

Podcasts & Broadcasting

Produção de qualidade estúdio adequada para podcasts, rádio e emissão profissional.

Jogos e mídia interativa

Qualidade premium para diálogo de jogos, histórias interativas e experiências imersivas.

Mais Sesame CSM Vozes

Outras vozes do mesmo modelo TTS

Speaker 1

Inglês Neutral

Perguntas Frequentes

Sesame CSM (Conversational Speech Model) é um modelo de parâmetro de 1 bilhão projetado especificamente para gerar fala conversacional. Ele modela os padrões naturais da conversação humana, incluindo tempo de tomada de turnos, respostas ao canal backcanal, reações emocionais e fluxo conversacional. CSM gera áudio que soa como uma conversa humana natural em vez de fala sintética.

O Sesame CSM foi desenvolvido pela Sesame e é lançado sob a licença Apache 2.0, que permite o uso comercial de áudio gerado.

Sesame CSM suporta 1 língua: Inglês.

Sesame CSM está no nível Premium — 4 créditos por 1.000 caracteres. Você pode visualizar qualquer voz Sesame CSM gratuitamente antes de gerar áudio completo.

Sesame CSM tem velocidade de geração mais lenta (prioritizando a qualidade). Leva mais tempo por geração, mas produz maior saída de fidelidade.

O Sesame CSM é classificado 5/5 para qualidade de áudio em TTS.ai. Oferece fala de qualidade estúdio, humana.

Não, Sesame CSM usa um conjunto fixo de vozes incorporadas. Para clonagem de voz, tente modelos como CosyVoice 2, GPT-SoVITS, ou Chatterbox.

Sim, Sesame CSM é especificamente recomendado para auxiliares de ai, chatbots, aplicações de ai conversacionais. Sua conversação, timing natural, capacidades de tomada de turnos tornam isso uma excelente escolha para este caso de uso.

Sim, o Sesame CSM está licenciado sob Apache 2.0, que permite uso comercial. O áudio gerado com vozes do Sesame CSM pode ser usado em vídeos, podcasts, aplicativos, jogos e qualquer outro projeto comercial.

Sim, todas as vozes em TTS.ai usam modelos de código aberto licenciados comercialmente (MIT, Apache 2.0). O áudio gerado é seu para usar em vídeos, podcasts, aplicativos, jogos e qualquer outra aplicação comercial.

Envie um pedido POST para /api/v1/tts/ com o nome do modelo e ID de voz. Consulte nossa página de documentação API para exemplos de código em Python, JavaScript, Go e cURL.

Sim, clique no botão Play nesta página para ouvir uma amostra. Você também pode digitar texto personalizado na página Texto para Voz e gerar uma visualização gratuita com qualquer voz.

Tentar Speaker 0 Agora

Digite qualquer texto e ouça-o falado por Speaker 0. Livre de utilizar.