Piper TTS — o melhor custo-benefício para CPU antiga
Piper é um sistema neural TTS local e rápido, otimizado para dispositivos como Raspberry Pi 4 — ou seja, CPU bem mais fraca que um Intel 3ª geração. Usa modelos ONNX treinados com VITS, com qualidade de 16kHz a 22kHz dependendo do modelo escolhido. SourceForge
Na prática, um usuário que comparou Piper vs Kokoro em CPU fraca reportou que o Kokoro levava 25–30 segundos para gerar um arquivo de áudio, enquanto o Piper gerava em menos de 1 segundo