IA-kuéra ha'evéva Ñe'ẽnguéra.:
33+ modelo de código abierto, 279+ ñe'ẽnguéra 39+ Ñe'ẽnguéra. Ndojeporui peteĩ cuenta.
Opaite mba'e tekotevẽva IA ñe'ẽrã
30+ herramienta oñemopyendáva modelo IA fuente-abierto rehe
33+ Modelo ñe'ẽ IA
Umi modelo TTS fuente abierto rehegua colección tuichavéva peteĩ plataforma-pe.
Kokoro Libre
Kokoro hína peteĩ modelo texto-gui-ñe'ẽ-pe g̃uarã oguerekóva 82 millón parámetro, ha'éva tuichaiterei mba'e ijyvatevéva clase de peso-gui. Jepéramo michĩeterei, ome'ẽ ñe'ẽnguéra peteĩteĩ natural ha expresiva. Kokoro oykeko heta ñe'ẽnguérape, oikehápe inglés, japonés, chino ha coreano heta ñe'ẽnguéra expresiva-kuéra. Ojeporu pya'eterei, omoheñói ñe'ẽnguéra 100-guive pya'eve peteĩ GPU tiempo real-pe.
Oñeikotevẽ: TTS calidad ijyvatevéva, latencia michĩvéva, aplicación-kuéra transmisión rehegua
Ojehecha'ỹre
Piper Libre
Piper hína peteĩ motor de texto-gui-ñe'ẽ-pe pyahu, omoheñóiva Rhasspy oiporúvo VITS ha larynx arquitectura. Ojeporuporã CPU-pe, ha upéva ombohekoporãve umi dispositivo periférico-pe, automatización hogapypegua ha aplicación oikotevẽva TTS fuera de línea. Oguerekóvo hetave 100 ñe'ẽ 30 ñe'ẽgui, Piper ome'ẽ ñe'ẽ ñeikumby natural tiempo real-pe, avei Raspberry Pi 4-pe.
Oñeikotevẽ: Previsualización pya'evéva, jeike pya'e ha aplicación-kuéra incrustada
Ojehecha'ỹre
VITS Libre
VITS (inferencia variacional aprendizaje adversario rupive ñe'ẽ'aravo ñe'ẽ'aravo ñe'ẽ'aravo-gui ñe'ẽ'aravo-pe g̃uarã) ha'e peteĩ método TTS paralelo, oguerekóva peteĩ ñe'ẽ'aravo natural umi modelo ko'agãgua mokõi etapa-guive, oipuru inferencia variacional oñembohetavehápe flujo normalización ha peteĩ proceso de aprendizaje adversario, ha upéicha ojehupyty peteĩ naturalidad oñemoporãvehápe.
Oñeikotevẽ: Ñe'ẽjoaju ñe'ẽ'ỹmegua propósito general-pe g̃uarã prosodi natural reheve.
Ojehecha'ỹre
MeloTTS Libre
MeloTTS MyShell.ai mba'éva hína peteĩ biblioteca TTS multilenguaje rehegua oykekóva inglés (americano, británico, indio, australiano), español, francés, chino, japonés ha coreano. Ipya'eeterei, omboheko umi jehaipy pya'eterei rupi CPU añónte. MeloTTS oñemohenda ojeporu hag̃ua producción-pe ha oykeko CPU ha GPU inferencia.
Oñeikotevẽ: Aplicaciones de producción oikotevẽva TTS ipya'e ha multilingüe
Ojehecha'ỹre
Kani TTS 2 Libre
Kani-TTS-2 NineNineSix mba'éva hína peteĩ modelo ultraligero 400M parámetro-kuéra rehegua oñemopu'ãva peteĩ backbone LFM2 AI líquido-pe NVIDIA NanoCodec ndive. Ojeporu 3GB VRAM añónte ha ome'ẽ ~10 segundo ñe'ẽnguéra ~2 segundo aja peteĩ A100 (RTF 0.2)-pe. Ko'agãgua versión pública ome'ẽ peteĩ punto de control `kani-tts-2-en` inglés-pe añónte ha ndoguerekói pe gancho de incrustación oñeikotevẽva ñe'ẽnguéra clonación-pe g̃uarã — ojeporu Chatterbox / IndexTTS2 / F5-TTS clonación-pe g̃uarã, térã Kokoro / MeloTTS ndaha'éiva inglés-pe g̃uarã.
Oñeikotevẽ: Generación inglesa pya'evéva hardware VRAM sa'ivévape, tapykueve jehecha pya'evéva
Ojehecha'ỹre
OuteTTS Libre
OuteTTS ombotuichave umi lenguaje modelo tuichavéva oguerekóva capacidad ñe'ẽ'apo-gui ñe'ẽ'apo-pe g̃uarã, ha upéicha avei oñangareko arquitectura ypy rehe. Oipytyvõ heta backend-pe, oikehápe llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ha avei inferencia navegador rupive Transformers.js rupive. Oguerekóva clonación ñe'ẽ'apo rehegua cero disparo rupive umi perfil ñe'ẽ'apohára rehegua oñeñongatuhápe JSON-ramo.
Oñeikotevẽ: Despliegue Edge, TTS oñemopyendáva navegador-pe, entorno sa'i recurso oguerekóva
Ojehecha'ỹre
Pocket TTS Libre
Pocket TTS Kyutai mba'éva (Moshi omoheñói va'ekue) ha'e peteĩ modelo compacto texto-gui ñe'ẽngue-pe g̃uarã oguerekóva 100M parámetro, imbaretevéva ipukuvévagui. Oñemongu'e porã CPU-pe, oykeko ñe'ẽ clonación cero tiro rehegua peteĩ muestra de sonido añónte guive ha omoheñói ñe'ẽngue oguerekóva sonido natural. Modelo michĩva ojapo ichugui peteĩ modelo ideal umi entorno de despliegue extremo ha sa'i recurso oguerekóvape g̃uarã.
Oñeikotevẽ: Despliegue ipya'éva, entorno CPU añónte, clonación ñe'ẽmby pya'éva
Ojehecha'ỹre
Kitten TTS Libre
Kitten TTS KittenML mba'éva hína peteĩ modelo texto-gui-ñe'ẽ-pe g̃uarã ipya'evéva, oñemopyendáva ONNX-pe. Oguerekóva variante 15M guive 80M peve (25-80 MB disco-pe), ome'ẽ ñe'ẽ ñeikumby porã CPU-pe oikotevẽ'ỹre peteĩ GPU. Oguerekóva 8 ñe'ẽ oñemohendáva, ñe'ẽ ñeikumby pya'e oñemoambuéva ha ñe'ẽ ñeikumby preprocesamiento oñemohendáva papapykuéra, moneda ha unidad-kuéra. Iñambueporã umi aplicación desplegable ha de baja latencia-pe g̃uarã.
Oñeikotevẽ: TTS ipya'e ha pya'e, implementación de borde, aplicación de baja latencia
Ojehecha'ỹre
Ming-Omni TTS Libre
Ming-omni-tts-0.5B inclusionAI mba'éva hína peteĩ modelo de discurso omnimodal compacto oñemopyendáva BailingMM columna vertebral densa-pe, oguerekóva peteĩ descodificador de sonido ojokupytýva flujo rehe parche-pa-parche rupive. Oikuave'ẽ peteĩ salida 44.1kHz (CD calidad ykére), oykeko ñe'ẽ clonación cero disparo rehegua peteĩ referencia 3+ segundo rehegua, ha oike emoción/dialecto/BGM control integrado umi instrucción JSON rupive. Estabilidad mbarete - 0.83% WER umi referencia chino-pe.
Oñeikotevẽ: High-fidelity bilingual narration, emotion-controlled voice acting, Chinese audiobook content
Ojehecha'ỹre
MOSS-TTS Nano Libre
MOSS-TTS-Nano-100M hína peteĩ variante 100M-parámetro-pegua OpenMOSS-pegua, MOSS-TTS familia-pegua, ombojoajuhápe arquitectura de transformador de retraso. Oñemoambue modelo 8B calidad ypy rehe peso michĩvévape ~80 ha VRAM michĩvévape peteĩ ñeikotevẽ rupive, ha upéva ojapose hag̃ua ikatu hína despliegue de nivel libre ha alto rendimiento.
Oñeikotevẽ: TTS nivel-va'ekue, producción tuichavéva, jeporu interactivo sa'ivéva latencia-gui.
Ojehecha'ỹre
Bark Estándar
Peteĩ modelo texto-gui-ñe'ẽ-pe oñemopyendáva transformador-pe omoheñóihápe ñe'ẽ, purahéi ha efecto sonoro realista.
Desarrollador: Suno · Licencia: MIT
Ojehecha
Bark Small Estándar
Peteĩ versión ipya'evéva Bark-gui, inferencia pya'eve ha memoria jeiporu sa'ive.
Desarrollador: Suno · Licencia: MIT
Ojehecha
CosyVoice 2 Estándar
TTS escalable Alibaba rehegua, naturalidad yvypóra rehegua paridad ha latencia aimete cero.
Desarrollador: Alibaba (Tongyi Lab) · Licencia: Apache 2.0
Ojehecha
Dia TTS Estándar
Peteĩ modelo ñe'ẽjovake generación-rã heta ñe'ẽha apytépe, omoheñóihápe ñe'ẽjovake natural ñe'ẽhakuéra apytépe.
Desarrollador: Nari Labs · Licencia: Apache 2.0
Ojehecha
Parler TTS Estándar
Oñe'ẽ ñe'ẽ oipotáva rehe lenguaje natural-pe ha Parler omoheñói ñe'ẽjoaju ojojoguáva.
Desarrollador: Hugging Face · Licencia: Apache 2.0
Ojehecha
IndexTTS-2 Estándar
TTS cero-disparo rehegua oguerekóva control emocional ha expresividad ijyvatevéva.
Desarrollador: Index Team · Licencia: Bilibili Model License
Ojehecha
Spark TTS Estándar
Clonación de voz TTS emoción ha lenguaje controlable rupive, prompts rupive.
Desarrollador: SparkAudio · Licencia: CC BY-NC-SA 4.0
Ojehecha
GPT-SoVITS Estándar
Clonación ñe'ẽnguéra rehe TTS sa'i toma-pe, ombohekohápe oimeraẽ ñe'ẽ 5 segundo-guive ñehendurã.
Desarrollador: RVC-Boss · Licencia: MIT
Ojehecha
Orpheus Estándar
Modelo TTS emocional yvypóra nivel rehegua oñemoarandu 100.000 hora ñe'ẽnguéra rehe.
Desarrollador: Canopy Labs · Licencia: Llama 3.2 Community
Ojehecha
Qwen3 TTS Estándar
TTS multilingüe Alibaba mba'éva, oguerekóva ñe'ẽnguéra oñemohendapyréva ha ñe'ẽnguéra diseño ojejapóva jehaipy guive.
Desarrollador: Alibaba (Qwen) · Licencia: Apache 2.0
Ojehecha
VieNeu-TTS-v2 Estándar
Vietnam + inglés TTS código-remueve 7 ñe'ẽ oñemohendapyréva ha ñe'ẽ clonación cero-shot. CPU añónte, GPU ndoikotevẽiva'ekue.
Desarrollador: Phạm Nguyễn Ngọc Bảo · Licencia: Apache 2.0
Ojehecha
Chatterbox Turbo Estándar
Chatterbox ipya'evéva oguerekóva peteĩ latencia sa'ive 200 ms ha etiquetas paralingüísticas ñe'ẽjoaju, ñe'ẽjoaju ha ambue.
Desarrollador: Resemble AI · Licencia: MIT
Ojehecha
VoxCPM Estándar
TTS tokenizador-ỹva omoheñói peteĩ sonido 44.1kHz oguerekóva peteĩ párrafo coherente contexto-pe g̃uarã.
Desarrollador: OpenBMB · Licencia: Apache 2.0
Ojehecha
VibeVoice Estándar
TTS de forma ipukúva ha heta ñe'ẽnguéra Microsoft mba'éva omoheñói 90 minuto peve irundy ñe'ẽnguéra rupive.
Desarrollador: Microsoft · Licencia: MIT
Ojehecha
CosyVoice3 Estándar
TTS multilingüe generación oúvape bi-streaming, control de emoción ha clonación de voz cero disparo reheve.
Desarrollador: Alibaba (FunAudioLLM) · Licencia: Apache 2.0
Ojehecha
NAMAA Saudi TTS Estándar
TTS arapy saudita-pegua ypy, dialécto saudita nativo clonación ñe'ẽnguéra rehe ñeñangarekorã.
Desarrollador: NAMAA Space · Licencia: MIT
Ojehecha
Darwin TTS Estándar
Variante cross-modal Qwen3-TTS oguerekóva peso FFN ojoaju modelo de lenguaje Qwen3-1.7B rehe, ojejapóva clonación multilingüe pya'eve hag̃ua.
Desarrollador: FINAL-Bench · Licencia: Apache 2.0
Ojehecha
MOSS-TTSD Estándar
Modelo de diálogo continuado heta ñe'ẽhaguéicha: omoheñói peteĩ ñe'ẽjovake podcast-ramo, oguerekóva po ñe'ẽhaguéicha ha 60 minuto ñe'ẽjoaju coherente.
Desarrollador: OpenMOSS · Licencia: Apache 2.0
Ojehecha
CosyVoice 2
TTS escalable Alibaba rehegua, naturalidad yvypóra rehegua paridad ha latencia aimete cero.
Ñe'ẽ: en, zh, ja, ko, fr, de, it, es
Clona ñe'ẽ
IndexTTS-2
TTS cero-disparo rehegua oguerekóva control emocional ha expresividad ijyvatevéva.
Ñe'ẽ: en, zh
Clona ñe'ẽ
Spark TTS
Clonación de voz TTS emoción ha lenguaje controlable rupive, prompts rupive.
Ñe'ẽ: en, zh
Clona ñe'ẽ
GPT-SoVITS
Clonación ñe'ẽnguéra rehe TTS sa'i toma-pe, ombohekohápe oimeraẽ ñe'ẽ 5 segundo-guive ñehendurã.
Ñe'ẽ: en, zh, ja, ko
Clona ñe'ẽ
Chatterbox
Clonación de voz cero disparo rehegua moderno control emocional rupive IA Resemble rupive.
Ñe'ẽ: en
Clona ñe'ẽ
Tortoise TTS
Umi ñe'ẽjoaju ñe'ẽ'ỹmegua ñe'ẽ'ỹmegua oñemopyenda calidad-pe arquitectura autorregresiva rupive.
Ñe'ẽ: en
Clona ñe'ẽ
OpenVoice
Clonación instantánea ñe'ẽnguéra rehe, oguerekóva control granular estilo, emoción ha acento rehegua.
Ñe'ẽ: en, zh, ja, ko, fr, es
Clona ñe'ẽ
VieNeu-TTS-v2
Vietnam + inglés TTS código-remueve 7 ñe'ẽ oñemohendapyréva ha ñe'ẽ clonación cero-shot. CPU añónte, GPU ndoikotevẽiva'ekue.
Ñe'ẽ: vi, en
Clona ñe'ẽ
Chatterbox Turbo
Chatterbox ipya'evéva oguerekóva peteĩ latencia sa'ive 200 ms ha etiquetas paralingüísticas ñe'ẽjoaju, ñe'ẽjoaju ha ambue.
Ñe'ẽ: en
Clona ñe'ẽ
VoxCPM
TTS tokenizador-ỹva omoheñói peteĩ sonido 44.1kHz oguerekóva peteĩ párrafo coherente contexto-pe g̃uarã.
Ñe'ẽ: en, zh
Clona ñe'ẽ
OuteTTS
TTS oñemopyendáva LLM-pe oikohápe CPU, GPU térã navegador rupive llama.cpp ha Transformers.js rupive.
Ñe'ẽ: en
Clona ñe'ẽ
Pocket TTS
Modelo parámetro 100M ipya'éva Kyutai mba'éva, clonación de voz reheguápe peteĩ muestra añónte guive.
Ñe'ẽ: en, fr
Clona ñe'ẽ
CosyVoice3
TTS multilingüe generación oúvape bi-streaming, control de emoción ha clonación de voz cero disparo reheve.
Ñe'ẽ: en, zh, ja, ko, de, es, fr, it, ru
Clona ñe'ẽ
NAMAA Saudi TTS
TTS arapy saudita-pegua ypy, dialécto saudita nativo clonación ñe'ẽnguéra rehe ñeñangarekorã.
Ñe'ẽ: ar
Clona ñe'ẽ
Darwin TTS
Variante cross-modal Qwen3-TTS oguerekóva peso FFN ojoaju modelo de lenguaje Qwen3-1.7B rehe, ojejapóva clonación multilingüe pya'eve hag̃ua.
Ñe'ẽ: en, ko, ja, zh
Clona ñe'ẽ
MOSS-TTSD
Modelo de diálogo continuado heta ñe'ẽhaguéicha: omoheñói peteĩ ñe'ẽjovake podcast-ramo, oguerekóva po ñe'ẽhaguéicha ha 60 minuto ñe'ẽjoaju coherente.
Ñe'ẽ: en, zh
Clona ñe'ẽ
Ming-Omni TTS
Modelo de lenguaje omnimodal compacto 0.5B inclusionAI mba'éva, oguerekóva peteĩ salida 44.1kHz alta fidelidad ha peteĩ clonación de voz cero disparo rehegua.
Ñe'ẽ: en, zh
Clona ñe'ẽ
MOSS-TTS Nano
Variante michĩvéva 100M MOSS-TTS, arquitectura ojoguáva, 80x michĩvéva, latencia de capa-va'ekue.
Ñe'ẽ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Clona ñe'ẽAPI-kuéra oñemoheñói'ypyva'ekue
API REST OpenAI-pe ojokupytykuaáva. Peteĩ punto final, hetave 20 modelo. Apopyrã transmisión rehegua umi aplicación tiempo real-pe g̃uarã.
- Formato ojokupytýva OpenAI ndive
- Streaming TTS umi aplicación tiempo real-pe g̃uarã
- Procesamiento por lotes tembiapo guasuhápe g̃uarã
- Notificación webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Oñemohenda pya'e ha hesakã umi mba'e repy
Oñepyrũva'erã libremente. Oñambue tuichave jave.
Libre
15.000 caractere + 5.000/araño
- 7 modelo ha'evéva oikehápe Kokoro
- 5000 carácter peteĩ generación-pe g̃uarã
- API jeike oikehápe
Arranque
500.000 caractere/mbyte
- Opaite 20+ modelo
- 100.000 carácter peteĩ generación-pe g̃uarã
- Clonación ñe'ẽnguéra rehe
Pro
2.000.000 caractere/ha'e
- Opaite mba'e Launcher-pe
- API jeike
- Procesamiento oñemomba'eguasuvéva
Negocio
10.000.000 caractere/ha'e
- Opaite mba'e Pro-pe
- API a granel
- Cola de prioridad
Ojehecha opaichagua plano, oikehápe avei umi paquete de caracteres →
Pregunta ojejapóva py'ỹinte
Mba'épa ikatu ñambohape? Tuichave ñemoneĩ oipytyvõta ñamoambue hag̃ua umi apañuãi.
Oñepyrũ jeporu IA ñe'ẽ ko'ágã
Ojoaju umi creador, desarrollador ha empresa oipuruhápe TTS.ai.