IA-kuéra ha'evéva Ñe'ẽnguéra.:

33+ modelo de código abierto, 279+ ñe'ẽnguéra 39+ Ñe'ẽnguéra. Ndojeporui peteĩ cuenta.

20K+
creador
81K+
generación
33+
Modelo IA
279+
ñe'ẽ
Ehayhuetéva TTS.ai? He'i umi iñangirũpe!

Opaite mba'e tekotevẽva IA ñe'ẽrã

30+ herramienta oñemopyendáva modelo IA fuente-abierto rehe

33+ Modelo ñe'ẽ IA

Umi modelo TTS fuente abierto rehegua colección tuichavéva peteĩ plataforma-pe.

KokoroKokoro Libre

Kokoro hína peteĩ modelo texto-gui-ñe'ẽ-pe g̃uarã oguerekóva 82 millón parámetro, ha'éva tuichaiterei mba'e ijyvatevéva clase de peso-gui. Jepéramo michĩeterei, ome'ẽ ñe'ẽnguéra peteĩteĩ natural ha expresiva. Kokoro oykeko heta ñe'ẽnguérape, oikehápe inglés, japonés, chino ha coreano heta ñe'ẽnguéra expresiva-kuéra. Ojeporu pya'eterei, omoheñói ñe'ẽnguéra 100-guive pya'eve peteĩ GPU tiempo real-pe.

Oñeikotevẽ: TTS calidad ijyvatevéva, latencia michĩvéva, aplicación-kuéra transmisión rehegua

Ojehecha'ỹre

PiperPiper Libre

Piper hína peteĩ motor de texto-gui-ñe'ẽ-pe pyahu, omoheñóiva Rhasspy oiporúvo VITS ha larynx arquitectura. Ojeporuporã CPU-pe, ha upéva ombohekoporãve umi dispositivo periférico-pe, automatización hogapypegua ha aplicación oikotevẽva TTS fuera de línea. Oguerekóvo hetave 100 ñe'ẽ 30 ñe'ẽgui, Piper ome'ẽ ñe'ẽ ñeikumby natural tiempo real-pe, avei Raspberry Pi 4-pe.

Oñeikotevẽ: Previsualización pya'evéva, jeike pya'e ha aplicación-kuéra incrustada

Ojehecha'ỹre

VITSVITS Libre

VITS (inferencia variacional aprendizaje adversario rupive ñe'ẽ'aravo ñe'ẽ'aravo ñe'ẽ'aravo-gui ñe'ẽ'aravo-pe g̃uarã) ha'e peteĩ método TTS paralelo, oguerekóva peteĩ ñe'ẽ'aravo natural umi modelo ko'agãgua mokõi etapa-guive, oipuru inferencia variacional oñembohetavehápe flujo normalización ha peteĩ proceso de aprendizaje adversario, ha upéicha ojehupyty peteĩ naturalidad oñemoporãvehápe.

Oñeikotevẽ: Ñe'ẽjoaju ñe'ẽ'ỹmegua propósito general-pe g̃uarã prosodi natural reheve.

Ojehecha'ỹre

MeloTTSMeloTTS Libre

MeloTTS MyShell.ai mba'éva hína peteĩ biblioteca TTS multilenguaje rehegua oykekóva inglés (americano, británico, indio, australiano), español, francés, chino, japonés ha coreano. Ipya'eeterei, omboheko umi jehaipy pya'eterei rupi CPU añónte. MeloTTS oñemohenda ojeporu hag̃ua producción-pe ha oykeko CPU ha GPU inferencia.

Oñeikotevẽ: Aplicaciones de producción oikotevẽva TTS ipya'e ha multilingüe

Ojehecha'ỹre

Kani TTS 2Kani TTS 2 Libre

Kani-TTS-2 NineNineSix mba'éva hína peteĩ modelo ultraligero 400M parámetro-kuéra rehegua oñemopu'ãva peteĩ backbone LFM2 AI líquido-pe NVIDIA NanoCodec ndive. Ojeporu 3GB VRAM añónte ha ome'ẽ ~10 segundo ñe'ẽnguéra ~2 segundo aja peteĩ A100 (RTF 0.2)-pe. Ko'agãgua versión pública ome'ẽ peteĩ punto de control `kani-tts-2-en` inglés-pe añónte ha ndoguerekói pe gancho de incrustación oñeikotevẽva ñe'ẽnguéra clonación-pe g̃uarã — ojeporu Chatterbox / IndexTTS2 / F5-TTS clonación-pe g̃uarã, térã Kokoro / MeloTTS ndaha'éiva inglés-pe g̃uarã.

Oñeikotevẽ: Generación inglesa pya'evéva hardware VRAM sa'ivévape, tapykueve jehecha pya'evéva

Ojehecha'ỹre

OuteTTSOuteTTS Libre

OuteTTS ombotuichave umi lenguaje modelo tuichavéva oguerekóva capacidad ñe'ẽ'apo-gui ñe'ẽ'apo-pe g̃uarã, ha upéicha avei oñangareko arquitectura ypy rehe. Oipytyvõ heta backend-pe, oikehápe llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ha avei inferencia navegador rupive Transformers.js rupive. Oguerekóva clonación ñe'ẽ'apo rehegua cero disparo rupive umi perfil ñe'ẽ'apohára rehegua oñeñongatuhápe JSON-ramo.

Oñeikotevẽ: Despliegue Edge, TTS oñemopyendáva navegador-pe, entorno sa'i recurso oguerekóva

Ojehecha'ỹre

Pocket TTSPocket TTS Libre

Pocket TTS Kyutai mba'éva (Moshi omoheñói va'ekue) ha'e peteĩ modelo compacto texto-gui ñe'ẽngue-pe g̃uarã oguerekóva 100M parámetro, imbaretevéva ipukuvévagui. Oñemongu'e porã CPU-pe, oykeko ñe'ẽ clonación cero tiro rehegua peteĩ muestra de sonido añónte guive ha omoheñói ñe'ẽngue oguerekóva sonido natural. Modelo michĩva ojapo ichugui peteĩ modelo ideal umi entorno de despliegue extremo ha sa'i recurso oguerekóvape g̃uarã.

Oñeikotevẽ: Despliegue ipya'éva, entorno CPU añónte, clonación ñe'ẽmby pya'éva

Ojehecha'ỹre

Kitten TTSKitten TTS Libre

Kitten TTS KittenML mba'éva hína peteĩ modelo texto-gui-ñe'ẽ-pe g̃uarã ipya'evéva, oñemopyendáva ONNX-pe. Oguerekóva variante 15M guive 80M peve (25-80 MB disco-pe), ome'ẽ ñe'ẽ ñeikumby porã CPU-pe oikotevẽ'ỹre peteĩ GPU. Oguerekóva 8 ñe'ẽ oñemohendáva, ñe'ẽ ñeikumby pya'e oñemoambuéva ha ñe'ẽ ñeikumby preprocesamiento oñemohendáva papapykuéra, moneda ha unidad-kuéra. Iñambueporã umi aplicación desplegable ha de baja latencia-pe g̃uarã.

Oñeikotevẽ: TTS ipya'e ha pya'e, implementación de borde, aplicación de baja latencia

Ojehecha'ỹre

Ming-Omni TTSMing-Omni TTS Libre

Ming-omni-tts-0.5B inclusionAI mba'éva hína peteĩ modelo de discurso omnimodal compacto oñemopyendáva BailingMM columna vertebral densa-pe, oguerekóva peteĩ descodificador de sonido ojokupytýva flujo rehe parche-pa-parche rupive. Oikuave'ẽ peteĩ salida 44.1kHz (CD calidad ykére), oykeko ñe'ẽ clonación cero disparo rehegua peteĩ referencia 3+ segundo rehegua, ha oike emoción/dialecto/BGM control integrado umi instrucción JSON rupive. Estabilidad mbarete - 0.83% WER umi referencia chino-pe.

Oñeikotevẽ: High-fidelity bilingual narration, emotion-controlled voice acting, Chinese audiobook content

Ojehecha'ỹre

MOSS-TTS NanoMOSS-TTS Nano Libre

MOSS-TTS-Nano-100M hína peteĩ variante 100M-parámetro-pegua OpenMOSS-pegua, MOSS-TTS familia-pegua, ombojoajuhápe arquitectura de transformador de retraso. Oñemoambue modelo 8B calidad ypy rehe peso michĩvévape ~80 ha VRAM michĩvévape peteĩ ñeikotevẽ rupive, ha upéva ojapose hag̃ua ikatu hína despliegue de nivel libre ha alto rendimiento.

Oñeikotevẽ: TTS nivel-va'ekue, producción tuichavéva, jeporu interactivo sa'ivéva latencia-gui.

Ojehecha'ỹre

BarkBark Estándar

Peteĩ modelo texto-gui-ñe'ẽ-pe oñemopyendáva transformador-pe omoheñóihápe ñe'ẽ, purahéi ha efecto sonoro realista.

Desarrollador: Suno · Licencia: MIT

Ojehecha

Bark SmallBark Small Estándar

Peteĩ versión ipya'evéva Bark-gui, inferencia pya'eve ha memoria jeiporu sa'ive.

Desarrollador: Suno · Licencia: MIT

Ojehecha

CosyVoice 2CosyVoice 2 Estándar

TTS escalable Alibaba rehegua, naturalidad yvypóra rehegua paridad ha latencia aimete cero.

Desarrollador: Alibaba (Tongyi Lab) · Licencia: Apache 2.0

Ojehecha

Dia TTSDia TTS Estándar

Peteĩ modelo ñe'ẽjovake generación-rã heta ñe'ẽha apytépe, omoheñóihápe ñe'ẽjovake natural ñe'ẽhakuéra apytépe.

Desarrollador: Nari Labs · Licencia: Apache 2.0

Ojehecha

Parler TTSParler TTS Estándar

Oñe'ẽ ñe'ẽ oipotáva rehe lenguaje natural-pe ha Parler omoheñói ñe'ẽjoaju ojojoguáva.

Desarrollador: Hugging Face · Licencia: Apache 2.0

Ojehecha

IndexTTS-2IndexTTS-2 Estándar

TTS cero-disparo rehegua oguerekóva control emocional ha expresividad ijyvatevéva.

Desarrollador: Index Team · Licencia: Bilibili Model License

Ojehecha

Spark TTSSpark TTS Estándar

Clonación de voz TTS emoción ha lenguaje controlable rupive, prompts rupive.

Desarrollador: SparkAudio · Licencia: CC BY-NC-SA 4.0

Ojehecha

GPT-SoVITSGPT-SoVITS Estándar

Clonación ñe'ẽnguéra rehe TTS sa'i toma-pe, ombohekohápe oimeraẽ ñe'ẽ 5 segundo-guive ñehendurã.

Desarrollador: RVC-Boss · Licencia: MIT

Ojehecha

OrpheusOrpheus Estándar

Modelo TTS emocional yvypóra nivel rehegua oñemoarandu 100.000 hora ñe'ẽnguéra rehe.

Desarrollador: Canopy Labs · Licencia: Llama 3.2 Community

Ojehecha

Qwen3 TTSQwen3 TTS Estándar

TTS multilingüe Alibaba mba'éva, oguerekóva ñe'ẽnguéra oñemohendapyréva ha ñe'ẽnguéra diseño ojejapóva jehaipy guive.

Desarrollador: Alibaba (Qwen) · Licencia: Apache 2.0

Ojehecha

VieNeu-TTS-v2VieNeu-TTS-v2 Estándar

Vietnam + inglés TTS código-remueve 7 ñe'ẽ oñemohendapyréva ha ñe'ẽ clonación cero-shot. CPU añónte, GPU ndoikotevẽiva'ekue.

Desarrollador: Phạm Nguyễn Ngọc Bảo · Licencia: Apache 2.0

Ojehecha

Chatterbox TurboChatterbox Turbo Estándar

Chatterbox ipya'evéva oguerekóva peteĩ latencia sa'ive 200 ms ha etiquetas paralingüísticas ñe'ẽjoaju, ñe'ẽjoaju ha ambue.

Desarrollador: Resemble AI · Licencia: MIT

Ojehecha

VoxCPMVoxCPM Estándar

TTS tokenizador-ỹva omoheñói peteĩ sonido 44.1kHz oguerekóva peteĩ párrafo coherente contexto-pe g̃uarã.

Desarrollador: OpenBMB · Licencia: Apache 2.0

Ojehecha

VibeVoiceVibeVoice Estándar

TTS de forma ipukúva ha heta ñe'ẽnguéra Microsoft mba'éva omoheñói 90 minuto peve irundy ñe'ẽnguéra rupive.

Desarrollador: Microsoft · Licencia: MIT

Ojehecha

CosyVoice3CosyVoice3 Estándar

TTS multilingüe generación oúvape bi-streaming, control de emoción ha clonación de voz cero disparo reheve.

Desarrollador: Alibaba (FunAudioLLM) · Licencia: Apache 2.0

Ojehecha

NAMAA Saudi TTSNAMAA Saudi TTS Estándar

TTS arapy saudita-pegua ypy, dialécto saudita nativo clonación ñe'ẽnguéra rehe ñeñangarekorã.

Desarrollador: NAMAA Space · Licencia: MIT

Ojehecha

Darwin TTSDarwin TTS Estándar

Variante cross-modal Qwen3-TTS oguerekóva peso FFN ojoaju modelo de lenguaje Qwen3-1.7B rehe, ojejapóva clonación multilingüe pya'eve hag̃ua.

Desarrollador: FINAL-Bench · Licencia: Apache 2.0

Ojehecha

MOSS-TTSDMOSS-TTSD Estándar

Modelo de diálogo continuado heta ñe'ẽhaguéicha: omoheñói peteĩ ñe'ẽjovake podcast-ramo, oguerekóva po ñe'ẽhaguéicha ha 60 minuto ñe'ẽjoaju coherente.

Desarrollador: OpenMOSS · Licencia: Apache 2.0

Ojehecha

ChatterboxChatterbox Premium

Clonación de voz cero disparo rehegua moderno control emocional rupive IA Resemble rupive.

Calidad:

Ojehecha

Tortoise TTSTortoise TTS Premium

Umi ñe'ẽjoaju ñe'ẽ'ỹmegua ñe'ẽ'ỹmegua oñemopyenda calidad-pe arquitectura autorregresiva rupive.

Calidad:

Ojehecha

StyleTTS 2StyleTTS 2 Premium

Ñe'ẽnguéra ñemoambue ñe'ẽnguéra rehe ñembohasa ha ñembokatupyry rupive.

Calidad:

Ojehecha

OpenVoiceOpenVoice Premium

Clonación instantánea ñe'ẽnguéra rehe, oguerekóva control granular estilo, emoción ha acento rehegua.

Calidad:

Ojehecha

Sesame CSMSesame CSM Premium

Peteĩ modelo ñe'ẽñe'ẽ rehegua omoheñóiva peteĩ ñe'ẽjovake natural tiempo ha emoción oguerekóva.

Calidad:

Ojehecha

CosyVoice 2CosyVoice 2

TTS escalable Alibaba rehegua, naturalidad yvypóra rehegua paridad ha latencia aimete cero.

Ñe'ẽ: en, zh, ja, ko, fr, de, it, es

Clona ñe'ẽ

IndexTTS-2IndexTTS-2

TTS cero-disparo rehegua oguerekóva control emocional ha expresividad ijyvatevéva.

Ñe'ẽ: en, zh

Clona ñe'ẽ

Spark TTSSpark TTS

Clonación de voz TTS emoción ha lenguaje controlable rupive, prompts rupive.

Ñe'ẽ: en, zh

Clona ñe'ẽ

GPT-SoVITSGPT-SoVITS

Clonación ñe'ẽnguéra rehe TTS sa'i toma-pe, ombohekohápe oimeraẽ ñe'ẽ 5 segundo-guive ñehendurã.

Ñe'ẽ: en, zh, ja, ko

Clona ñe'ẽ

ChatterboxChatterbox

Clonación de voz cero disparo rehegua moderno control emocional rupive IA Resemble rupive.

Ñe'ẽ: en

Clona ñe'ẽ

Tortoise TTSTortoise TTS

Umi ñe'ẽjoaju ñe'ẽ'ỹmegua ñe'ẽ'ỹmegua oñemopyenda calidad-pe arquitectura autorregresiva rupive.

Ñe'ẽ: en

Clona ñe'ẽ

OpenVoiceOpenVoice

Clonación instantánea ñe'ẽnguéra rehe, oguerekóva control granular estilo, emoción ha acento rehegua.

Ñe'ẽ: en, zh, ja, ko, fr, es

Clona ñe'ẽ

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnam + inglés TTS código-remueve 7 ñe'ẽ oñemohendapyréva ha ñe'ẽ clonación cero-shot. CPU añónte, GPU ndoikotevẽiva'ekue.

Ñe'ẽ: vi, en

Clona ñe'ẽ

Chatterbox TurboChatterbox Turbo

Chatterbox ipya'evéva oguerekóva peteĩ latencia sa'ive 200 ms ha etiquetas paralingüísticas ñe'ẽjoaju, ñe'ẽjoaju ha ambue.

Ñe'ẽ: en

Clona ñe'ẽ

VoxCPMVoxCPM

TTS tokenizador-ỹva omoheñói peteĩ sonido 44.1kHz oguerekóva peteĩ párrafo coherente contexto-pe g̃uarã.

Ñe'ẽ: en, zh

Clona ñe'ẽ

OuteTTSOuteTTS

TTS oñemopyendáva LLM-pe oikohápe CPU, GPU térã navegador rupive llama.cpp ha Transformers.js rupive.

Ñe'ẽ: en

Clona ñe'ẽ

Pocket TTSPocket TTS

Modelo parámetro 100M ipya'éva Kyutai mba'éva, clonación de voz reheguápe peteĩ muestra añónte guive.

Ñe'ẽ: en, fr

Clona ñe'ẽ

CosyVoice3CosyVoice3

TTS multilingüe generación oúvape bi-streaming, control de emoción ha clonación de voz cero disparo reheve.

Ñe'ẽ: en, zh, ja, ko, de, es, fr, it, ru

Clona ñe'ẽ

NAMAA Saudi TTSNAMAA Saudi TTS

TTS arapy saudita-pegua ypy, dialécto saudita nativo clonación ñe'ẽnguéra rehe ñeñangarekorã.

Ñe'ẽ: ar

Clona ñe'ẽ

Darwin TTSDarwin TTS

Variante cross-modal Qwen3-TTS oguerekóva peso FFN ojoaju modelo de lenguaje Qwen3-1.7B rehe, ojejapóva clonación multilingüe pya'eve hag̃ua.

Ñe'ẽ: en, ko, ja, zh

Clona ñe'ẽ

MOSS-TTSDMOSS-TTSD

Modelo de diálogo continuado heta ñe'ẽhaguéicha: omoheñói peteĩ ñe'ẽjovake podcast-ramo, oguerekóva po ñe'ẽhaguéicha ha 60 minuto ñe'ẽjoaju coherente.

Ñe'ẽ: en, zh

Clona ñe'ẽ

Ming-Omni TTSMing-Omni TTS

Modelo de lenguaje omnimodal compacto 0.5B inclusionAI mba'éva, oguerekóva peteĩ salida 44.1kHz alta fidelidad ha peteĩ clonación de voz cero disparo rehegua.

Ñe'ẽ: en, zh

Clona ñe'ẽ

MOSS-TTS NanoMOSS-TTS Nano

Variante michĩvéva 100M MOSS-TTS, arquitectura ojoguáva, 80x michĩvéva, latencia de capa-va'ekue.

Ñe'ẽ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Clona ñe'ẽ

API-kuéra oñemoheñói'ypyva'ekue

API REST OpenAI-pe ojokupytykuaáva. Peteĩ punto final, hetave 20 modelo. Apopyrã transmisión rehegua umi aplicación tiempo real-pe g̃uarã.

  • Formato ojokupytýva OpenAI ndive
  • Streaming TTS umi aplicación tiempo real-pe g̃uarã
  • Procesamiento por lotes tembiapo guasuhápe g̃uarã
  • Notificación webhook
Ojehecha API documento
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Oñemohenda pya'e ha hesakã umi mba'e repy

Oñepyrũva'erã libremente. Oñambue tuichave jave.

Libre

$0

15.000 caractere + 5.000/araño

  • 7 modelo ha'evéva oikehápe Kokoro
  • 5000 carácter peteĩ generación-pe g̃uarã
  • API jeike oikehápe
Oñemoinge'ỹre

Arranque

$9/ms

500.000 caractere/mbyte

  • Opaite 20+ modelo
  • 100.000 carácter peteĩ generación-pe g̃uarã
  • Clonación ñe'ẽnguéra rehe
Oñepyrũ
Ojehecharamovéva

Pro

$29/ms

2.000.000 caractere/ha'e

  • Opaite mba'e Launcher-pe
  • API jeike
  • Procesamiento oñemomba'eguasuvéva
Oñeme'ẽ profesional

Negocio

$99/ms

10.000.000 caractere/ha'e

  • Opaite mba'e Pro-pe
  • API a granel
  • Cola de prioridad
Oñeme'ẽ tembiapo

Ojehecha opaichagua plano, oikehápe avei umi paquete de caracteres →

Pregunta ojejapóva py'ỹinte

TTS.ai hína IA ñe'ẽ rehegua plataforma tuichavéva, ome'ẽva hetave 20 modelo ñe'ẽ-teépe g̃uarã, ñe'ẽ clonación, ñe'ẽ ñe'ẽ-teépe g̃uarã ha ñe'ẽnguéra ñeikumbyrã.

Añetehápe! TTS.ai ome'ẽ ñe'ẽ ñeikumby'ỹva ñe'ẽ'ỹme Kokoro, Piper, VITS ha MeloTTS modelo-kuéra ndive. Ndaipóri peteĩ cuenta oñeikotevẽva. Oñemoinge ojejuhu hag̃ua 15.000 carácter'ỹva ha ojeike hag̃ua opaite modelo-pe. Umi plan ojejapyhyva oñepyrũ $9/ha'e rupi peteĩ arapokõindy.

Oñeha'ã hag̃ua pya'eve, ojeporu Kokoro térã Piper. Oñeha'ã hag̃ua porãve, ojeporu CosyVoice 2 térã StyleTTS 2. Oñeha'ã hag̃ua ñe'ẽ clonación, ojeporu Chatterbox térã GPT-SoVITS. Ñe'ẽjovake, ojeporu Dia TTS. Oñeha'ã hag̃ua heta modelo peteĩ ñe'ẽjoaju rehe oñembojoja hag̃ua.

Aye. API REST OpenAI-pe ojokupytykuaáva TTS, STT, clonación ñe'ẽ rehegua ha ñe'ẽnguéra ñehendurã. Oike opaichagua plan-pe, oikehápe avei libre, oguerekóva límite de velocidad oñemoambuéva nivel rupive (Livre: 10 req/min, Lite: 20, Starter: 30, Pro: 60, Negocio: 300). Ehecha marandu tts.ai/api/-pe.

Ñe'ẽreko rehegua calidad iñambue modelo rupive; umi modelo premium taha'e CosyVoice 2, StyleTTS 2 ha Chatterbox ome'ẽ ñe'ẽreko yvypóra ñe'ẽreko rehegua calidad, entonación ha emoción natural reheve; umi modelo gratuito taha'e Kokoro ome'ẽ ñe'ẽreko rehegua calidad iporãva hetave umi jeporurã.

TTS.ai oykeko hetave 35 ñe'ẽ biblioteca modelo-pe. Inglés oguereko modelo tuichavéva, katu umi modelo CosyVoice 2-icha oguereko chino, japonés ha coreano; GPT-SoVITS omoakã chino, japonés, coreano ha inglés; ha MeloTTS oykeko inglés, español, francés, chino, japonés ha coreano.

Aye. Opaite proceso oiko umi servidor GPU-pe. Nañaingemo'ãi ñe'ẽnguéra omoĩva térã ñe'ẽnguéra oñemoheñóiva oñeguenohẽ rire. Umi ñe'ẽnguéra ojejapyhy clonación-rã ojeporu hína ko'agãgua sesión-pe añónte ha nañemo'ãi. Ndaha'éi jaikuaauka umi dato-kuéra ambue tapichape g̃uarã térã jaiporu oñemoarandu hag̃ua modelo-kuérape.

Yep. Opaite umi sonido oñemoheñóiva TTS.ai-pe ikatu ojeiporu ñemurã, oikehápe video YouTube, podcast, audiolibro, aplicación, anuncio ha producto. Jaikuaaukaháicha, ñane modelo hína código abierto licencia permisiva poguýpe (MIT, Apache 2.0). Nahániri oñeikotevẽ royalty térã atribución.

TTS.ai omoheñói ñehendurã formato WAV-pe por defecto, ojeguerekóvo calidad tuichavéva. Ikatu oñemoambue MP3, FLAC, OGG térã M4A-pe jaiporukuévo ñane ñehendurã conversor. Ko API oykeko ojehechauka hag̃ua ñehendurã formato ojehecharamovéva ñeikotevẽpe.

Oñeme'ẽ peteĩ muestra de sonido mbykymi (5 segundo sa'ive) ñe'ẽ ojehaise hag̃ua clonación-rã, upéi ohai oimeraẽ ñe'ẽ omoheñói hag̃ua ñe'ẽ. Umi modelo taha'e Chatterbox, GPT-SoVITS ha CosyVoice 2 oykeko ñe'ẽ clonación. Ñe'ẽ clonada ojapyhy tono, acento ha ñe'ẽreko estilo.

Umi modelo libre (Kokoro, Piper, VITS, MeloTTS) ndoikotevẽi peteĩ cuenta ha ndoguerekói mba'eveichagua caractere. Umi modelo estándar (2000 caractere/1K input) apytépe oĩ Bark, CosyVoice 2, F5-TTS ha Dia. Umi modelo premium (4000 caractere/1K input) apytépe oĩ OpenVoice, Chatterbox, StyleTTS 2 ha Tortoise. Umi modelo ojejapyhyva'ekue katuínte ome'ẽ calidad ijyvatevéva, hetave ñe'ẽ ha característica pyahu, taha'e ñe'ẽ clonación.

Aye. API oykeko proceso por lotes ñemoambue hag̃ua heta ñe'ẽ ñe'ẽ'ỹme. Oñemongu'e heta ñeporandu ha ojejuhu umi ojehupytýva asincrónicamente oipurukuévo UUID tembiapo rehegua. Plan de negocio ($99/me'ẽ) ha hetave oĩhápe acceso prioritario cola-pe g̃uarã proceso por lotes pya'eve hag̃ua. Iñambueporã audiolibro apopyrã, tekombo'e rehegua contenido ha ñe'ẽnguéra tuichaháicha ñehendurã.
4.1/5 (48)

Mba'épa ikatu ñambohape? Tuichave ñemoneĩ oipytyvõta ñamoambue hag̃ua umi apañuãi.

Oñepyrũ jeporu IA ñe'ẽ ko'ágã

Ojoaju umi creador, desarrollador ha empresa oipuruhápe TTS.ai.