Free AI Text a veu
20+ Models de codi obert, 107+ veus, 32+ Idiomes: no cal cap compte.
Tot el que necessiteu per l'AI de veu
30+ eines impulsades per models de la IA de codi obert
20+ Models de veu IA
La col·lecció més completa de models TTS de codi obert en una plataformaName
Kokoro Free
Kokoro és un model de text de 82 milions de text a veu que passa bé per sobre de la seva classe de pes. Malgrat la seva petita mida, produeix un discurs natural i expressiva. Kokoro suporta múltiples llengües, com ara anglès, japonès, xinès i coreà amb una varietat de veus expressives. S' executa increïblement ràpid per generar àudio gairebé 100x més ràpid que el temps real en una GPU.
Millor per a: TTS d' alta qualitat amb mínim de retard i aplicacions de sortida
Prova lliure
Piper Free
Pipher és un lleuger motor de text a veu desenvolupat per Rhaspy que utilitza arquitectura VITS i larynx. Funciona totalment a la CPU, fent que ideal per a dispositius de vora, automulació i aplicacions de connexió fora de línia. Amb més de 100 veus a través de 30 idiomes, el conducte proporciona un discurs natural a velocitats reals, fins i tot en un Raspberry 4.
Millor per a: Vistes prèvies ràpides, accessibilitat i aplicacions incrustats
Prova lliure
VITS Free
VITS (Inferència normal amb l' aprenentatge de adversaris per al final de text a veu) és un mètode paral· lela a final de TTS que genera més d' àudio natural que dos models d' avui en dia. Això adopta una variació augmentada amb fluxos de flux normalització i un procés d' entrenament adversari, aconseguint una millora significativa en la naturalització.
Millor per a: General- propòsit de text a veu amb prosdy natural
Prova lliure
MeloTTS Free
MeloTTS per la meva Shell.ai és una biblioteca multilingüe que permet l' anglès (americà, britànic, australià), espanyol, francès, xinès, japonès i coreana. És extremadament ràpid, processar text en una velocitat a prop de l' hora real tot sol a la CPU. MeloTTS està dissenyat per a la producció i implementa la CPU i la GPU.
Millor per a: Les aplicacions de producció necessiten ràpid, TTS multilingüe
Prova lliure
Bark Standard
Model de text auudio basat en transformador que genera un discurs realista, música i efectes sonors.
Desenvolupador: Suno · Llicència: MIT
Intenta-ho
Bark Small Standard
Versió més lleugera de Bark amb un ús més ràpid de la inferència i menor de memòria.
Desenvolupador: Suno · Llicència: MIT
Intenta-ho
CosyVoice 2 Standard
TTS escalables d'Alibaba amb naturalitat humana i retard de zero.
Desenvolupador: Alibaba (Tongyi Lab) · Llicència: Apache 2.0
Intenta-ho
Dia TTS Standard
Model de generació de diàlegs multiparlants que creen converses naturals entre els altaveus.
Desenvolupador: Nari Labs · Llicència: Apache 2.0
Intenta-ho
Parler TTS Standard
Descriu la veu que voleu en llenguatge natural i en Parler genera un discurs coincident.
Desenvolupador: Hugging Face · Llicència: Apache 2.0
Intenta-ho
GLM-TTS Standard
Achieves la taxa d'errors de caràcters més baixa entre models TTS de codi obert.
Desenvolupador: Zhipu AI · Llicència: GLM-4 License
Intenta-ho
IndexTTS-2 Standard
TTS d'alt control d'emoció i expressitives altes.
Desenvolupador: Index Team · Llicència: Bilibili Model License
Intenta-ho
Spark TTS Standard
TTS de veu clonant amb emocions controlables i parlant estil via fuques.
Desenvolupador: SparkAudio · Llicència: CC BY-NC-SA 4.0
Intenta-ho
GPT-SoVITS Standard
TTS de veu simple clonant que replica qualsevol veu des de només 5 segons d'àudio.
Desenvolupador: RVC-Boss · Llicència: MIT
Intenta-ho
Orpheus Standard
Model TTS emocionals de nivell humà entrenats en 100 K hores de dades de parla.
Desenvolupador: Canopy Labs · Llicència: Llama 3.2 Community
Intenta-ho
Qwen3 TTS Standard
TTS multilingüe de l'Alibaba amb una clonació de veu, veus preestablertes i disseny de veu des del text.
Desenvolupador: Alibaba (Qwen) · Llicència: Apache 2.0
Intenta-ho
CosyVoice 2
TTS escalables d'Alibaba amb naturalitat humana i retard de zero.
Idiomes: en, zh, ja, ko, fr, de, it, es
Clona veu
GLM-TTS
Achieves la taxa d'errors de caràcters més baixa entre models TTS de codi obert.
Idiomes: en, zh
Clona veu
Spark TTS
TTS de veu clonant amb emocions controlables i parlant estil via fuques.
Idiomes: en, zh
Clona veu
GPT-SoVITS
TTS de veu simple clonant que replica qualsevol veu des de només 5 segons d'àudio.
Idiomes: en, zh, ja, ko
Clona veu
Chatterbox
Una clonació de la veu de l'estat d'un punt de mira amb el control d'emoció de la IA.
Idiomes: en
Clona veu
Tortoise TTS
Conjunt de text a veu multi-vocatiu en qualitat amb arquitectura autogresiu.
Idiomes: en
Clona veu
OpenVoice
Una clonació de veu instantània amb un control molt gran sobre l' estil, les emocions i l'accent.
Idiomes: en, zh, ja, ko, fr, de, es, it
Clona veu
Qwen3 TTS
TTS multilingüe de l'Alibaba amb una clonació de veu, veus preestablertes i disseny de veu des del text.
Idiomes: en, zh, ja, ko, de, fr, ru, pt, es, it
Clona veuDesenvolupador- estrella API
OpenAI- compatible amb l' API REST. Un punt final, 22+ models. Implementació de flux per aplicacions en temps real.
- Format compatible amb l' OpenAI
- TTS de corrent per aplicacions en temps realName
- Processat per lots per tasques grans
- Notificacions del descommatge WebName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Pricació simple, transparent
Deixa lliure. Escala mentre creixis.
Lliure
50 crèdits
- Kokoro, Piper, VITS, MeloTTS
- Límit de 500 caràcters
- 3 gen/ hores (sense compte)
Iniciador
500 crèdits/ mesos
- Tots els models 22+
- 100.000 caràcters per generació
- Clon de veu
Pro
2.000 crèdits/ mesos
- Tot al principi
- Accés de l' API
- Processament de prioritat
Negocis
10.000 crèdits/ mesos
- Tot en Pro
- API de Massa
- Cua de prioritat
Preguntes més freqüents
Comença l' ús de la veu de la IA avui
Uneixre a creadors, desenvolupadors i negocis utilitzant TTS.ai