Free AI Text a veu
Models de codi obert 22+, 100+ veus, 32+ Idiomes: no cal cap compte.
Tot el que necessiteu per l'AI de veu
26 eines impulsades per 24+ models de la IA de codi obert
Models de veu 22+AI
La col·lecció més completa de models TTS de codi obert en una plataformaName
Kokoro Free
Kokoro és un model de text de 82 milions de text a veu que passa bé per sobre de la seva classe de pes. Malgrat la seva petita mida, produeix un discurs natural i expressiva. Kokoro suporta múltiples llengües, com ara anglès, japonès, xinès i coreà amb una varietat de veus expressives. S' executa increïblement ràpid per generar àudio gairebé 100x més ràpid que el temps real en una GPU.
Millor per a: TTS d' alta qualitat amb mínim de retard i aplicacions de sortida
Prova lliurePiper Free
Pipher és un lleuger motor de text a veu desenvolupat per Rhaspy que utilitza arquitectura VITS i larynx. Funciona totalment a la CPU, fent que ideal per a dispositius de vora, automulació i aplicacions de connexió fora de línia. Amb més de 100 veus a través de 30 idiomes, el conducte proporciona un discurs natural a velocitats reals, fins i tot en un Raspberry 4.
Millor per a: Vistes prèvies ràpides, accessibilitat i aplicacions incrustats
Prova lliureVITS Free
VITS (Inferència normal amb l' aprenentatge de adversaris per al final de text a veu) és un mètode paral· lela a final de TTS que genera més d' àudio natural que dos models d' avui en dia. Això adopta una variació augmentada amb fluxos de flux normalització i un procés d' entrenament adversari, aconseguint una millora significativa en la naturalització.
Millor per a: General- propòsit de text a veu amb prosdy natural
Prova lliureMeloTTS Free
MeloTTS per la meva Shell.ai és una biblioteca multilingüe que permet l' anglès (americà, britànic, australià), espanyol, francès, xinès, japonès i coreana. És extremadament ràpid, processar text en una velocitat a prop de l' hora real tot sol a la CPU. MeloTTS està dissenyat per a la producció i implementa la CPU i la GPU.
Millor per a: Les aplicacions de producció necessiten ràpid, TTS multilingüe
Prova lliureBark Standard
Model de text auudio basat en transformador que genera un discurs realista, música i efectes sonors.
Desenvolupador: Suno · Llicència: MIT
Intenta-hoBark Small Standard
Versió més lleugera de Bark amb un ús més ràpid de la inferència i menor de memòria.
Desenvolupador: Suno · Llicència: MIT
Intenta-hoCosyVoice 2 Standard
TTS escalables d'Alibaba amb naturalitat humana i retard de zero.
Desenvolupador: Alibaba (Tongyi Lab) · Llicència: Apache 2.0
Intenta-hoDia TTS Standard
Model de generació de diàlegs multiparlants que creen converses naturals entre els altaveus.
Desenvolupador: Nari Labs · Llicència: Apache 2.0
Intenta-hoParler TTS Standard
Descriu la veu que voleu en llenguatge natural i en Parler genera un discurs coincident.
Desenvolupador: Hugging Face · Llicència: Apache 2.0
Intenta-hoIndexTTS-2 Standard
TTS d'alt control d'emoció i expressitives altes.
Desenvolupador: Index Team · Llicència: Apache 2.0
Intenta-hoSpark TTS Standard
TTS de veu clonant amb emocions controlables i parlant estil via fuques.
Desenvolupador: SparkAudio · Llicència: Apache 2.0
Intenta-hoGPT-SoVITS Standard
TTS de veu simple clonant que replica qualsevol veu des de només 5 segons d'àudio.
Desenvolupador: RVC-Boss · Llicència: MIT
Intenta-hoOrpheus Standard
Model TTS emocionals de nivell humà entrenats en 100 K hores de dades de parla.
Desenvolupador: Canopy Labs · Llicència: Llama 3.2 Community
Intenta-hoQwen3 TTS Standard
TTS multilingüe de l'Alibaba amb una clonació de veu, veus preestablertes i disseny de veu des del text.
Desenvolupador: Alibaba (Qwen) · Llicència: Apache 2.0
Intenta-hoCosyVoice 2
TTS escalables d'Alibaba amb naturalitat humana i retard de zero.
Idiomes: en, zh, ja, ko, fr, de, it, es
Clona veuSpark TTS
TTS de veu clonant amb emocions controlables i parlant estil via fuques.
Idiomes: en, zh
Clona veuGPT-SoVITS
TTS de veu simple clonant que replica qualsevol veu des de només 5 segons d'àudio.
Idiomes: en, zh, ja, ko
Clona veuChatterbox
Una clonació de la veu de l'estat d'un punt de mira amb el control d'emoció de la IA.
Idiomes: en
Clona veuTortoise TTS
Conjunt de text a veu multi-vocatiu en qualitat amb arquitectura autogresiu.
Idiomes: en
Clona veuOpenVoice
Una clonació de veu instantània amb un control molt gran sobre l' estil, les emocions i l'accent.
Idiomes: en, zh, ja, ko, fr, de, es, it
Clona veuQwen3 TTS
TTS multilingüe de l'Alibaba amb una clonació de veu, veus preestablertes i disseny de veu des del text.
Idiomes: en, zh, ja, ko, de, fr, ru, pt, es, it
Clona veuDesenvolupador- estrella API
OpenAI- compatible amb l' API REST. Un punt final, 22+ models. Implementació de flux per aplicacions en temps real.
- Format compatible amb l' OpenAI
- TTS de corrent per aplicacions en temps realName
- Processat per lots per tasques grans
- Notificacions del descommatge WebName
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Pricació simple, transparent
Deixa lliure. Escala mentre creixis.
Lliure
50 crèdits
- Kokoro, Piper, VITS, MeloTTS
- Límit de 500 caràcters
- 3 gen/ hores (sense compte)
Iniciador
500 crèdits/ mesos
- Tots els models 22+
- Límit de 5.000 caràcters
- Clon de veu
Pro
2.000 crèdits/ mesos
- Tot al principi
- Accés de l' API
- Processament de prioritat
EnterpriseDescription
10.000 crèdits/ mesos
- Tot en Pro
- API de Massa
- Cua de prioritat
Preguntes més freqüents
Comença l' ús de la veu de la IA avui
Uneixre a creadors, desenvolupadors i negocis utilitzant TTS.ai