Ledig AI Tekst til tale
31+ modeller med åpen kildekode, 231+ stemmer, 34+ språk. Ingen konto påkrevd.
Alt du trenger for tale- AI
30+ verktøy som drives av AI-modeller med åpen kildekode
31+ AI- stemmemodeller
Den mest omfattende samlingen av TTS-modeller med åpen kildekode på én plattform
Kokoro Free
Kokoro er en 82 millioner parameter tekst- til- tale- modell som slår godt over vektklassen. Til tross for sin lille størrelse produserer den en utrolig naturlig og ekspressiv tale. Kokoro støtter flere språk som engelsk, japansk, kinesisk og koreansk med en rekke ekspressive stemmer. Den kjører utrolig fort – den lager lyd nesten 100x raskere enn sanntid på en GPU.
Best for: TTS av høy kvalitet med minimal latenstid og strømanvendelser
Prøv ledig
Piper Free
Piper er en lettvekts tekst- til- tale- motor utviklet av Rhasspy som bruker VITS og strupearkitekturer. Den kjører helt på CPU, noe som gjør den ideell for kantenheter, hjemmeautomatisering og programmer som krever TTS frakoblet. Med over 100 stemmer på 30+ språk sender Piper naturlig hørende tale med sanntid, selv på en Raspberry Pi 4.
Best for: Rask forhåndsvisning, tilgjengelighet og innebygde programmer
Prøv ledig
VITS Free
VITS (Variational Inference with antagonistial learning for end- to- end Text- to- Speech) er en parallell ende- til- slutt TTS- metode som genererer mer naturlig lydlyd enn gjeldende to- trinns modeller. Den bruker variasjonelle konklusjoner utvidet med normalisering av flyt og en antagonistisk treningsprosess, slik at det oppnås en betydelig forbedring i naturligheten.
Best for: Generelt tekst-til-tale med naturlig prosodi
Prøv ledig
MeloTTS Free
MeloTTS av MyShell.ai er et flerspråklig TTS-bibliotek som støtter engelsk (amerikansk, britisk, indisk, australsk), spansk, fransk, kinesisk, japansk og koreansk. Det er ekstremt raskt og behandler tekst i nær sanntid på CPU alene. MeloTTS er laget for produksjonsbruk og støtter både CPU og GPU konklusjoner.
Best for: Produksjonsprogrammer som trenger raske, flerspråklige TTS
Prøv ledig
OuteTTS Free
Outetts utvider store språkmodeller med muligheter for tekst til tale samtidig som den opprinnelige arkitekturen bevares. Den støtter flere bakgrunnsmotorer, bl. a. llama.cpp (CPU/ GPU), Hugging Face Transformers, ExLlamaV2, VLLM, og til og med nettleserinterferenser via Transformers. js. Har null-shot stemmekloning gjennom høyttalerprofiler lagret som JSON.
Best for: Kantutbygging, nettleserbasert TTS, lavressursmiljøer
Prøv ledig
Pocket TTS Free
Pocket TTS av Kyutai (kreftere av Moshi) er en kompakt 100M parameter tekst- til- tale modell som slår godt over vekta. Den kjører effektivt på CPU, støtter null- skudd- stemme kloning fra ett enkelt lydutvalg, og produserer naturlig hørende tale. Den lille modellstørrelsen gjør den ideel for kantutbygging og lav- ressursmiljøer.
Best for: Lettdreven innføring, miljøer med bare CPU, rask talekloning
Prøv ledig
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Best for: Fast lightweight TTS, edge deployment, low-latency applications
Prøv ledig
Bark Standard
Transformer-basert tekst-til-lyd-modell som genererer realistisk tale, musikk og lydeffekter.
Utvikler: Suno · Lisens: MIT
Prøv det
Bark Small Standard
Lysere versjon av Bark med raskere unøyaktighet og lavere minnebruk.
Utvikler: Suno · Lisens: MIT
Prøv det
CosyVoice 2 Standard
Alibaba skalerbare streaming TTS med menneskelig-paritet naturlighet og nær-null latency.
Utvikler: Alibaba (Tongyi Lab) · Lisens: Apache 2.0
Prøv det
Dia TTS Standard
Generasjonsmodell med flere høyttalere som skaper naturlige samtaler mellom høyttalere.
Utvikler: Nari Labs · Lisens: Apache 2.0
Prøv det
Parler TTS Standard
Beskriv stemmen du vil ha i naturlig språk, og Parler genererer tilsvarende tale.
Utvikler: Hugging Face · Lisens: Apache 2.0
Prøv det
GLM-TTS Standard
Oppnår den laveste tegnfeilraten blant TTS-modeller med åpen kildekode.
Utvikler: Zhipu AI · Lisens: GLM-4 License
Prøv det
IndexTTS-2 Standard
TTS uten skudd med finkornet følelseskontroll og høy ekspressivitet.
Utvikler: Index Team · Lisens: Bilibili Model License
Prøv det
Spark TTS Standard
Stemmekloning TTS med styrbare følelser og talestil via spørsmål.
Utvikler: SparkAudio · Lisens: CC BY-NC-SA 4.0
Prøv det
GPT-SoVITS Standard
Få skuddsstemme kloning TTS som replikerer enhver stemme fra bare 5 sekunders lyd.
Utvikler: RVC-Boss · Lisens: MIT
Prøv det
Orpheus Standard
Emosjonell TTS-modell på menneskenivå, opplært på 100 K timers taledata.
Utvikler: Canopy Labs · Lisens: Llama 3.2 Community
Prøv det
Qwen3 TTS Standard
Alibabas flerspråklige TTS med stemmekloning, forhåndsinnstilte stemmer og stemmedesign fra tekst.
Utvikler: Alibaba (Qwen) · Lisens: Apache 2.0
Prøv det
Chatterbox Turbo Standard
Raskere Chatterbox med sub-200ms latency og paralinguistiske tagger for latter, hoster, og mer.
Utvikler: Resemble AI · Lisens: MIT
Prøv det
Dia 2 Standard
Streaming-first conversational TTS med dialog med flere høyttalere og paralinguistiske referanser.
Utvikler: Nari Labs · Lisens: Apache 2.0
Prøv det
VoxCPM Standard
Tokenizer-fri TTS som produserer 44,1 kHz lyd med punktkonsistens med hensyn til kontekst.
Utvikler: OpenBMB · Lisens: Apache 2.0
Prøv det
TADA Standard
Nullhallucinasjon TTS med tekstakustisk dobbelt innstilling, 5x raskere enn sammenlignbar LLM TTS.
Utvikler: Hume AI · Lisens: MIT
Prøv det
VibeVoice Standard
Microsoft-modell for langformet flertalerinnhold som podkaster og lydbøker.
Utvikler: Microsoft · Lisens: MIT
Prøv det
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Utvikler: Alibaba (FunAudioLLM) · Lisens: Apache 2.0
Prøv det
CosyVoice 2
Alibaba skalerbare streaming TTS med menneskelig-paritet naturlighet og nær-null latency.
Språk: en, zh, ja, ko, fr, de, it, es
Klone stemme
GLM-TTS
Oppnår den laveste tegnfeilraten blant TTS-modeller med åpen kildekode.
Språk: en, zh
Klone stemme
IndexTTS-2
TTS uten skudd med finkornet følelseskontroll og høy ekspressivitet.
Språk: en, zh
Klone stemme
Spark TTS
Stemmekloning TTS med styrbare følelser og talestil via spørsmål.
Språk: en, zh
Klone stemme
GPT-SoVITS
Få skuddsstemme kloning TTS som replikerer enhver stemme fra bare 5 sekunders lyd.
Språk: en, zh, ja, ko
Klone stemme
Chatterbox
Det nåværende utviklingstrinn i teknikken «null-skudds-tale kloning» med følelseskontroll fra AI-enheten som kan gjenopprettes.
Språk: en
Klone stemme
Tortoise TTS
Tekst til tale med flere tale, med fokus på kvalitet med autoregressiv arkitektur.
Språk: en
Klone stemme
OpenVoice
Øyeblikkelig stemmekloning med granulert styring av stil, følelser og aksent.
Språk: en, zh, ja, ko, fr, de, es, it
Klone stemme
Qwen3 TTS
Alibabas flerspråklige TTS med stemmekloning, forhåndsinnstilte stemmer og stemmedesign fra tekst.
Språk: en, zh, ja, ko, de, fr, ru, pt, es, it
Klone stemme
Chatterbox Turbo
Raskere Chatterbox med sub-200ms latency og paralinguistiske tagger for latter, hoster, og mer.
Språk: en
Klone stemme
VoxCPM
Tokenizer-fri TTS som produserer 44,1 kHz lyd med punktkonsistens med hensyn til kontekst.
Språk: en, zh
Klone stemme
OuteTTS
LLM-basert TTS som kjører på CPU, GPU eller nettleser via llama.cpp og Transformers.js.
Språk: en
Klone stemme
Pocket TTS
Lettvekts-parametermodell på 100 M av Kyutai med talekloning fra én enkelt prøve.
Språk: en, fr
Klone stemme
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Språk: en, zh, ja, ko, de, es, fr, it, ru
Klone stemme
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Språk: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klone stemme
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Språk: en, zh
Klone stemmeUtvikler- første API
OpenAI- kompatibel REST API. Ett endepunkt, 22+ modeller. Støtte for streaming av sanntidsapplikasjoner.
- OpenAI-kompatibelt format
- Strømmer TTS for sanntidsapper
- Mengdevis behandling for store jobber
- Netthook- varslingerName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Enkel og gjennomsiktig prissetting
Begynn fri, skaler etter hvert som du vokser.
Ledig
15 kreditter
- Kokoro, Piper, VITS, MeloTTS
- 500 tegngrense
- 3 gen/time (ingen konto)
Starter
500 kreditter per måned
- Alle 22+ modeller
- 100.000 tegn per generasjon
- Stemmekloning
Pro
2 000 kreditter per måned
- Alt i starten
- API- tilgang
- Prioritetsbehandling
Forretning
10 000 kreditter/måned
- Alt i Pro
- Bulk API
- Prioritetskø
Ofte stilte spørsmål
Hva kan vi forbedre? din tilbakemelding hjelper oss med å løse problemer.
Start å bruke AI- stemme i dag
Bli med i utviklere, utviklere og virksomheter med TTS.ai