Ledig AI Tekst til tale
20+ modeller med åpen kildekode, 107+ stemmer, 32+ språk. Ingen konto påkrevd.
Alt du trenger for tale- AI
30+ verktøy som drives av AI-modeller med åpen kildekode
20+ AI- stemmemodeller
Den mest omfattende samlingen av TTS-modeller med åpen kildekode på én plattform
Kokoro Free
Kokoro er en 82 millioner parameter tekst- til- tale- modell som slår godt over vektklassen. Til tross for sin lille størrelse produserer den en utrolig naturlig og ekspressiv tale. Kokoro støtter flere språk som engelsk, japansk, kinesisk og koreansk med en rekke ekspressive stemmer. Den kjører utrolig fort – den lager lyd nesten 100x raskere enn sanntid på en GPU.
Best for: TTS av høy kvalitet med minimal latenstid og strømanvendelser
Prøv ledig
Piper Free
Piper er en lettvekts tekst- til- tale- motor utviklet av Rhasspy som bruker VITS og strupearkitekturer. Den kjører helt på CPU, noe som gjør den ideell for kantenheter, hjemmeautomatisering og programmer som krever TTS frakoblet. Med over 100 stemmer på 30+ språk sender Piper naturlig hørende tale med sanntid, selv på en Raspberry Pi 4.
Best for: Rask forhåndsvisning, tilgjengelighet og innebygde programmer
Prøv ledig
VITS Free
VITS (Variational Inference with antagonistial learning for end- to- end Text- to- Speech) er en parallell ende- til- slutt TTS- metode som genererer mer naturlig lydlyd enn gjeldende to- trinns modeller. Den bruker variasjonelle konklusjoner utvidet med normalisering av flyt og en antagonistisk treningsprosess, slik at det oppnås en betydelig forbedring i naturligheten.
Best for: Generelt tekst-til-tale med naturlig prosodi
Prøv ledig
MeloTTS Free
MeloTTS av MyShell.ai er et flerspråklig TTS-bibliotek som støtter engelsk (amerikansk, britisk, indisk, australsk), spansk, fransk, kinesisk, japansk og koreansk. Det er ekstremt raskt og behandler tekst i nær sanntid på CPU alene. MeloTTS er laget for produksjonsbruk og støtter både CPU og GPU konklusjoner.
Best for: Produksjonsprogrammer som trenger raske, flerspråklige TTS
Prøv ledig
Bark Standard
Transformer-basert tekst-til-lyd-modell som genererer realistisk tale, musikk og lydeffekter.
Utvikler: Suno · Lisens: MIT
Prøv det
Bark Small Standard
Lysere versjon av Bark med raskere unøyaktighet og lavere minnebruk.
Utvikler: Suno · Lisens: MIT
Prøv det
CosyVoice 2 Standard
Alibaba skalerbare streaming TTS med menneskelig-paritet naturlighet og nær-null latency.
Utvikler: Alibaba (Tongyi Lab) · Lisens: Apache 2.0
Prøv det
Dia TTS Standard
Generasjonsmodell med flere høyttalere som skaper naturlige samtaler mellom høyttalere.
Utvikler: Nari Labs · Lisens: Apache 2.0
Prøv det
Parler TTS Standard
Beskriv stemmen du vil ha i naturlig språk, og Parler genererer tilsvarende tale.
Utvikler: Hugging Face · Lisens: Apache 2.0
Prøv det
GLM-TTS Standard
Oppnår den laveste tegnfeilraten blant TTS-modeller med åpen kildekode.
Utvikler: Zhipu AI · Lisens: GLM-4 License
Prøv det
IndexTTS-2 Standard
TTS uten skudd med finkornet følelseskontroll og høy ekspressivitet.
Utvikler: Index Team · Lisens: Bilibili Model License
Prøv det
Spark TTS Standard
Stemmekloning TTS med styrbare følelser og talestil via spørsmål.
Utvikler: SparkAudio · Lisens: CC BY-NC-SA 4.0
Prøv det
GPT-SoVITS Standard
Få skuddsstemme kloning TTS som replikerer enhver stemme fra bare 5 sekunders lyd.
Utvikler: RVC-Boss · Lisens: MIT
Prøv det
Orpheus Standard
Emosjonell TTS-modell på menneskenivå, opplært på 100 K timers taledata.
Utvikler: Canopy Labs · Lisens: Llama 3.2 Community
Prøv det
Qwen3 TTS Standard
Alibabas flerspråklige TTS med stemmekloning, forhåndsinnstilte stemmer og stemmedesign fra tekst.
Utvikler: Alibaba (Qwen) · Lisens: Apache 2.0
Prøv det
CosyVoice 2
Alibaba skalerbare streaming TTS med menneskelig-paritet naturlighet og nær-null latency.
Språk: en, zh, ja, ko, fr, de, it, es
Klone stemme
GLM-TTS
Oppnår den laveste tegnfeilraten blant TTS-modeller med åpen kildekode.
Språk: en, zh
Klone stemme
IndexTTS-2
TTS uten skudd med finkornet følelseskontroll og høy ekspressivitet.
Språk: en, zh
Klone stemme
Spark TTS
Stemmekloning TTS med styrbare følelser og talestil via spørsmål.
Språk: en, zh
Klone stemme
GPT-SoVITS
Få skuddsstemme kloning TTS som replikerer enhver stemme fra bare 5 sekunders lyd.
Språk: en, zh, ja, ko
Klone stemme
Chatterbox
Det nåværende utviklingstrinn i teknikken «null-skudds-tale kloning» med følelseskontroll fra AI-enheten som kan gjenopprettes.
Språk: en
Klone stemme
Tortoise TTS
Tekst til tale med flere tale, med fokus på kvalitet med autoregressiv arkitektur.
Språk: en
Klone stemme
OpenVoice
Øyeblikkelig stemmekloning med granulert styring av stil, følelser og aksent.
Språk: en, zh, ja, ko, fr, de, es, it
Klone stemme
Qwen3 TTS
Alibabas flerspråklige TTS med stemmekloning, forhåndsinnstilte stemmer og stemmedesign fra tekst.
Språk: en, zh, ja, ko, de, fr, ru, pt, es, it
Klone stemmeUtvikler- første API
OpenAI- kompatibel REST API. Ett endepunkt, 22+ modeller. Støtte for streaming av sanntidsapplikasjoner.
- OpenAI-kompatibelt format
- Strømmer TTS for sanntidsapper
- Mengdevis behandling for store jobber
- Netthook- varslingerName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Enkel og gjennomsiktig prissetting
Begynn fri, skaler etter hvert som du vokser.
Ledig
15 kreditter
- Kokoro, Piper, VITS, MeloTTS
- 500 tegngrense
- 3 gen/time (ingen konto)
Starter
500 kreditter per måned
- Alle 22+ modeller
- 100,000 chars per generation
- Stemmekloning
Pro
2 000 kreditter per måned
- Alt i starten
- API- tilgang
- Prioritetsbehandling
Forretning
10 000 kreditter/måned
- Alt i Pro
- Bulk API
- Prioritetskø
Ofte stilte spørsmål
Start å bruke AI- stemme i dag
Bli med i utviklere, utviklere og virksomheter med TTS.ai