Ledig AI Tekst til tale

22+ modeller med åpen kildekode, 100+ stemmer, 32+ språk. Ingen konto påkrevd.

0/500 tegn Ledig
Intet kredittkort 50 gratiskreditter 32+ språk Kommersiell bruk OK
0:00 / 0:00
Last ned lyd Lenke utløper om 24 timer
Som TTS.ai? Fortell vennene dine!

22+ AI- stemmemodeller

Den mest omfattende samlingen av TTS-modeller med åpen kildekode på én plattform

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Best for: High-quality TTS with minimal latency, streaming applications

Prøv ledig

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Best for: Quick previews, accessibility, and embedded applications

Prøv ledig

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Best for: General-purpose text-to-speech with natural prosody

Prøv ledig

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Best for: Produksjonsprogrammer som trenger raske, flerspråklige TTS

Prøv ledig

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Utvikler: Suno · Lisens: MIT

Prøv det

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Utvikler: Suno · Lisens: MIT

Prøv det

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Utvikler: Alibaba (Tongyi Lab) · Lisens: Apache 2.0

Prøv det

Dia TTSDia TTS Standard

Generasjonsmodell med flere høyttalere som skaper naturlige samtaler mellom høyttalere.

Utvikler: Nari Labs · Lisens: Apache 2.0

Prøv det

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Utvikler: Hugging Face · Lisens: Apache 2.0

Prøv det

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Utvikler: Index Team · Lisens: Apache 2.0

Prøv det

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Utvikler: SparkAudio · Lisens: Apache 2.0

Prøv det

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Utvikler: RVC-Boss · Lisens: MIT

Prøv det

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Utvikler: Canopy Labs · Lisens: Llama 3.2 Community

Prøv det

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Utvikler: Alibaba (Qwen) · Lisens: Apache 2.0

Prøv det

ChatterboxChatterbox Premium

Det nåværende utviklingstrinn i teknikken «null-skudds-tale kloning» med følelseskontroll fra AI-enheten som kan gjenopprettes.

Kvalitet:

Prøv det

Tortoise TTSTortoise TTS Premium

Tekst til tale med flere tale, med fokus på kvalitet med autoregressiv arkitektur.

Kvalitet:

Prøv det

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvalitet:

Prøv det

OpenVoiceOpenVoice Premium

Øyeblikkelig stemmekloning med granulert styring av stil, følelser og aksent.

Kvalitet:

Prøv det

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Språk: en, zh, ja, ko, fr, de, it, es

Klone stemme

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Språk: en, zh

Klone stemme

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Språk: en, zh

Klone stemme

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Språk: en, zh, ja, ko

Klone stemme

ChatterboxChatterbox

Det nåværende utviklingstrinn i teknikken «null-skudds-tale kloning» med følelseskontroll fra AI-enheten som kan gjenopprettes.

Språk: en

Klone stemme

Tortoise TTSTortoise TTS

Tekst til tale med flere tale, med fokus på kvalitet med autoregressiv arkitektur.

Språk: en

Klone stemme

OpenVoiceOpenVoice

Øyeblikkelig stemmekloning med granulert styring av stil, følelser og aksent.

Språk: en, zh, ja, ko, fr, de, es, it

Klone stemme

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Språk: en, zh, ja, ko, de, fr, ru, pt, es, it

Klone stemme

Utvikler- første API

OpenAI- kompatibel REST API. Ett endepunkt, 22+ modeller. Støtte for streaming av sanntidsapplikasjoner.

  • OpenAI-kompatibelt format
  • Strømmer TTS for sanntidsapper
  • Mengdevis behandling for store jobber
  • Netthook- varslingerName
Vis API- dokser
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Enkel og gjennomsiktig prissetting

Begynn fri, skaler etter hvert som du vokser.

Ledig

$0

50 kreditter

  • Kokoro, Piper, VITS, MeloTTS
  • 500 tegngrense
  • 3 gen/time (ingen konto)
Registrer deg gratis

Starter

$9/moMouse Cursor Shape

500 kreditter per måned

  • Alle 22+ modeller
  • 5000 tegngrense
  • Stemmekloning
Kom i gang
Mest populære

Pro

$29/moMouse Cursor Shape

2 000 kreditter per måned

  • Alt i starten
  • API- tilgang
  • Prioritetsbehandling
Hent Pro

Bedrift

$99/moMouse Cursor Shape

10 000 kreditter/måned

  • Alt i Pro
  • Bulk API
  • Prioritetskø
Kontaktsalg

View all plans including credit packs →

Ofte stilte spørsmål

TTS.ai er den mest omfattende AI taleplattformen, som tilbyr 22+ tekst-til-tale modeller, stemmekloning, tale-til-tekst og lyd-verktøy. Alle modeller er åpen kildekode uten innlåsing fra leverandør.

Ja! TTS.ai tilbyr gratis tekst-til-tale med Kokoro, Piper, VITS og MeloTTS modeller. Ingen konto trengs. Registrer deg for å få 50 gratis kreditter og få tilgang til alle modeller. Betalte planer begynner på $9/ måned.

For fart, bruk Kokoro eller Piper. For kvalitet, forsøk CosyVoice 2 eller StyleTTS 2. For talekloning, bruk Chatterbox eller GPT- SoVITS. For dialogvinduer, bruk Dia TTS. Prøv flere modeller på samme tekst for å sammenlikne.

Ja. OpenAI-kompatible REST API for TTS, STT, stemmekloning og lydverktøy. Tilgjengelig på Pro ($29/mo) og Enterprise ($99/mo) planer. Se dokumentasjon på tts. ai/ai /.

Stemmekvaliteten varierer etter modell. Premiummodeller som CosyVoice 2, StyleTTS 2 og Chatterbox produserer nesten menneskelig kvalitetstale med naturlig intonasjon og følelser. Gratis modeller som Kokoro tilbyr fremragende kvalitet for de fleste tilfeller.

TTS. ai støtter 30+ språk på tvers av sitt modellbibliotek. Engelsk har bredest modellstøtte, men modeller som CosyVoice 2 dekker kinesisk, japansk og koreansk; GPT-Sovits håndterer kinesisk, japansk, koreansk og engelsk; og MeloTTS støtter engelsk, spansk, fransk, kinesisk, japansk og koreansk.

Ja. All behandling skjer på våre dedikerte GPU- tjenere. Vi lagrer ikke tekst- inndata eller generert lyd etter levering. Opplastede taleprøver til kloning brukes bare til gjeldende økt og blir ikke lagret. Vi deler aldri dine data med tredjeparter eller bruker dem til å trene modeller.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai lager lyd i WAV-format som standard for maksimal kvalitet. Du kan konvertere til MP3, FLAC, OGG eller M4A med vårt frie Audio Converter-verktøy. API støtter å oppgi hvilket utdataformat du foretrekker direkte i forespørselen.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Frie modeller (Kokoro, Piper, VITS, MeloTTS) krever ingen konto og koster null kreditter. Standardmodeller (2 kredittvurderinger) inkluderer Bark, CosyVoice 2, F5- TTS og Dia. Premiummodeller (4 kredittvurderinger) inkluderer OpenVoice, Chatterbox, StyleTTS 2, og Tortoise. Betalingsmodeller tilbyr vanligvis høyere kvalitet, flere stemmer og andre funksjoner som stemmekloning.

Ja. API støtter satsvis behandling for å konvertere store volumer tekst til tale. Send inn flere forespørsler og hent resultater asynkront ved hjelp av job UUID- er. Firmaplaner ($99/mo) inkluderer prioritert køtilgang for raskere satsvis behandling. Ideelt for produksjon av lydbøker, kursinnhold og store taleoverprosjekter.
5.0/5 (1)

Start å bruke AI- stemme i dag

Bli med i utviklere, utviklere og virksomheter ved hjelp av TTS.ai