Tasuta tehisintellekt Tekst kõnele

22+ avatud lähtekoodiga mudelid, 100+ hääled, 32+ keeli. Kontot ei ole vaja.

0/500 märgid Vaba
Krediitkaarti pole 50 tasuta krediiti 32+ keeli Kaubanduslik kasutamine OK
0:00 / 0:00
Download Audio Link aegub 24 tunni pärast.
Nagu TTS.ai?

22+ AI häälemudelid

Kõige ulatuslikum avatud lähtekoodiga TTS-mudelite kogu ühes platvormis

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Parim: High-quality TTS with minimal latency, streaming applications

Proovi tasuta

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Parim: Quick previews, accessibility, and embedded applications

Proovi tasuta

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Parim: General-purpose text-to-speech with natural prosody

Proovi tasuta

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Parim: Tootmisrakendused, mis vajavad kiiret mitmekeelset TTS-d

Proovi tasuta

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Arendaja: Suno · Litsents: MIT

Proovi seda.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Arendaja: Suno · Litsents: MIT

Proovi seda.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Arendaja: Alibaba (Tongyi Lab) · Litsents: Apache 2.0

Proovi seda.

Dia TTSDia TTS Standard

Mitme kõlariga dialoogi genereerimise mudel, mis loob kõnelejate vahel loomuliku vestluse.

Arendaja: Nari Labs · Litsents: Apache 2.0

Proovi seda.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Arendaja: Hugging Face · Litsents: Apache 2.0

Proovi seda.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Arendaja: Index Team · Litsents: Apache 2.0

Proovi seda.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Arendaja: SparkAudio · Litsents: Apache 2.0

Proovi seda.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Arendaja: RVC-Boss · Litsents: MIT

Proovi seda.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Arendaja: Canopy Labs · Litsents: Llama 3.2 Community

Proovi seda.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Arendaja: Alibaba (Qwen) · Litsents: Apache 2.0

Proovi seda.

ChatterboxChatterbox Premium

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Kvaliteet:

Proovi seda.

Tortoise TTSTortoise TTS Premium

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Kvaliteet:

Proovi seda.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvaliteet:

Proovi seda.

OpenVoiceOpenVoice Premium

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Kvaliteet:

Proovi seda.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Keeled: en, zh, ja, ko, fr, de, it, es

Klooni hääl

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Keeled: en, zh

Klooni hääl

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Keeled: en, zh

Klooni hääl

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Keeled: en, zh, ja, ko

Klooni hääl

ChatterboxChatterbox

"State-of-the-art null-shot hääl kloonimine emotsioonide kontrolli Remonte AI.

Keeled: en

Klooni hääl

Tortoise TTSTortoise TTS

Mitme häälega teksti kõne-kõne keskendus kvaliteedi autoregressiivne arhitektuur.

Keeled: en

Klooni hääl

OpenVoiceOpenVoice

Kiire hääl kloonimine granuleeritud kontrolli stiil, emotsioonid, ja aktsent.

Keeled: en, zh, ja, ko, fr, de, es, it

Klooni hääl

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Keeled: en, zh, ja, ko, de, fr, ru, pt, es, it

Klooni hääl

Arendaja- esimene API

OpenAI ühilduv REST API. Üks tulemusnäitaja, 22+ mudelid. Streaming toetust reaalajas rakendusi.

  • OpenAI- ga ühilduv vorming
  • Trimmimine TTS reaalajas rakendused
  • Partii töötlemine suurte tööde jaoks
  • Veebikonksu teated
API dokkide vaatamine
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Lihtne ja läbipaistev hinnakujundus

Alusta tasuta, skaleeri kasvades.

Vaba

$0

50 krediiti

  • Kokoro, Piper, VITS, MeloTTS
  • 500 tähemärgi piirang
  • 3 g/h (kontot ei ole)
Registreeru tasuta

Starter

$9/munit description in lists

500 krediiti kuus

  • Kõik 22+ mudelit
  • 5000 tähemärgi piir
  • Hääle kloonimine
Alusta
Kõige populaarsem

Pro

$29/munit description in lists

2000 krediiti kuus

  • Kõik Starter'is
  • API-juurdepääs
  • Prioriteetne töötlemine
Hangi proff

Ettevõtlus

$99/munit description in lists

10 000 krediiti kuus

  • Kõik on Pro's
  • Pulk API
  • Prioriteetne järjekord
Kontaktid Müük

View all plans including credit packs →

Korduma kippuvad küsimused

TTS.ai on kõige terviklikum AI häälplatvorm, mis pakub 22+ tekstist kõneni mudeleid, kõne kloonimist, kõnest tekstini ja audiovahendeid. Kõik mudelid on avatud lähtekoodiga ilma müüjata.

Jah! TTS.ai pakub tasuta teksti kõneks Kokoro, Piper, VITS ja MeloTTS mudelid. Ei ole vaja. Registreeru, et saada 50 tasuta krediiti ja juurdepääsu kõigile mudelitele. Tasulised plaanid algavad $9/kuus.

Kiiruse saamiseks kasutage Kokorot või Piperit. Kvaliteetseks proovige CosyVoice 2 või StyleTTS 2. Hääle kloonimiseks kasutage Chatterboxi või GPT- Sovits'i. Dialoogi jaoks kasutage Dia TTS- d. Võrrelda tuleb mitut mudelit samas tekstis.

Jah. OpenAI-ühilduv REST API TTS, STT, hääl kloonimine, ja audio tööriistad. Saadaval Pro ($29/mo) ja Enterprise ($99/mo) plaanid. Vaata dokumente tts.ai/api /.

Hääle kvaliteet varieerub mudeli järgi. Premium mudelid nagu CosyVoice 2, StyleTTS 2 ja Chatterbox toota inimeselähedane kvaliteet kõne loomulik intonatsioon ja emotsioonid. Tasuta mudelid nagu Kokoro pakkuda suurepärast kvaliteeti enamikul juhtudel.

TTS.ai toetab 30+ keelt oma mudeliraamatukogus. Inglise keelel on kõige laiem mudeli toetus, kuid sellised mudelid nagu CosyVoice 2 hõlmavad hiina, jaapani ja korea keelt; GPT-SoviTS tegeleb hiina, jaapani, korea ja inglise keelega ning MeloTTS toetab inglise, hispaania, prantsuse, hiina, jaapani ja korea keelt.

Jah. Kogu töötlemine toimub meie spetsiaalsetes GPU serverites. Me ei salvesta sinu tekstisisendit või genereeritud audiot pärast kohaletoimetamist. Üleslaaditud helinäidiseid kloonimiseks kasutatakse ainult aktiivse seansi jaoks ja neid ei säilitata. Me ei jaga kunagi sinu andmeid kolmandate osapooltega ega kasuta seda mudelite treenimiseks.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai genereerib heli WAV vormingus vaikimisi maksimaalse kvaliteedi. Saate teisendada MP3, FLAC, OGG või M4A kasutades meie tasuta Audio Converter tööriist. API toetab täpsustada oma eelistatud väljundvorming otse taotluse.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) ei nõua konto ja kulu null krediiti. Standardmudelid (2 krediiti/1K tähemärki) hulka Bark, CosyVoice 2, F5-TTS ja Dia. Premium mudelid (4 krediiti/1K tähemärki) hulka OpenVoice, Chatterbox, StyleTTS 2 ja Tortoise. Tasustatud mudelid üldiselt pakuvad kõrgema kvaliteediga, rohkem hääli, ja lisafunktsioonid nagu hääl kloonimine.

Jah. API toetab partii töötlemise teisendamiseks suurtes kogustes teksti kõne. Saada mitu päringut ja saada tulemusi asünkroonselt kasutades töö UUTID. Ettevõtte plaanid ($99/mo) sisaldavad prioriteet järjekorra juurdepääsu kiiremaks partii töötlemise. Ideaalne audioraamat tootmise, muidugi sisu, ja suuremahuliste hääleüle projekte.
5.0/5 (1)

Alusta AI-hääle kasutamist tänapäeval

Liitu loojate, arendajate ja ettevõtetega, kes kasutavad TTS.ai