Prosti AI Besedilo v govor

22+ modeli odprtega vira, 100+ glasov, 32+ jeziki. Račun ni potreben.

0/500 znaki Prosto
Brez kreditne kartice 50 brezplačnih kreditov 32+ jeziki Trgovska uporaba OK
0:00 / 0:00
Download Audio Povezava poteče čez 24h
Povej prijateljem.

22+ AI Glasovni modeli

Najobsežnejša zbirka modelov TTS na odprtem viru v eni platformi

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Najboljše za: High-quality TTS with minimal latency, streaming applications

Poskusite svobodno

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Najboljše za: Quick previews, accessibility, and embedded applications

Poskusite svobodno

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Najboljše za: General-purpose text-to-speech with natural prosody

Poskusite svobodno

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Najboljše za: Zahtevki za proizvodnjo, ki potrebujejo hitro, večjezično TTS

Poskusite svobodno

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Razvijalec: Suno · Licenca: MIT

Poskusi.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Razvijalec: Suno · Licenca: MIT

Poskusi.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Razvijalec: Alibaba (Tongyi Lab) · Licenca: Apache 2.0

Poskusi.

Dia TTS Standard

Večzvočniški dialogski model, ki ustvarja naravne pogovore med zvočniki.

Razvijalec: Nari Labs · Licenca: Apache 2.0

Poskusi.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Razvijalec: Hugging Face · Licenca: Apache 2.0

Poskusi.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Razvijalec: Index Team · Licenca: Apache 2.0

Poskusi.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Razvijalec: SparkAudio · Licenca: Apache 2.0

Poskusi.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Razvijalec: RVC-Boss · Licenca: MIT

Poskusi.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Razvijalec: Canopy Labs · Licenca: Llama 3.2 Community

Poskusi.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Razvijalec: Alibaba (Qwen) · Licenca: Apache 2.0

Poskusi.

Chatterbox Premium

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Kakovost:

Poskusi.

Tortoise TTS Premium

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Kakovost:

Poskusi.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kakovost:

Poskusi.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kakovost:

Poskusi.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Jeziki: en, zh, ja, ko, fr, de, it, es

Klonov glas

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Jeziki: en, zh

Klonov glas

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Jeziki: en, zh

Klonov glas

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Jeziki: en, zh, ja, ko

Klonov glas

Chatterbox

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Jeziki: en

Klonov glas

Tortoise TTS

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Jeziki: en

Klonov glas

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Jeziki: en, zh, ja, ko, fr, de, es, it

Klonov glas

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Jeziki: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonov glas

Razvijalec-prva API

Združljiv z OpenAI REST API. En opazovani dogodek, 22+ modeli. Pogon podpore za aplikacije v realnem času.

  • Združljiva z OpenAI formatom
  • Streaming TTS za aplikacije v realnem času
  • Serija obdelave za velika delovna mesta
  • Spletna obvestila
Poglejte API Docs
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Preprosta, pregledna cena

Začnite svobodno.

Prosto

$0

50 kreditov

  • Kokoro, Piper, VITS, MeloTTS
  • Omejitev 500 znakov
  • 3 gen/ur (brez računa)
Prosto se prijavite

Začetek

$9/Mo

500 kreditov/mesec

  • Vsi 22+ modeli
  • Omejitev 5000 znakov
  • Kloniranje glasu
Začnite
Najbolj priljubljeno

Prof.

$29/Mo

2.000 kreditov mesečno

  • Vse v zagonu
  • Dostop API
  • Prednostna obdelava
Get Prof

Podjetje

$99/Mo

10.000 kreditov/mesec

  • Vse v prof.
  • Masovni API
  • Prednostna vrstica
Kontaktna prodaja

View all plans including credit packs →

Pogosta vprašanja

TTS.ai je najbolj celovita AI glasovna platforma, ki ponuja 22+ modelov besedila-to-peča, kloniranje glasu, govor-to-tekst, in zvočna orodja. Vsi modeli so odprt vir brez prodajalca zakleniti.

Da! TTS.ai ponuja brezplačno besedilo-to-speech z Kokoro, Piper, VITS in modeli Melotts. Ni potreben račun. Prijava za 50 brezplačnih kreditov in dostop do vseh modelov. Plačani načrti se začnejo z 9 $/mesec.

Za hitrost uporabite Kokoro ali Piper. Za kakovost poskusite CosyVoice 2 ali StyleTTS 2. Za kloniranje glasu uporabite Chatterbox ali GPT-SoviTS. Za dialog uporabite Dia TTS. Primerjajte več modelov v istem besedilu.

Da. Združljiv z OpenAI REST API za TTS, STT, glasovno kloniranje in zvočno orodje. Na voljo na Pro (29/mo) in Enterprise ($99/mo) načrtih. Poglej dokumentacijo na tts.ai/api /.

Kvaliteta glasu se razlikuje po modelu.Premium modeli, kot je CosyVoice 2, StyleTTS 2, in Chatterbox proizvajajo skoraj človeški kakovostni govor z naravnim intonacijo in čustvi. Brezplačni modeli kot Kokoro ponujajo odlično kakovost za večino primerov uporabe.

TTS.ai podpira 30+ jezikov v svoji modelski knjižnici. Angleški ima najširši model podpore, vendar modeli kot CosyVoice 2 naslovnica kitajske, japonske in korejske; GPT-SoviTS upravlja kitajsko, japonsko, korejsko in angleško; in MelotTS podpira angleško, špansko, francosko, kitajsko, japonsko in korejsko.

Da. Vse obdelava se zgodi na naših namenskih strežnikih GPU. Ne shranjujemo vnosa vašega besedila ali ustvariti zvoka po dostavi. Nalagani glasovni vzorci za kloniranje se uporabljajo samo za trenutno sejo in niso obdržani. Vaši podatki nikoli ne delimo s tretjimi stranmi ali jih uporabljamo za usposabljanje modelov.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai ustvarja zvok v WAV formatu privzeto za maksimalno kakovost. Lahko pretvorite v MP3, FLAC, OGG, ali M4A z uporabo našega brezplačnega orodja Audio Converter. API podpira navedbo vaše prednostne izhodne oblike neposredno v zahtevi.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Brezplačni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtevajo računa in nič kreditov. Standardni modeli (2 krediti/1K znakov) vključujejo Bark, CosyVoice 2, F5-TTS in Dia. Premium modeli (4 krediti/1K znakov) vključujejo OpenVoice, Chatterbox, StyleTTS 2 in Tortoise. Plačani modeli na splošno ponujajo višjo kakovost, več glasov in dodatne funkcije, kot je kloniranje glasu.

Da. API podpira obdelavo serije za pretvorbo velike količine besedila v govor. Pošljite več zahtev in dobite rezultate asinhronizirano z uporabo delovnega mesta UUIDs. Podjetniški načrti (99 $/mo) vključujejo prednostni dostop v vrsto za hitrejše obdelavo serije. Idealno za produkcijo zvočnih knjig, vsebino tečaja in obsežno glasovno-preglednih projektov.
5.0/5 (1)

Začnite uporabljati AI glas danes

Pridružite se ustvarjalcem, razvijalcem in podjetjem, ki uporabljajo TTS.ai