Slobodna AL Tekst za govor

22+ modeli otvorenog izvora, 100+ glasova, 32+ jezici. Nije potreban račun.

0/500 znakovi Slobodno
Nema kreditne kartice 50 besplatnih kredita 32+ jezici Komercijalna upotreba OK
0:00 / 0:00
Download Audio Veza isteče za 24 sata
Reci svojim prijateljima!

22+ AI Glasovni modeli

Najopsežnija kolekcija modela TTS otvorenog izvora u jednoj platformi

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Najbolje za: High-quality TTS with minimal latency, streaming applications

Pokušaj slobodno

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Najbolje za: Quick previews, accessibility, and embedded applications

Pokušaj slobodno

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Najbolje za: General-purpose text-to-speech with natural prosody

Pokušaj slobodno

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Najbolje za: Proizvodnja zahtjeva za brzim, višejezičnim TTS-om

Pokušaj slobodno

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Razvojnik: Suno · Dozvola: MIT

Probaj.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Razvojnik: Suno · Dozvola: MIT

Probaj.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Razvojnik: Alibaba (Tongyi Lab) · Dozvola: Apache 2.0

Probaj.

Dia TTS Standard

Višezvučnički dijaloški model koji stvara prirodne razgovore između zvučnika.

Razvojnik: Nari Labs · Dozvola: Apache 2.0

Probaj.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Razvojnik: Hugging Face · Dozvola: Apache 2.0

Probaj.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Razvojnik: Index Team · Dozvola: Apache 2.0

Probaj.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Razvojnik: SparkAudio · Dozvola: Apache 2.0

Probaj.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Razvojnik: RVC-Boss · Dozvola: MIT

Probaj.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Razvojnik: Canopy Labs · Dozvola: Llama 3.2 Community

Probaj.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Razvojnik: Alibaba (Qwen) · Dozvola: Apache 2.0

Probaj.

Chatterbox Premium

Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.

Kvaliteta:

Probaj.

Tortoise TTS Premium

Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.

Kvaliteta:

Probaj.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvaliteta:

Probaj.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kvaliteta:

Probaj.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Jezici: en, zh, ja, ko, fr, de, it, es

Kloniranje glasa

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Jezici: en, zh

Kloniranje glasa

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Jezici: en, zh

Kloniranje glasa

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Jezici: en, zh, ja, ko

Kloniranje glasa

Chatterbox

Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.

Jezici: en

Kloniranje glasa

Tortoise TTS

Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.

Jezici: en

Kloniranje glasa

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Jezici: en, zh, ja, ko, fr, de, es, it

Kloniranje glasa

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloniranje glasa

Programer- prvi API

OpenAI kompatibilan REST API. Jedan ishod, 22+ modeli. Streaming support for real-time applications.

  • OpenAI kompatibilan format
  • Streaming TTS za aplikacije u realnom vremenu
  • Paketska obrada za velike poslove
  • Webhook obavijesti
Pogledaj API Docs
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Jednostavna, prozirna cijena

Počnite slobodno.

Slobodno

$0

50 kredita

  • Kokoro, Piper, VITS, MeloTTS
  • Ograničenje znaka
  • 3 gen/sat (bez računa)
Slobodno se prijavite

Pokretanje

$9/Mo

500 kredita/mjesečno

  • Svi 22+ modeli
  • Ograničenje znakova
  • Kloniranje glasa
Započni
Najpopularnije

Profesionalno

$29/Mo

2.000 kredita/mjesečno

  • Sve u Starteru
  • API pristup
  • Prioritetna obrada
Dobiti pro

Poduzeće

$99/Mo

10.000 kredita/mjesečno

  • Sve u profiju
  • Masovni API
  • Prioritetni red
Prodaja kontakata

View all plans including credit packs →

Česta pitanja

TTS.ai je najsveobuhvatnija AI glasovna platforma, koja nudi 22+ tekst-to-peech modele, kloniranje glasa, govor-to-tekst, i audio alati. Svi modeli su otvoreni izvor bez priključka prodavača.

Da! TTS.ai nudi besplatni tekst-to-speech s Kokoro, Piper, VITS, i MeloTTS modelima. Nije potreban račun. Prijavite se za 50 besplatnih kredita i pristup svim modelima. Plaćeni planovi počinju od 9 dolara/mjesec.

Za brzinu, koristite Kokoro ili Piper. Za kvalitetu pokušajte CosyVoice 2 ili StyleTTS 2. Za kloniranje glasa, koristite Chatterbox ili GPT-SoviTS. Za dijalog koristite Dia TTS. Pokušajte više modela na istom tekstu za usporedbu.

Da. OpenAI kompatibilan REST API za TTS, STT, glasovno kloniranje i audio alati. Dostupan na Pro (29/mo) i Enterprise ($99/mo) planova. Pogledajte dokumentaciju na tts.ai/api /.

Kvaliteta glasa varira prema modelu.Premium modeli poput CosyVoice 2, StyleTTS 2, i Chatterbox proizvodi bliski-ljudski kvalitetni govor s prirodnom intonacijom i emocijama. Besplatni modeli poput Kokoro nudi odličnu kvalitetu za većinu slučajeva korištenja.

TTS.ai podržava 30+ jezika u svojoj model knjižnici. Engleski ima najveći model podrške, ali modeli poput CosyVoice 2 naslovnica kineske, japanske i korejske; GPT-SoviTS upravlja kineskim, japanskim, korejskim i engleskim; i MelotTS podržava engleski, španjolski, francuski, kineski, japanski i korejski.

Da. Sva obrada se događa na našim posvećenim GPU poslužiteljima. Mi ne pohranjujemo vaš tekst unos ili generiran zvuk nakon isporuke. Uzorci glasa se koriste samo za trenutnu sesiju i nisu zadržani. Nikada ne dijelimo vaše podatke s trećim osobama ili ih koristimo za vježbanje modela.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai generira zvuk u WAV formatu uobičajeno za maksimalnu kvalitetu. Možete pretvoriti u MP3, FLAC, OGG, ili M4A pomoću našeg besplatnog Audio Converter alat. API podržava navođenje vašeg poželjnog izlaznog formata izravno u zahtjevu.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Besplatni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtijevaju račun i troškove nula kredita. Standardni modeli (2 kredita/1K znakova) uključuju Bark, CosyVoice 2, F5-TTS i Dia. Premium modeli (4 kredita/1K znakova) uključuju OpenVoice, Chatterbox, StyleTTS 2 i Tortoise. Plaćeni modeli općenito nude veću kvalitetu, više glasova i dodatne značajke poput kloniranja glasa.

Da. API podržava serijsku obradu za pretvaranje velikih objekata teksta u govor. Pošaljite više zahtjeva i dohvatite rezultate asinhronno koristeći posao UUIDs. Enterprise planovi ($99/mo) uključuju prioritetni redak pristup za brže obrade serije. Idealan za produkciju audiobooka, sadržaj tečaja, te velikih glasovnih projekata.
5.0/5 (1)

Počnite koristiti AI glas danas

Pridružite se kreatorima, programerima i tvrtkama koristeći TTS.ai