Free AI Text proslovu

22+ open-source modely, 100+ hlasy, 32+ jazyky, žádný účet není nutný.

0/500 znaky Volné
Žádná kreditní karta 50 volných kreditů 32+ jazyky Komerční využití OK
0:00 / 0:00
Stáhnout zvuk Odkaz vyprší v 24 hodin
Jako TTS.ai? Řekni to svým přátelům!

22+ Al Voice Models

Nejkomplexnější kolekce modelů TTS open-source na jedné platformě

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Nejlepší pro: High-quality TTS with minimal latency, streaming applications

Zkuste zdarma

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Nejlepší pro: Quick previews, accessibility, and embedded applications

Zkuste zdarma

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Nejlepší pro: General-purpose text-to-speech with natural prosody

Zkuste zdarma

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Nejlepší pro: Výrobní aplikace potřebné rychle, vícejazyčné TTS

Zkuste zdarma

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Vývojář: Suno · Licence: MIT

Zkus to.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Vývojář: Suno · Licence: MIT

Zkus to.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Vývojář: Alibaba (Tongyi Lab) · Licence: Apache 2.0

Zkus to.

Dia TTS Standard

Model generování dialogů s více reproduktory, který vytváří přirozené konverzace mezi reproduktory.

Vývojář: Nari Labs · Licence: Apache 2.0

Zkus to.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Vývojář: Hugging Face · Licence: Apache 2.0

Zkus to.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Vývojář: Index Team · Licence: Apache 2.0

Zkus to.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Vývojář: SparkAudio · Licence: Apache 2.0

Zkus to.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Vývojář: RVC-Boss · Licence: MIT

Zkus to.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Vývojář: Canopy Labs · Licence: Llama 3.2 Community

Zkus to.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Vývojář: Alibaba (Qwen) · Licence: Apache 2.0

Zkus to.

Chatterbox Premium

Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.

Kvalita:

Zkus to.

Tortoise TTS Premium

Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.

Kvalita:

Zkus to.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvalita:

Zkus to.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kvalita:

Zkus to.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Jazyky: en, zh, ja, ko, fr, de, it, es

Klonový hlas

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Jazyky: en, zh

Klonový hlas

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Jazyky: en, zh

Klonový hlas

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Jazyky: en, zh, ja, ko

Klonový hlas

Chatterbox

Nejmodernější klonování nulovacího hlasu s emoční kontrolou z Resse Al.

Jazyky: en

Klonový hlas

Tortoise TTS

Multi-voice text-to-speech zaměřený na kvalitu s autoregresivní architekturou.

Jazyky: en

Klonový hlas

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Jazyky: en, zh, ja, ko, fr, de, es, it

Klonový hlas

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Jazyky: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonový hlas

Vývojář-První API

OpenAI kompatibilní REST API. Jeden cíl, 22+ modely. Streamování podpory pro aplikace v reálném čase.

  • Formát kompatibilní s OpenAI
  • Streamování TTS pro aplikace v reálném čase
  • Zpracovávání šarží pro velká pracovní místa
  • Oznámení o webhooku
Zobrazit API Docs
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Jednoduché, Průhledné ceny

Začněte zdarma, jak rostete.

Volné

$0

50 kreditů

  • Kokoro, Piper, VITS, MeloTTS
  • Limit 500 znaků
  • 3 gen/hod (bez účtu)
Zaregistrovat se zdarma

Starter

$9/ne

500 kreditů/měsíc

  • Všechny 22+ modely
  • 5,000 limit znaků
  • Klonování hlasu
Začněte
Nejoblíbenější

Pro

$29/ne

2 000 kreditů/měsíc

  • Všechno v Starteru
  • Přístup API
  • Prioritní zpracování
Get Pro

Podnik

$99/ne

10 000 kreditů/měsíc

  • Everything in Pro
  • Bulk API
  • Prioritní fronta
Kontaktní prodej

View all plans including credit packs →

Často kladené otázky

TTS.ai je nejkomplexnější hlasová platforma AI, která nabízí 22+ text-to-speech modely, hlasové klonování, řeč-text, a audio nástroje. Všechny modely jsou otevřený zdroj bez uzamykatelného prodejce.

Ano! TTS.ai nabízí zdarma text-to-speech s Kokoro, Piper, VITS, a Melotts modely. Není nutné žádný účet. Zaregistrujte se získat 50 zdarma kreditů a přístup ke všem modelům. Placené plány začínají na $9/měsíc.

Pro rychlost použijte Kokoro nebo Piper. Pro kvalitu zkuste CosyVoice 2 nebo StyletTS 2. Pro klonování hlasu použijte Chatterbox nebo GPT-SoviTS. Pro dialog použijte Dia TTS. Zkuste více modelů na stejném textu.

Ano. OpenAI kompatibilní REST API pro TTS, STT, hlasové klonování a audio nástroje. K dispozici na Pro ($29/mo) a Enterprise ($99/mo) plány. Zobrazit dokumentaci na tts.ai/api/.

Kvalita hlasu se liší podle modelu. Premium modely jako CosyVoice 2, StyleTTS 2, a Chatterbox produkují téměř lidské kvality řeči s přírodní intonací a emocí. Volné modely jako Kokoro nabízejí vynikající kvalitu pro většinu případů použití.

TTS.ai podporuje 30+ jazyků napříč svou modelovou knihovnou. Angličtina má nejširší modelovou podporu, ale modely jako CosyVoice 2 pokrývají čínštinu, japonštinu a korejštinu; GPT-Sovits zpracovává čínské, japonské, korejské a anglické; a MeloTTS podporuje angličtinu, španělštinu, francouzštinu, čínštinu, japonštinu a korejštinu.

Ano. Veškeré zpracování probíhá na našich dedikovaných GPU serverech. Vaše textové vstupy nebo generované audio neukládáme po doručení. Nahrané hlasové vzorky pro klonování se používají pouze pro aktuální relaci a nejsou uchovávány. Vaše údaje nikdy nesdílíme se třetími stranami ani je nepoužíváme k tréninku modelů.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai generuje zvuk ve formátu WAV ve výchozím nastavení pro maximální kvalitu. Můžete převést do MP3, FLAC, OGG, nebo M4A pomocí našeho bezplatného nástroje Audio Converter. API podporuje upřesnění vašeho preferovaného výstupního formátu přímo v žádosti.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Zdarma modely (Kokoro, Piper, VITS, Melotts) nevyžadují žádný účet a nestojí žádné kredity. Standardní modely (2 kredity/1K znaky) zahrnují Bark, CosyVoice 2, F5-TTS a Dia. Premium modely (4 kredity/1K znaky) zahrnují OpenVoice, Chatterbox, StyleTTS 2 a Tortoise. Placené modely obecně nabízejí vyšší kvalitu, více hlasů, a další funkce jako hlasové klonování.

Ano. API podporuje dávkové zpracování pro převod velkých objemů textu do řeči. Odevzdejte více žádostí a získat výsledky asynchronně pomocí práce UUIDS. Enterprise plány ($99/mo) zahrnují přednostní fronta přístup pro rychlejší zpracování šarží. Ideální pro audioknihu výrobu, obsah kurzu, a velkoplošné projekty hlasového přehrávání.
5.0/5 (1)

Začněte používat AI hlas dnes

Připojte se k tvůrcům, vývojářům a podnikům používajícím TTS.ai