Frjáls AI Texti í talName

22+ opinn uppspretta módel, 100+ raddir, 32+ Engin reikningur krafist.

0/500 stafir Frjáls
Engin kreditkort 50 ókeypis einingar 32+ tungumál Notkun í atvinnuskyni OK
0:00 / 0:00
Download Audio Tengill rennur út eftir 24 klst
Eins og TTS.ai? Segðu vinum þínum!

22+ AI rödd módel

Alhliða safn af opnum uppruna TTS módel í einum vettvangi

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Best fyrir: High-quality TTS with minimal latency, streaming applications

Prófaðu ókeypis

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Best fyrir: Quick previews, accessibility, and embedded applications

Prófaðu ókeypis

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Best fyrir: General-purpose text-to-speech with natural prosody

Prófaðu ókeypis

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Best fyrir: Framleiðsluforrit sem þurfa hratt, fjöltyngt TTS

Prófaðu ókeypis

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Forritari: Suno · Leyfi: MIT

Prófaðu það

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Forritari: Suno · Leyfi: MIT

Prófaðu það

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Forritari: Alibaba (Tongyi Lab) · Leyfi: Apache 2.0

Prófaðu það

Dia TTSDia TTS Standard

Multi-hátalara samræða kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.

Forritari: Nari Labs · Leyfi: Apache 2.0

Prófaðu það

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Forritari: Hugging Face · Leyfi: Apache 2.0

Prófaðu það

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Forritari: Index Team · Leyfi: Apache 2.0

Prófaðu það

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Forritari: SparkAudio · Leyfi: Apache 2.0

Prófaðu það

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Forritari: RVC-Boss · Leyfi: MIT

Prófaðu það

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Forritari: Canopy Labs · Leyfi: Llama 3.2 Community

Prófaðu það

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Forritari: Alibaba (Qwen) · Leyfi: Apache 2.0

Prófaðu það

ChatterboxChatterbox Premium

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Gæði:

Prófaðu það

Tortoise TTSTortoise TTS Premium

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Gæði:

Prófaðu það

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Gæði:

Prófaðu það

OpenVoiceOpenVoice Premium

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Gæði:

Prófaðu það

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Tungumál: en, zh, ja, ko, fr, de, it, es

Klóna rödd

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Tungumál: en, zh

Klóna rödd

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Tungumál: en, zh

Klóna rödd

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Tungumál: en, zh, ja, ko

Klóna rödd

ChatterboxChatterbox

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Tungumál: en

Klóna rödd

Tortoise TTSTortoise TTS

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Tungumál: en

Klóna rödd

OpenVoiceOpenVoice

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Tungumál: en, zh, ja, ko, fr, de, es, it

Klóna rödd

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Tungumál: en, zh, ja, ko, de, fr, ru, pt, es, it

Klóna rödd

Developer-First API

OpenAI-samhæft REST API. Einn endapunktur, 22+ gerðir. Streaming stuðning fyrir rauntíma forrit.

  • OpenAI-samhæft snið
  • Streaming TTS fyrir rauntíma forrit
  • Hópvinnsla fyrir stór störf
  • Webhook tilkynningar
Skoða API skjöl
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Einföld, gagnsæ verðlagning

Byrjaðu ókeypis. Scale eins og þú vex.

Frjáls

$0

50 einingar

  • Kokoro, Piper, VITS, MeloTTS
  • 500 stafa takmörk
  • 3 gen/klukkustund (enginn reikningur)
Skráðu þig ókeypis

Ræsir

$9/mánuðir

500 einingar / mánuður

  • Öll 22+ módel
  • 5.000 stafa takmörk
  • Raddklónun
Byrjaðu
Vinsælasta

Fyrir

$29/mánuðir

2.000 einingar / mánuður

  • Allt í Starter
  • API aðgangur
  • Forgangsvinnsla
Fáðu Pro

Fyrirtæki

$99/mánuðir

10.000 einingar / mánuður

  • Allt í Pro
  • Magn API
  • Forgangsröð
Hafðu samband við sölu

View all plans including credit packs →

Algengar spurningar (FAQ)

TTS.ai er alhliða AI rödd vettvangur, sem býður upp á 22 + texta-til-tal módel, rödd klónun, tal-til-texta, og hljóð verkfæri.Allar gerðir eru opinn uppspretta án söluaðila læsa í.

Já! TTS.ai býður upp á ókeypis texta til tals með Kokoro, Piper, VITS og MeloTTS módelum. Enginn reikningur er krafist. Skráðu þig til að fá 50 ókeypis einingar og aðgang að öllum gerðum. Greiddar áætlanir byrja á $ 9 / mánuði.

Fyrir hraða, nota Kokoro eða Piper. Fyrir gæði, reyna CosyVoice 2 eða StyleTTS 2. Fyrir rödd klónun, nota Chatterbox eða GPT- SoVITS. Fyrir samtal, nota Dia TTS. Prófaðu mörg módel á sama texta til að bera saman.

Já. OpenAI-samhæft REST API fyrir TTS, STT, rödd klónun og hljóð verkfæri. Laus á Pro ($ 29 / mo) og Enterprise ($ 99 / mo) áætlanir. Skoða skjöl á tts.ai / api /.

Premium módel eins og CosyVoice 2, StyleTTS 2 og Chatterbox framleiða nánast mannleg gæði ræðu með náttúrulegum tónum og tilfinningum. Frjáls módel eins og Kokoro bjóða upp á framúrskarandi gæði fyrir flest notkunartilfelli.

TTS.ai styður 30 + tungumál yfir líkan bókasafn sitt.Enska hefur breiðasta líkan stuðning, en módel eins og CosyVoice 2 ná kínversku, japönsku og kóresku; GPT-SoVITS meðhöndlar kínversku, japönsku, kóresku og ensku; og MeloTTS styður ensku, spænsku, frönsku, kínversku, japönsku og kóresku.

Já. Öll vinnsla fer fram á sérstökum GPU netþjónum okkar. Við geymum ekki texta innslátt þinn eða myndað hljóð eftir afhendingu. Hlaðið upp rödd sýnishorn fyrir klónun er aðeins notað fyrir núverandi lotu og er ekki haldið. Við deilum aldrei gögnum þínum með þriðja aðila eða nota það til að þjálfa módel.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai býr til hljóð í WAV sniði sjálfgefið fyrir hámarks gæði.Þú getur breytt í MP3, FLAC, OGG eða M4A með því að nota ókeypis Audio Converter tól okkar.API styður að tilgreina valinn framleiðsla snið beint í beiðni.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) þurfa engan reikning og kosta núll einingar. Standard módel (2 einingar / 1K stafir) eru Bark, CosyVoice 2, F5-TTS og Dia. Premium módel (4 einingar / 1K stafir) eru OpenVoice, Chatterbox, StyleTTS 2 og Tortoise. Greidd módel bjóða yfirleitt hærri gæði, fleiri raddir og viðbótaraðgerðir eins og raddklónun.

Já. API styður lotuvinnslu til að umbreyta miklu magni af texta í tal. Sendu inn margar beiðnir og sækja niðurstöður ósamstillt með því að nota vinnu UUID. Enterprise áætlanir ($ 99 / mo) fela í sér forgangsröðunaraðgang fyrir hraðari lotuvinnslu. Tilvalið fyrir hljóðbókaframleiðslu, námskeiðsefni og stórfelld röddverkefni.
5.0/5 (1)

Byrjaðu að nota AI Voice í dag

Taktu þátt í höfundum, verktaki og fyrirtækjum sem nota TTS.ai