Ingyenes MI Szöveg a beszédhez

22+ nyílt forráskódú modellek, 100+ hangok, 32+ nyelveket. Számla nem szükséges.

0/500 karakterek Ingyenes
Nincs hitelkártyája. 50 ingyenes kredit 32+ Nyelvek Kereskedelmi felhasználás OK
0:00 / 0:00
Audio letöltése A kapcsolat 24 órán belül lejár
Mondjátok el a barátaitoknak!

Minden, amire szükséged van a hangjelzőhöz

26 szerszámok 24+ nyílt forráskódú AI modellekkel

22+ AI hangmodellek

A nyílt forráskódú TTS modellek legátfogóbb gyűjteménye egy platformon

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Legjobb: High-quality TTS with minimal latency, streaming applications

Próbálja ki a szabad

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Legjobb: Quick previews, accessibility, and embedded applications

Próbálja ki a szabad

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Legjobb: General-purpose text-to-speech with natural prosody

Próbálja ki a szabad

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Legjobb: Gyors, többnyelvű TTS gyártási alkalmazásokra van szükség

Próbálja ki a szabad

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Fejlesztő: Suno · Jogosítvány: MIT

Próbáld ki.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Fejlesztő: Suno · Jogosítvány: MIT

Próbáld ki.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Fejlesztő: Alibaba (Tongyi Lab) · Jogosítvány: Apache 2.0

Próbáld ki.

Dia TTSDia TTS Standard

Multi-speaker dialógus generációs modell, amely létrehoz természetes beszélgetések hangszórók között.

Fejlesztő: Nari Labs · Jogosítvány: Apache 2.0

Próbáld ki.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Fejlesztő: Hugging Face · Jogosítvány: Apache 2.0

Próbáld ki.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Fejlesztő: Index Team · Jogosítvány: Apache 2.0

Próbáld ki.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Fejlesztő: SparkAudio · Jogosítvány: Apache 2.0

Próbáld ki.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Fejlesztő: RVC-Boss · Jogosítvány: MIT

Próbáld ki.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Fejlesztő: Canopy Labs · Jogosítvány: Llama 3.2 Community

Próbáld ki.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Fejlesztő: Alibaba (Qwen) · Jogosítvány: Apache 2.0

Próbáld ki.

ChatterboxChatterbox Premium

A legmodernebb zéró hangú klónozás érzelmi irányítással Resemble AI-tól.

Minőség:

Próbáld ki.

Tortoise TTSTortoise TTS Premium

A többhangú szövegtől a beszédig a minőségre koncentrált, autoregresszív architektúrával.

Minőség:

Próbáld ki.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Minőség:

Próbáld ki.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Minőség:

Próbáld ki.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Nyelvek: en, zh, ja, ko, fr, de, it, es

Klónhang

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Nyelvek: en, zh

Klónhang

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Nyelvek: en, zh

Klónhang

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Nyelvek: en, zh, ja, ko

Klónhang

ChatterboxChatterbox

A legmodernebb zéró hangú klónozás érzelmi irányítással Resemble AI-tól.

Nyelvek: en

Klónhang

Tortoise TTSTortoise TTS

A többhangú szövegtől a beszédig a minőségre koncentrált, autoregresszív architektúrával.

Nyelvek: en

Klónhang

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Nyelvek: en, zh, ja, ko, fr, de, es, it

Klónhang

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Nyelvek: en, zh, ja, ko, de, fr, ru, pt, es, it

Klónhang

Fejlesztő-első API

OpenAI-kompatibilis REST API. Egy végpont, 22+ modellek. Streaming támogatás valós idejű alkalmazások.

  • OpenAI-kompatibilis formátum
  • TTS közvetítés valós idejű alkalmazásokhoz
  • Batch processing for large jobs
  • Webhook értesítések
Az API dokumentációjának megtekintése
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Egyszerű, átlátható árképzés

Kezdd el, ahogy nősz.

Ingyenes

$0

50 kredit

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakterhatár
  • 3 ge/óra (nincs számla)
Regisztráció Ingyenes

Indító

$9/unit description in lists

500 kredit/hó

  • Mind a 22+ modell
  • 5000 karakterhatár
  • Hang klónozása
Kezdés@ info: whatsthis
Legnépszerűbb

Pro

$29/unit description in lists

2000 kredit/hó

  • Minden kezdőben
  • API-hozzáférés
  • Prioritású feldolgozás
Get Pro

Enterprise

$99/unit description in lists

10 000 kredit/hó

  • Minden a Pro-ban
  • Ömlesztett API
  • Prioritási sor
Kapcsolattartó értékesítés

View all plans including credit packs →

Gyakran ismételt kérdések

A TTS.ai a legátfogóbb AI hang platform, 22+ szöveg-nyelv modellek, hang klónozás, beszéd-szöveg, és audio eszközök. Minden modell nyílt forráskódú, nem eladói zárolás.

Igen! A TTS.ai ingyenes szöveges beszédeket kínál Kokoróval, Piperrel, VITS-szel és MelotTS modellekkel. Nincs szükség fiókra. Jelentkezzen 50 ingyenes kreditért és férjen hozzá az összes modellhez. A fizetett tervek $9/hónapban kezdődnek.

A sebesség, használja Kokoro vagy Piper. A minőség, próbálja CosyVoice 2 vagy StyletTS 2. Hang klónozás, használja Chatterbox vagy GPT-Sovits. A párbeszédablak, használja Dia TTS. Próbálja ki több modell ugyanazon a szövegen összehasonlítani.

Igen. OpenAI-kompatibilis REST API TTS, STT, hang klónozás, és audio eszközök. Elérhető a Pro ($29/mo) és Enterprise ($99/mo) tervek. Dokumentáció megtekintése a tts.ai/api/.

A hangminőség modellenként változik. Az olyan prémium modellek, mint a CosyVoice 2, a StyletTS 2 és a Chatterbox természetes intonációval és érzelemmel állítják elő az emberközeli minőségű beszédet. Az ingyenes modellek, mint a Kokoro kiváló minőségűek a legtöbb használathoz.

TTS.ai támogatja 30+ nyelvek egész modell könyvtára. Angol rendelkezik a legszélesebb modell támogatás, de modellek, mint a CosyVoice 2 kiterjed kínai, japán, és koreai; GPT-SovitS kezeli a kínai, japán, koreai és angol; és MelotTS támogatja az angol, spanyol, francia, kínai, japán, és koreai.

Igen. Minden feldolgozás a mi dedikált GPU szervereinken történik. Nem tároljuk a szövegbemenetet vagy generált audiót a szállítás után. A klónozáshoz feltöltött hangmintákat csak az aktuális munkamenethez használjuk fel, és nem tartjuk meg. Az Ön adatait soha nem osztjuk meg harmadik felekkel, és nem használjuk a modellek kiképzésére.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai generál audio WAV formátumban alapértelmezés szerint a maximális minőség. Akkor konvertálni MP3, FLAC, OGG, vagy M4A segítségével a mi ingyenes Audio Converter eszköz. Az API támogatja, hogy meghatározza a preferált kimeneti formátum közvetlenül a kérés.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Ingyenes modellek (Kokoro, Piper, VITS, MelotTS) nem igényelnek számla és költségek nulla kreditek. Standard modellek (2 kredit/1K karakterek) közé Bark, CosyVoice 2, F5-TTS, és Dia. Premium modellek (4 kredit/1K karakterek) közé OpenVoice, Chatterbox, StyletTS 2, és Tortoise. Paid modellek általában kínálnak magasabb minőségű, több hang, és további funkciók, mint a hang klónozás.

Igen. Az API támogatja a gyártási tételek feldolgozását a nagy mennyiségű szöveg beszédté történő átalakításához. Több kérelem benyújtása és az eredmények letöltése szinkronban az UUID-ok segítségével. Vállalati tervek ($99/mo) közé tartozik az elsőbbségi sorban elérhető gyorsabb gyártási tételek. Ideális audiobook gyártás, tanfolyam tartalom, és nagy volumenű hangátviteli projektek.
5.0/5 (1)

Kezdd el használni az AI Voice-t ma

Csatlakozz az alkotókhoz, a fejlesztőkhöz és a TTS.ai-t használó vállalkozásokhoz