Ingyenes MI Szöveg a beszédhez

20+ nyílt forráskódú modellek, 107+ hangok, 32+ nyelveket. Számla nem szükséges.

1K+
alkotók
2K+
generációk
20+
AI-modellek
107+
hangok
0/500 karakterek Ingyenes
Like TTS.ai? Tell your friends!

Minden, amire szükséged van a hangjelzőhöz

30+ szerszámok nyílt forráskódú MI modellekkel

20+ AI hangmodellek

A nyílt forráskódú TTS modellek legátfogóbb gyűjteménye egy platformon

KokoroKokoro Free

Kokoro egy 82 millió paraméteres szövegtől-beszédig modell, amely jóval a súlyosztály felett üt. Kis mérete ellenére rendkívül természetes és kifejező beszédet ad. Kokoro több nyelvet támogat, köztük angolt, japánt, kínait és koreait különböző expresszív hangokkal. Hihetetlenül gyorsan fut, közel 100x-kal gyorsabban generál hangokat, mint valós időben egy GPU-n.

Legjobb: Kiváló minőségű TTS minimális késéssel, streaming alkalmazásokkal

Próbálja ki a szabad

PiperPiper Free

Piper egy könnyű SMS-to-speech motor által kifejlesztett Rhasspy, amely használja VITS és gége architektúrák. Ez teljesen a CPU, így ideális az él eszközök, otthon automatizálás, és alkalmazások igényel offline TTS. Több mint 100 hangok 30+ nyelvek, Piper szállít természetes hangzású beszéd valós idejű sebesség még egy málna Pi 4.

Legjobb: Gyors előnézetek, akadálymentesítés és beágyazott alkalmazások

Próbálja ki a szabad

VITSVITS Free

A VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) egy párhuzamos vég-vég-vég TTS módszer, amely több természetes hangzást generál, mint a jelenlegi kétlépcsős modellek. A standardizáló áramlásokkal és egy ellenzős képzési folyamattal kiegészített variációs következtetéseket fogad el, amelyek jelentős javulást eredményeznek a természetességben.

Legjobb: Általános célú szöveg-szólás természetes proszódiával

Próbálja ki a szabad

MeloTTSMeloTTS Free

MelotTS by MyShell.ai egy többnyelvű TTS könyvtár támogató angol (amerikai, brit, indiai, ausztrál), spanyol, francia, kínai, japán, és koreai. Ez rendkívül gyors, feldolgozás szöveg közel valós idejű sebesség CPU egyedül. MelotTS célja a termelés használata, és támogatja a CPU és a GPU következtetések.

Legjobb: Gyors, többnyelvű TTS gyártási alkalmazásokra van szükség

Próbálja ki a szabad

BarkBark Standard

Transformer-alapú szöveg-audio modell, amely realisztikus beszéd, zene, és hanghatások.

Fejlesztő: Suno · Jogosítvány: MIT

Próbáld ki.

Bark SmallBark Small Standard

Könnyebb változata Bark gyorsabb következtetés és kisebb memória használat.

Fejlesztő: Suno · Jogosítvány: MIT

Próbáld ki.

CosyVoice 2CosyVoice 2 Standard

Alibaba skálázható TTS-e emberi-paritatív természetességgel és majdnem nulla késéssel.

Fejlesztő: Alibaba (Tongyi Lab) · Jogosítvány: Apache 2.0

Próbáld ki.

Dia TTSDia TTS Standard

Multi-speaker dialógus generációs modell, amely létrehoz természetes beszélgetések hangszórók között.

Fejlesztő: Nari Labs · Jogosítvány: Apache 2.0

Próbáld ki.

Parler TTSParler TTS Standard

Írja le a kívánt hangot természetes nyelven, és Parler generál megfelelő beszédet.

Fejlesztő: Hugging Face · Jogosítvány: Apache 2.0

Próbáld ki.

GLM-TTSGLM-TTS Standard

A nyílt forráskódú TTS-modellek közül a legalacsonyabb karakterhibát éri el.

Fejlesztő: Zhipu AI · Jogosítvány: GLM-4 License

Próbáld ki.

IndexTTS-2IndexTTS-2 Standard

Zéró lövés TTS finoman kifinomult érzelmi kontroll és magas kifejezőképesség.

Fejlesztő: Index Team · Jogosítvány: Bilibili Model License

Próbáld ki.

Spark TTSSpark TTS Standard

Hang klónozása TTS irányítható érzelemmel és beszédstílus segítségével prompts.

Fejlesztő: SparkAudio · Jogosítvány: CC BY-NC-SA 4.0

Próbáld ki.

GPT-SoVITSGPT-SoVITS Standard

Kevés hang klónozza a TTS-t, ami lemásolja a hangot mindössze 5 másodpercnyi hangból.

Fejlesztő: RVC-Boss · Jogosítvány: MIT

Próbáld ki.

OrpheusOrpheus Standard

Emberi szintű TTS modell, 100 ezer órányi beszédadattal.

Fejlesztő: Canopy Labs · Jogosítvány: Llama 3.2 Community

Próbáld ki.

Qwen3 TTSQwen3 TTS Standard

Alibaba többnyelvű TTS hang klónozás, előre beállított hangok, és hangtervezés szövegből.

Fejlesztő: Alibaba (Qwen) · Jogosítvány: Apache 2.0

Próbáld ki.

ChatterboxChatterbox Premium

A legmodernebb zéró hangú klónozás érzelmi irányítással Resemble AI-tól.

Minőség:

Próbáld ki.

Tortoise TTSTortoise TTS Premium

A többhangú szövegtől a beszédig a minőségre koncentrált, autoregresszív architektúrával.

Minőség:

Próbáld ki.

StyleTTS 2StyleTTS 2 Premium

Az emberi szintű szövegtől a beszédig a stílusdiffúziós és az ellenzői képzésen keresztül.

Minőség:

Próbáld ki.

OpenVoiceOpenVoice Premium

Azonnali hang klónozás szemcsés kontroll felett stílus, érzelem, és akcentus.

Minőség:

Próbáld ki.

Sesame CSMSesame CSM Premium

Beszélgetési beszéd modell generál természetes párbeszéd megfelelő időzítéssel és érzelmekkel.

Minőség:

Próbáld ki.

CosyVoice 2CosyVoice 2

Alibaba skálázható TTS-e emberi-paritatív természetességgel és majdnem nulla késéssel.

Nyelvek: en, zh, ja, ko, fr, de, it, es

Klónhang

GLM-TTSGLM-TTS

A nyílt forráskódú TTS-modellek közül a legalacsonyabb karakterhibát éri el.

Nyelvek: en, zh

Klónhang

IndexTTS-2IndexTTS-2

Zéró lövés TTS finoman kifinomult érzelmi kontroll és magas kifejezőképesség.

Nyelvek: en, zh

Klónhang

Spark TTSSpark TTS

Hang klónozása TTS irányítható érzelemmel és beszédstílus segítségével prompts.

Nyelvek: en, zh

Klónhang

GPT-SoVITSGPT-SoVITS

Kevés hang klónozza a TTS-t, ami lemásolja a hangot mindössze 5 másodpercnyi hangból.

Nyelvek: en, zh, ja, ko

Klónhang

ChatterboxChatterbox

A legmodernebb zéró hangú klónozás érzelmi irányítással Resemble AI-tól.

Nyelvek: en

Klónhang

Tortoise TTSTortoise TTS

A többhangú szövegtől a beszédig a minőségre koncentrált, autoregresszív architektúrával.

Nyelvek: en

Klónhang

OpenVoiceOpenVoice

Azonnali hang klónozás szemcsés kontroll felett stílus, érzelem, és akcentus.

Nyelvek: en, zh, ja, ko, fr, de, es, it

Klónhang

Qwen3 TTSQwen3 TTS

Alibaba többnyelvű TTS hang klónozás, előre beállított hangok, és hangtervezés szövegből.

Nyelvek: en, zh, ja, ko, de, fr, ru, pt, es, it

Klónhang

Fejlesztő-első API

OpenAI-kompatibilis REST API. Egy végpont, 22+ modellek. Streaming támogatás valós idejű alkalmazások.

  • OpenAI-kompatibilis formátum
  • TTS közvetítés valós idejű alkalmazásokhoz
  • Batch processing for large jobs
  • Webhook értesítések
Az API dokumentációjának megtekintése
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Egyszerű, átlátható árképzés

Kezdd el, ahogy nősz.

Ingyenes

$0

15 kredit

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakterhatár
  • 3 ge/óra (nincs számla)
Regisztráció Ingyenes

Indító

$9/unit description in lists

500 kredit/hó

  • Mind a 22+ modell
  • 100 000 chars generációnként
  • Hang klónozása
Kezdés@ info: whatsthis
Legnépszerűbb

Pro

$29/unit description in lists

2000 kredit/hó

  • Minden kezdőben
  • API-hozzáférés
  • Prioritású feldolgozás
Get Pro

Üzleti tevékenység

$99/unit description in lists

10 000 kredit/hó

  • Minden a Pro-ban
  • Ömlesztett API
  • Prioritási sor
Szerezz üzletet!

Az összes terv megtekintése, beleértve a karaktercsomagokat →

Gyakran ismételt kérdések

A TTS.ai a legátfogóbb AI hang platform, 22+ szöveg-nyelv modellek, hang klónozás, beszéd-szöveg, és audio eszközök. Minden modell nyílt forráskódú, nem eladói zárolás.

Igen! TTS.ai kínál ingyenes szöveg-to-speech Kokoro, Piper, VITS, és MelotTS modellek. Nincs szükség fiók. Regisztráljon fel, hogy 15 000 ingyenes karakterek és hozzáférést minden modell. Fizetett tervek kezdődik $9/hónap.

A sebesség, használja Kokoro vagy Piper. A minőség, próbálja CosyVoice 2 vagy StyletTS 2. Hang klónozás, használja Chatterbox vagy GPT-Sovits. A párbeszédablak, használja Dia TTS. Próbálja ki több modell ugyanazon a szövegen összehasonlítani.

Igen. OpenAI-kompatibilis REST API TTS, STT, hang klónozás, és audio eszközök. Elérhető a Pro ($29/mo) és Enterprise ($99/mo) tervek. Dokumentáció megtekintése a tts.ai/api/.

A hangminőség modellenként változik. Az olyan prémium modellek, mint a CosyVoice 2, a StyletTS 2 és a Chatterbox természetes intonációval és érzelemmel állítják elő az emberközeli minőségű beszédet. Az ingyenes modellek, mint a Kokoro kiváló minőségűek a legtöbb használathoz.

TTS.ai támogatja 30+ nyelvek egész modell könyvtára. Angol rendelkezik a legszélesebb modell támogatás, de modellek, mint a CosyVoice 2 kiterjed kínai, japán, és koreai; GPT-SovitS kezeli a kínai, japán, koreai és angol; és MelotTS támogatja az angol, spanyol, francia, kínai, japán, és koreai.

Igen. Minden feldolgozás a mi dedikált GPU szervereinken történik. Nem tároljuk a szövegbemenetet vagy generált audiót a szállítás után. A klónozáshoz feltöltött hangmintákat csak az aktuális munkamenethez használjuk fel, és nem tartjuk meg. Az Ön adatait soha nem osztjuk meg harmadik felekkel, és nem használjuk a modellek kiképzésére.

Igen. Minden hang generált TTS.ai a tiéd, hogy használja a kereskedelmi, beleértve a YouTube videók, podcastok, audiobookok, alkalmazások, hirdetések, és termékek. Modeljeink nyílt forráskód alatt engedélyezett licencek (MIT, Apache 2.0).

TTS.ai generál audio WAV formátumban alapértelmezés szerint a maximális minőség. Akkor konvertálni MP3, FLAC, OGG, vagy M4A segítségével a mi ingyenes Audio Converter eszköz. Az API támogatja, hogy meghatározza a preferált kimeneti formátum közvetlenül a kérés.

Töltsön fel egy rövid hangmintát (5 másodperc alatt) a klónozni kívánt hangból, majd gépeljen be bármilyen szöveget, hogy beszédet generáljon abban a hangban. Modellek, mint a Chatterbox, a GPT-Sovits, és a CosyVoice 2 támogatja a hang klónozást. A klónozott hang elfogja a hangot, az akcentust és a beszédstílust.

Ingyenes modellek (Kokoro, Piper, VITS, MelotTS) nem igényelnek számla és költségek nulla karakterek. Standard modellek (2,000 karakter/1K bevitel) közé Bark, CosyVoice 2, F5-TTS, és Dia. Premium modellek (4,000 karakter/1K bevitel) közé OpenVoice, Chatterbox, StyletTS 2, és Tortoise. Paid modellek általában kínálnak magasabb minőségű, több hang, és további funkciók, mint a hang klónozás.

Igen. Az API támogatja a gyártási tételek feldolgozását a nagy mennyiségű szöveg beszédté történő átalakításához. Több kérelem benyújtása és az eredmények letöltése szinkronban az UUID-ok segítségével. Vállalati tervek ($99/mo) közé tartozik az elsőbbségi sorban elérhető gyorsabb gyártási tételek. Ideális audiobook gyártás, tanfolyam tartalom, és nagy volumenű hangátviteli projektek.
4.0/5 (8)

Kezdd el használni az AI Voice-t ma

Csatlakozz az alkotókhoz, a fejlesztőkhöz és a TTS.ai-et használó vállalkozásokhoz