Ingyenes MI Szöveg a beszédhez
22+ nyílt forráskódú modellek, 100+ hangok, 32+ nyelveket. Számla nem szükséges.
Minden, amire szükséged van a hangjelzőhöz
26 szerszámok 24+ nyílt forráskódú AI modellekkel
22+ AI hangmodellek
A nyílt forráskódú TTS modellek legátfogóbb gyűjteménye egy platformon
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Legjobb: High-quality TTS with minimal latency, streaming applications
Próbálja ki a szabad
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Legjobb: Quick previews, accessibility, and embedded applications
Próbálja ki a szabad
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Legjobb: General-purpose text-to-speech with natural prosody
Próbálja ki a szabad
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Legjobb: Gyors, többnyelvű TTS gyártási alkalmazásokra van szükség
Próbálja ki a szabad
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Fejlesztő: Suno · Jogosítvány: MIT
Próbáld ki.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Fejlesztő: Suno · Jogosítvány: MIT
Próbáld ki.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Fejlesztő: Alibaba (Tongyi Lab) · Jogosítvány: Apache 2.0
Próbáld ki.
Dia TTS Standard
Multi-speaker dialógus generációs modell, amely létrehoz természetes beszélgetések hangszórók között.
Fejlesztő: Nari Labs · Jogosítvány: Apache 2.0
Próbáld ki.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Fejlesztő: Hugging Face · Jogosítvány: Apache 2.0
Próbáld ki.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Fejlesztő: Index Team · Jogosítvány: Apache 2.0
Próbáld ki.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Fejlesztő: SparkAudio · Jogosítvány: Apache 2.0
Próbáld ki.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Fejlesztő: RVC-Boss · Jogosítvány: MIT
Próbáld ki.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Fejlesztő: Canopy Labs · Jogosítvány: Llama 3.2 Community
Próbáld ki.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Fejlesztő: Alibaba (Qwen) · Jogosítvány: Apache 2.0
Próbáld ki.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Nyelvek: en, zh, ja, ko, fr, de, it, es
Klónhang
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Nyelvek: en, zh
Klónhang
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Nyelvek: en, zh
Klónhang
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Nyelvek: en, zh, ja, ko
Klónhang
Chatterbox
A legmodernebb zéró hangú klónozás érzelmi irányítással Resemble AI-tól.
Nyelvek: en
Klónhang
Tortoise TTS
A többhangú szövegtől a beszédig a minőségre koncentrált, autoregresszív architektúrával.
Nyelvek: en
Klónhang
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Nyelvek: en, zh, ja, ko, fr, de, es, it
Klónhang
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Nyelvek: en, zh, ja, ko, de, fr, ru, pt, es, it
KlónhangFejlesztő-első API
OpenAI-kompatibilis REST API. Egy végpont, 22+ modellek. Streaming támogatás valós idejű alkalmazások.
- OpenAI-kompatibilis formátum
- TTS közvetítés valós idejű alkalmazásokhoz
- Batch processing for large jobs
- Webhook értesítések
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Egyszerű, átlátható árképzés
Kezdd el, ahogy nősz.
Ingyenes
50 kredit
- Kokoro, Piper, VITS, MeloTTS
- 500 karakterhatár
- 3 ge/óra (nincs számla)
Indító
500 kredit/hó
- Mind a 22+ modell
- 5000 karakterhatár
- Hang klónozása
Pro
2000 kredit/hó
- Minden kezdőben
- API-hozzáférés
- Prioritású feldolgozás
Enterprise
10 000 kredit/hó
- Minden a Pro-ban
- Ömlesztett API
- Prioritási sor
Gyakran ismételt kérdések
Kezdd el használni az AI Voice-t ma
Csatlakozz az alkotókhoz, a fejlesztőkhöz és a TTS.ai-t használó vállalkozásokhoz