Wolny AI Tekst do mowy
22+ modele otwartego źródła, 100+ głosów, 32+ języki. Nie wymagane konto.
Wszystko, czego potrzebujesz do AI głosu
26 narzędzi zasilanych przez 24+ modele open-source AI
22+ Modele głosu AI
Najbardziej kompleksowa kolekcja modeli TTS otwartego źródła w jednej platformie
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Najlepsze dla: High-quality TTS with minimal latency, streaming applications
Spróbuj wolnoPiper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Najlepsze dla: Quick previews, accessibility, and embedded applications
Spróbuj wolnoVITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Najlepsze dla: General-purpose text-to-speech with natural prosody
Spróbuj wolnoMeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Najlepsze dla: Wnioski o produkcję wymagające szybkiego, wielojęzycznego TTS
Spróbuj wolnoBark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Rozwijacz: Suno · Licencja: MIT
Spróbuj.Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Rozwijacz: Suno · Licencja: MIT
Spróbuj.CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Rozwijacz: Alibaba (Tongyi Lab) · Licencja: Apache 2.0
Spróbuj.Dia TTS Standard
Model tworzenia dialogu wielogłośnika, który tworzy naturalne rozmowy między głośnikami.
Rozwijacz: Nari Labs · Licencja: Apache 2.0
Spróbuj.Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Rozwijacz: Hugging Face · Licencja: Apache 2.0
Spróbuj.IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Rozwijacz: Index Team · Licencja: Apache 2.0
Spróbuj.Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Rozwijacz: SparkAudio · Licencja: Apache 2.0
Spróbuj.GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Rozwijacz: RVC-Boss · Licencja: MIT
Spróbuj.Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Rozwijacz: Canopy Labs · Licencja: Llama 3.2 Community
Spróbuj.Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Rozwijacz: Alibaba (Qwen) · Licencja: Apache 2.0
Spróbuj.CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Języki: en, zh, ja, ko, fr, de, it, es
Głos klonowyIndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Języki: en, zh
Głos klonowySpark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Języki: en, zh
Głos klonowyGPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Języki: en, zh, ja, ko
Głos klonowyChatterbox
Najnowocześniejsze klonowanie głosu zerowego z kontrolą emocji z Resemble AI.
Języki: en
Głos klonowyTortoise TTS
Wielogłosowy tekst-to-speech skupiony na jakości z architekturą autoregresywną.
Języki: en
Głos klonowyOpenVoice
Natychmiastowe klonowanie głosu z granulową kontrolą stylu, emocji i akcentu.
Języki: en, zh, ja, ko, fr, de, es, it
Głos klonowyQwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Języki: en, zh, ja, ko, de, fr, ru, pt, es, it
Głos klonowyDeveloper- Pierwszy API
Kompatybilny z OpenAI REST API. Jeden punkt końcowy, modele 22+. Uciekanie wsparcia dla aplikacji w czasie rzeczywistym.
- Format kompatybilny z OpenAI
- Streaming TTS dla aplikacji w czasie rzeczywistym
- Przetwarzanie serii dla dużych zadań
- Powiadomienia Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Proste, przejrzyste ceny
Zacznij wolno.
Darmowe
50 kredytów
- Kokoro, Piper, VITS, MeloTTS
- Ograniczenie 500 znaków
- 3 gen/godz. (brak konta)
Rozpoczynacz
500 kredytów/miesiąc
- Wszystkie modele 22+
- Ograniczenie liczby 5000 znaków
- Klonowanie głosu
Prof.
2000 kredytów/miesiąc
- Wszystko w Starter
- Dostęp API
- Przetwarzanie priorytetowe
Przedsiębiorstwo
10 000 kredytów/miesiąc
- Wszystko w pro
- Masowy API
- Przyorytetowa kolejka
Często zadawane pytania
Zacznij używać AI Voice Dzisiaj
Dołącz do twórców, deweloperów i firm korzystających z TTS.ai