Δωρεάν AI Κείμενο σε λόγο
22+ μοντέλα ανοικτού κώδικα, 100+ φωνές, 32+ γλώσσες. Δεν απαιτείται λογαριασμός.
Όλα όσα χρειάζεστε για τη Φωνή ΑΙ
26 εργαλεία powered by 24+ open-source AI μοντέλα
22+ Μοντέλα φωνής AI
Η πιο ολοκληρωμένη συλλογή μοντέλων TTS ανοικτού κώδικα σε μία πλατφόρμα
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Καλύτερα για: High-quality TTS with minimal latency, streaming applications
Δοκιμάστε δωρεάν
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Καλύτερα για: Quick previews, accessibility, and embedded applications
Δοκιμάστε δωρεάν
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Καλύτερα για: General-purpose text-to-speech with natural prosody
Δοκιμάστε δωρεάν
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Καλύτερα για: Εφαρμογές παραγωγής που χρειάζονται γρήγορη, πολύγλωσση TTS
Δοκιμάστε δωρεάν
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Προγραμματιστής: Suno · Άδεια: MIT
Δοκίμασέ το.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Προγραμματιστής: Suno · Άδεια: MIT
Δοκίμασέ το.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Προγραμματιστής: Alibaba (Tongyi Lab) · Άδεια: Apache 2.0
Δοκίμασέ το.
Dia TTS Standard
Multi-speaker μοντέλο γενεών διαλόγου που δημιουργεί φυσικές συνομιλίες μεταξύ των ηχείων.
Προγραμματιστής: Nari Labs · Άδεια: Apache 2.0
Δοκίμασέ το.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Προγραμματιστής: Hugging Face · Άδεια: Apache 2.0
Δοκίμασέ το.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Προγραμματιστής: Index Team · Άδεια: Apache 2.0
Δοκίμασέ το.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Προγραμματιστής: SparkAudio · Άδεια: Apache 2.0
Δοκίμασέ το.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Προγραμματιστής: RVC-Boss · Άδεια: MIT
Δοκίμασέ το.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Προγραμματιστής: Canopy Labs · Άδεια: Llama 3.2 Community
Δοκίμασέ το.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Προγραμματιστής: Alibaba (Qwen) · Άδεια: Apache 2.0
Δοκίμασέ το.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Γλώσσες: en, zh, ja, ko, fr, de, it, es
Φωνή Κλώνου
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Γλώσσες: en, zh
Φωνή Κλώνου
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Γλώσσες: en, zh
Φωνή Κλώνου
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Γλώσσες: en, zh, ja, ko
Φωνή Κλώνου
Chatterbox
Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.
Γλώσσες: en
Φωνή Κλώνου
Tortoise TTS
Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.
Γλώσσες: en
Φωνή Κλώνου
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Γλώσσες: en, zh, ja, ko, fr, de, es, it
Φωνή Κλώνου
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Γλώσσες: en, zh, ja, ko, de, fr, ru, pt, es, it
Φωνή ΚλώνουΠρογραμματιστής-Πρώτο API
OpenAI συμβατό REST API. Ένα τελικό σημείο, 22+ μοντέλα.
- Μορφότυπος συμβατός με το OpenAI
- Streaming TTS για εφαρμογές σε πραγματικό χρόνο
- Επεξεργασία παρτίδας για μεγάλες θέσεις εργασίας
- Γνωστοποιήσεις για το WebhookName
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Απλή, Διαφανής Τιμή
Ξεκινήστε ελεύθερα, όσο μεγαλώνετε.
Ατελώς
50 πιστώσεις
- Kokoro, Piper, VITS, MeloTTS
- όριο 500 χαρακτήρων
- 3 γεν/ώρα (χωρίς λογαριασμό)
Εκκίνηση
500 πιστώσεις/μήνα
- Όλα τα μοντέλα 22+
- όριο 5.000 χαρακτήρων
- Κλωνοποίηση φωνής
Pro
2.000 πιστώσεις/μήνας
- Τα πάντα στο Starter
- Πρόσβαση API
- Επεξεργασία προτεραιότητας
ΕντερπράιζCity name (optional, probably does not need a translation)
10,000 πιστώσεις/μήνας
- Τα πάντα σε Pro
- Μαζική API
- Σειρά προτεραιότητας
Συχνές Ερωτήσεις
Ξεκίνα να χρησιμοποιείς τη φωνή της Αλ σήμερα.
Ενταχθείτε δημιουργοί, προγραμματιστές, και επιχειρήσεις χρησιμοποιώντας TTS.ai