Δωρεάν AI Κείμενο σε λόγο

27+ μοντέλα ανοικτού κώδικα, 219+ φωνές, 33+ γλώσσες. Δεν απαιτείται λογαριασμός.

9K+
Δημιουργοί
37K+
γενιές
27+
Μοντέλα AI
219+
φωνές
0/500 χαρακτήρες · Sign up for 5,000 per generation → Ατελώς
Αγάπη TTS.ai; Πες στους φίλους σου!

Όλα όσα χρειάζεστε για τη Φωνή ΑΙ

30+ εργαλεία που κινούνται με μοντέλα AI ανοικτού κώδικα

27+ Φωνητικά Μοντέλα AI

Η πιο ολοκληρωμένη συλλογή μοντέλων TTS ανοικτού κώδικα σε μία πλατφόρμα

KokoroKokoro Ατελώς

Το Kokoro είναι ένα μοντέλο 82 εκατομμυρίων παραμέτρων κείμενο προς ομιλία που χτυπάει πολύ πάνω από την κατηγορία βάρους του. Παρά το μικρό του μέγεθος, παράγει αξιοσημείωτα φυσικό και εκφραστικό λόγο. Το Kokoro υποστηρίζει πολλές γλώσσες όπως αγγλικά, ιαπωνικά, κινεζικά και κορεάτικα με μια ποικιλία εκφραστικών φωνών.

Καλύτερα για: Υψηλής ποιότητας TTS με ελάχιστη καθυστέρηση, streaming εφαρμογές

Δοκιμάστε δωρεάν

PiperPiper Ατελώς

Η Piper είναι μια ελαφριά μηχανή κειμένου προς ομιλία που αναπτύχθηκε από Rasspy που χρησιμοποιεί VITS και αρχιτεκτονική λάρυγγα. Λειτουργεί εξ ολοκλήρου σε CPU, καθιστώντας την ιδανική για συσκευές άκρη, αυτοματισμού σπίτι, και εφαρμογές που απαιτούν offline TTS. Με πάνω από 100 φωνές σε 30+ γλώσσες, Piper παρέχει φυσικό-ηχητικό λόγο σε ταχύτητες σε πραγματικό χρόνο ακόμη και σε ένα Raspberry Pi 4.

Καλύτερα για: Γρήγορες προεπισκοπήσεις, προσβασιμότητα και ενσωματωμένες εφαρμογές

Δοκιμάστε δωρεάν

VITSVITS Ατελώς

Το VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) είναι μια παράλληλη μέθοδος end-to-end TTS που παράγει πιο φυσικό ήχο από τα τρέχοντα μοντέλα δύο σταδίων.

Καλύτερα για: text-to-speech γενικής χρήσης με φυσική προσθετικότητα

Δοκιμάστε δωρεάν

MeloTTSMeloTTS Ατελώς

MeloTTS by MyShell.ai είναι μια πολύγλωσση βιβλιοθήκη TTS που υποστηρίζει Αγγλικά (Αμερικάνικη, Βρετανική, Ινδική, Αυστραλιανή), Ισπανικά, Γαλλικά, Κινέζικα, Ιαπωνικά, και Κορεάτικα. Είναι εξαιρετικά γρήγορη, επεξεργασία κειμένου σε σχεδόν ταχύτητα σε πραγματικό χρόνο σε CPU μόνο.

Καλύτερα για: Εφαρμογές παραγωγής που χρειάζονται γρήγορη, πολύγλωσση TTS

Δοκιμάστε δωρεάν

OuteTTSOuteTTS Ατελώς

Το OutetTS επεκτείνει τα μεγάλα γλωσσικά μοντέλα με δυνατότητες κειμένου σε ομιλία, διατηρώντας παράλληλα την αρχική αρχιτεκτονική. Υποστηρίζει πολλαπλά backends συμπεριλαμβανομένων των llama.ccp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, και ακόμη και το συμπέρασμα browser μέσω Transformers.js. Διαθέτει μηδενική-shot φωνητική κλωνοποίηση μέσω προφίλ ηχείων που αποθηκεύονται ως JSON.

Καλύτερα για: Edge ανάπτυξη, με βάση το πρόγραμμα περιήγησης TTS, περιβάλλοντα χαμηλής πηγής

Δοκιμάστε δωρεάν

Pocket TTSPocket TTS Ατελώς

Pocket TTS από Kyutai (δημιουργοί του Moshi) είναι ένα συμπαγές μοντέλο παραμέτρων 100M κείμενο προς ομιλία που χτυπάει πολύ πάνω από το βάρος του. Τρέχει αποτελεσματικά σε CPU, υποστηρίζει μηδενική κλωνοποίηση φωνής από ένα ενιαίο δείγμα ήχου, και παράγει φυσικό-ηχητικό λόγο.

Καλύτερα για: Ελαφριά ανάπτυξη, περιβάλλοντα μόνο για CPU, γρήγορη κλωνοποίηση φωνής

Δοκιμάστε δωρεάν

Kitten TTSKitten TTS Ατελώς

Το Kitten TTS by KittenML είναι ένα εξαιρετικά ελαφρύ μοντέλο κειμένου προς ομιλία χτισμένο στο ONNX. Με παραλλαγές από 15M έως 80M παραμέτρους (25-80 MB στο δίσκο), παρέχει υψηλής ποιότητας σύνθεση φωνής σε CPU χωρίς να απαιτείται GPU. Διαθέτει 8 ενσωματωμένη φωνή, ρυθμιζόμενη ταχύτητα ομιλίας και ενσωματωμένη προεπεξεργασία κειμένου για αριθμούς, νομίσματα και μονάδες.

Καλύτερα για: Γρήγορη ελαφριά TTS, ανάπτυξη άκρων, εφαρμογές χαμηλής βαρύτητας

Δοκιμάστε δωρεάν

BarkBark Πρότυπο

Transformer-based text-to-audio μοντέλο που παράγει ρεαλιστική ομιλία, μουσική, και ηχητικά εφέ.

Προγραμματιστής: Suno · Άδεια: MIT

Δοκίμασέ το.

Bark SmallBark Small Πρότυπο

Ελαφρύτερη έκδοση του Μπαρκ με γρηγορότερο συμπέρασμα και χαμηλότερη χρήση μνήμης.

Προγραμματιστής: Suno · Άδεια: MIT

Δοκίμασέ το.

CosyVoice 2CosyVoice 2 Πρότυπο

Αλίμπαμπα κλιμακωτή ροή TTS με τη φύση του ανθρώπου-παροικίας και σχεδόν μηδέν καθυστέρηση.

Προγραμματιστής: Alibaba (Tongyi Lab) · Άδεια: Apache 2.0

Δοκίμασέ το.

Dia TTSDia TTS Πρότυπο

Multi-speaker μοντέλο γενεών διαλόγου που δημιουργεί φυσικές συνομιλίες μεταξύ των ηχείων.

Προγραμματιστής: Nari Labs · Άδεια: Apache 2.0

Δοκίμασέ το.

Parler TTSParler TTS Πρότυπο

Περιγράψτε τη φωνή που θέλετε στη φυσική γλώσσα και Parler παράγει αντίστοιχη ομιλία.

Προγραμματιστής: Hugging Face · Άδεια: Apache 2.0

Δοκίμασέ το.

GLM-TTSGLM-TTS Πρότυπο

Επιτυγχάνει το χαμηλότερο ποσοστό σφάλματος χαρακτήρα μεταξύ των μοντέλων TTS ανοικτού κώδικα.

Προγραμματιστής: Zhipu AI · Άδεια: GLM-4 License

Δοκίμασέ το.

IndexTTS-2IndexTTS-2 Πρότυπο

Zero-shot TTS με λεπτό γρανίτη έλεγχο συναισθημάτων και υψηλή εκφραστικότητα.

Προγραμματιστής: Index Team · Άδεια: Bilibili Model License

Δοκίμασέ το.

Spark TTSSpark TTS Πρότυπο

Φωνή κλωνοποίησης TTS με ελεγχόμενο συναίσθημα και στυλ ομιλίας μέσω υποκινήσεων.

Προγραμματιστής: SparkAudio · Άδεια: CC BY-NC-SA 4.0

Δοκίμασέ το.

GPT-SoVITSGPT-SoVITS Πρότυπο

Λίγη φωνή που κλωνοποιεί TTS που αναπαριστά οποιαδήποτε φωνή από μόλις 5 δευτερόλεπτα ήχου.

Προγραμματιστής: RVC-Boss · Άδεια: MIT

Δοκίμασέ το.

OrpheusOrpheus Πρότυπο

Ανθρώπινο επίπεδο συναισθηματικό μοντέλο TTS εκπαιδευμένο σε δεδομένα ομιλίας 100K ώρες.

Προγραμματιστής: Canopy Labs · Άδεια: Llama 3.2 Community

Δοκίμασέ το.

Qwen3 TTSQwen3 TTS Πρότυπο

Το πολύγλωσσο TTS της Alibaba με κλωνοποίηση φωνής, προεπιλεγμένες φωνές και σχέδιο φωνής από το κείμενο.

Προγραμματιστής: Alibaba (Qwen) · Άδεια: Apache 2.0

Δοκίμασέ το.

Chatterbox TurboChatterbox Turbo Πρότυπο

Γρήγορη Chatterbox με υπο-200ms καθυστέρηση και παραλγλωσσικές ετικέτες για γέλια, βήχα, και πολλά άλλα.

Προγραμματιστής: Resemble AI · Άδεια: MIT

Δοκίμασέ το.

VoxCPMVoxCPM Πρότυπο

Tokenizer-free TTS που παράγουν 44.1kHz ήχου με τη συνοχή παράγραφο πλαίσιο-aware.

Προγραμματιστής: OpenBMB · Άδεια: Apache 2.0

Δοκίμασέ το.

VibeVoiceVibeVoice Πρότυπο

Microsoft μοντέλο για μεγάλο-μορφό πολυ-ηχητικό περιεχόμενο όπως podcasts και ακουστικά βιβλία.

Προγραμματιστής: Microsoft · Άδεια: MIT

Δοκίμασέ το.

CosyVoice3CosyVoice3 Πρότυπο

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Προγραμματιστής: Alibaba (FunAudioLLM) · Άδεια: Apache 2.0

Δοκίμασέ το.

ChatterboxChatterbox Θετική πριμοδότηση

Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.

Ποιότητα:

Δοκίμασέ το.

Tortoise TTSTortoise TTS Θετική πριμοδότηση

Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.

Ποιότητα:

Δοκίμασέ το.

StyleTTS 2StyleTTS 2 Θετική πριμοδότηση

Ανθρώπινο επίπεδο κείμενο προς ομιλία μέσω της διάχυσης στυλ και αντιπερισπαστικής εκπαίδευσης.

Ποιότητα:

Δοκίμασέ το.

OpenVoiceOpenVoice Θετική πριμοδότηση

Άμεση κλωνοποίηση φωνής με κοκκώδη έλεγχο πάνω στο στυλ, το συναίσθημα και την προφορά.

Ποιότητα:

Δοκίμασέ το.

Sesame CSMSesame CSM Θετική πριμοδότηση

Μοντέλο συζήτησης ομιλίας που δημιουργεί φυσικό διάλογο με κατάλληλο συγχρονισμό και συναίσθημα.

Ποιότητα:

Δοκίμασέ το.

CosyVoice 2CosyVoice 2

Αλίμπαμπα κλιμακωτή ροή TTS με τη φύση του ανθρώπου-παροικίας και σχεδόν μηδέν καθυστέρηση.

Γλώσσες: en, zh, ja, ko, fr, de, it, es

Φωνή Κλώνου

GLM-TTSGLM-TTS

Επιτυγχάνει το χαμηλότερο ποσοστό σφάλματος χαρακτήρα μεταξύ των μοντέλων TTS ανοικτού κώδικα.

Γλώσσες: en, zh

Φωνή Κλώνου

IndexTTS-2IndexTTS-2

Zero-shot TTS με λεπτό γρανίτη έλεγχο συναισθημάτων και υψηλή εκφραστικότητα.

Γλώσσες: en, zh

Φωνή Κλώνου

Spark TTSSpark TTS

Φωνή κλωνοποίησης TTS με ελεγχόμενο συναίσθημα και στυλ ομιλίας μέσω υποκινήσεων.

Γλώσσες: en, zh

Φωνή Κλώνου

GPT-SoVITSGPT-SoVITS

Λίγη φωνή που κλωνοποιεί TTS που αναπαριστά οποιαδήποτε φωνή από μόλις 5 δευτερόλεπτα ήχου.

Γλώσσες: en, zh, ja, ko

Φωνή Κλώνου

ChatterboxChatterbox

Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.

Γλώσσες: en

Φωνή Κλώνου

Tortoise TTSTortoise TTS

Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.

Γλώσσες: en

Φωνή Κλώνου

OpenVoiceOpenVoice

Άμεση κλωνοποίηση φωνής με κοκκώδη έλεγχο πάνω στο στυλ, το συναίσθημα και την προφορά.

Γλώσσες: en, zh, ja, ko, fr, de, es, it

Φωνή Κλώνου

Qwen3 TTSQwen3 TTS

Το πολύγλωσσο TTS της Alibaba με κλωνοποίηση φωνής, προεπιλεγμένες φωνές και σχέδιο φωνής από το κείμενο.

Γλώσσες: en, zh, ja, ko, de, fr, ru, pt, es, it

Φωνή Κλώνου

Chatterbox TurboChatterbox Turbo

Γρήγορη Chatterbox με υπο-200ms καθυστέρηση και παραλγλωσσικές ετικέτες για γέλια, βήχα, και πολλά άλλα.

Γλώσσες: en

Φωνή Κλώνου

VoxCPMVoxCPM

Tokenizer-free TTS που παράγουν 44.1kHz ήχου με τη συνοχή παράγραφο πλαίσιο-aware.

Γλώσσες: en, zh

Φωνή Κλώνου

OuteTTSOuteTTS

LLM-based TTS που τρέχει σε CPU, GPU, ή browser μέσω llama.ccp και Transformers.js.

Γλώσσες: en

Φωνή Κλώνου

Pocket TTSPocket TTS

Ελαφρύ μοντέλο παραμέτρου 100M από την Kyutai με κλωνοποίηση φωνής από ένα μόνο δείγμα.

Γλώσσες: en, fr

Φωνή Κλώνου

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Γλώσσες: en, zh, ja, ko, de, es, fr, it, ru

Φωνή Κλώνου

Προγραμματιστής-Πρώτο API

OpenAI συμβατό REST API. Ένα τελικό σημείο, 22+ μοντέλα.

  • Μορφότυπος συμβατός με το OpenAI
  • Streaming TTS για εφαρμογές σε πραγματικό χρόνο
  • Επεξεργασία παρτίδας για μεγάλες θέσεις εργασίας
  • Γνωστοποιήσεις για το WebhookName
Προβολή Docs API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Απλή, Διαφανής Τιμή

Ξεκινήστε ελεύθερα, όσο μεγαλώνετε.

Ατελώς

$0

15 πιστώσεις

  • Kokoro, Piper, VITS, MeloTTS
  • όριο 500 χαρακτήρων
  • 3 γεν/ώρα (χωρίς λογαριασμό)
Εγγραφή δωρεάν

Εκκίνηση

$9/ου

500 πιστώσεις/μήνα

  • Όλα τα μοντέλα 22+
  • 100,000 chars ανά γενιά
  • Κλωνοποίηση φωνής
Ξεκινήστε
Πιο Δημοφιλή

Pro

$29/ου

2.000 πιστώσεις/μήνας

  • Τα πάντα στο Starter
  • Πρόσβαση API
  • Επεξεργασία προτεραιότητας
Πάρτε Pro

Επιχειρήσεις

$99/ου

10,000 πιστώσεις/μήνας

  • Τα πάντα σε Pro
  • Μαζική API
  • Σειρά προτεραιότητας
Βρες δουλειά.

Προβολή όλων των σχεδίων συμπεριλαμβανομένων των πακέτων χαρακτήρων →

Συχνές Ερωτήσεις

TTS.ai είναι η πιο ολοκληρωμένη πλατφόρμα φωνής AI, προσφέροντας 22+ μοντέλα κειμένου σε ομιλία, κλωνοποίησης φωνής, ομιλίας σε κείμενο, και ηχητικά εργαλεία.

Ναι! TTS.ai προσφέρει δωρεάν κείμενο προς ομιλία με Kokoro, Piper, VITS, και MeloTTS μοντέλα. Δεν απαιτείται λογαριασμός. Εγγραφείτε για να πάρετε 15.000 δωρεάν χαρακτήρες και πρόσβαση σε όλα τα μοντέλα.

Για την ταχύτητα, χρησιμοποιήστε το Kokoro ή Piper. Για την ποιότητα, δοκιμάστε CosyVoice 2 ή Styletts 2. Για την κλωνοποίηση φωνής, χρησιμοποιήστε το Chatterbox ή το GPT-SoVITS. Για το διάλογο, χρησιμοποιήστε το Dia TTS. Δοκιμάστε πολλαπλά μοντέλα στο ίδιο κείμενο για να συγκρίνετε.

Ναι. OpenAI Συμβατό REST API για TTS, STT, κλωνοποίηση φωνής, και ηχητικά εργαλεία. Διατίθεται σε Pro (29/mo) και Enterprise ($99/mo) σχέδια. Δείτε τα έγγραφα στο tts.ai/api/.

Η ποιότητα της φωνής ποικίλλει ανάλογα με το μοντέλο. Premium μοντέλα όπως η CosyVoice 2, το Styletts 2, και το Chatterbox παράγουν σχεδόν ανθρώπινη ποιότητα ομιλίας με φυσικό τονισμό και το συναίσθημα.

TTS.ai υποστηρίζει 30+ γλώσσες σε όλη τη βιβλιοθήκη του μοντέλου. Αγγλικά έχει την ευρύτερη υποστήριξη μοντέλο, αλλά μοντέλα όπως CosyVoice 2 καλύπτουν κινέζικα, ιαπωνικά, και Κορεάτικα; GPT-SoVITS χειρίζεται κινέζικα, ιαπωνικά, κορεάτικα, και αγγλικά; και MeloTTS υποστηρίζει αγγλικά, ισπανικά, γαλλικά, κινεζικά, ιαπωνικά, και κορεάτικα.

Ναι. Όλη η επεξεργασία συμβαίνει στους ειδικούς διακομιστές GPU μας. Δεν αποθηκεύουμε την εισαγωγή του κειμένου σας ή την παραγωγή ήχου μετά την παράδοση. Ανεβάστε τα δείγματα φωνής για την κλωνοποίηση χρησιμοποιούνται μόνο για την τρέχουσα συνεδρία και δεν διατηρούνται. Ποτέ δεν μοιραζόμαστε τα δεδομένα σας με τρίτους ή τα χρησιμοποιούμε για να εκπαιδεύσουμε μοντέλα.

Ναι. Όλος ο ήχος που παράγεται στις TTS.ai είναι δικός σας για να χρησιμοποιήσετε εμπορικά, συμπεριλαμβανομένων για το YouTube βίντεο, podcasts, ακουστικά βιβλία, εφαρμογές, διαφημίσεις και προϊόντα. Τα μοντέλα μας είναι ανοιχτή πηγή κάτω από ανεκτικές άδειες (MIT, Apache 2.0). Δεν απαιτείται δικαιώματα ή απόδοση.

TTS.ai δημιουργεί ήχου σε μορφή WAV από προεπιλογή για τη μέγιστη ποιότητα. Μπορείτε να μετατρέψετε σε MP3, FLAC, OGG, ή M4A χρησιμοποιώντας δωρεάν εργαλείο Audio Converter μας.

Ανεβάστε ένα σύντομο δείγμα ήχου (τουλάχιστον 5 δευτερόλεπτα) της φωνής που θέλετε να κλωνοποιήσετε, στη συνέχεια πληκτρολογήστε οποιοδήποτε κείμενο για να δημιουργήσετε ομιλία σε αυτή τη φωνή. Μοντέλα όπως Chatterbox, GPT-SoVITS, και CosyVoice 2 υποστήριξη κλωνοποίησης φωνής.

Τα δωρεάν μοντέλα (Kokoro, Piper, VITS, MeloTTS) δεν απαιτούν λογαριασμούς και δεν κοστίζουν τίποτα χαρακτήρες. Τα πρότυπα μοντέλα (2.000 χαρακτήρες/1K input) περιλαμβάνουν Bark, CosyVoice 2, F5-TTS, και Dia. Premium μοντέλα (4.000 χαρακτήρες/1K input) περιλαμβάνουν OpenVoice, Chatterbox, StyleTTS 2, και Tortoise. Τα μοντέλα paid προσφέρουν γενικά υψηλότερη ποιότητα, περισσότερες φωνές και πρόσθετα χαρακτηριστικά όπως η κλωνοποίηση φωνής.

Ναι. Το API υποστηρίζει την επεξεργασία παρτίδα για τη μετατροπή μεγάλου όγκου του κειμένου σε ομιλία. Υποβάλετε πολλαπλές αιτήσεις και να ανακτήσει τα αποτελέσματα ασύγχρονα χρησιμοποιώντας UUIDs εργασίας. Επιχειρηματικά σχέδια ($99/mo) περιλαμβάνουν προτεραιότητα ουρά πρόσβαση για ταχύτερη επεξεργασία παρτίδα. Ιδανικό για την παραγωγή ακουστικών βιβλίων, περιεχόμενο μαθημάτων, και μεγάλης κλίμακας έργα φωνητική.
4.0/5 (23)

Τι θα μπορούσαμε να βελτιώσουμε; Τα σχόλιά σας μάς βοηθούν να διορθώσουμε τα ζητήματα.

Ξεκίνα να χρησιμοποιείς τη φωνή της Αλ σήμερα.

Ενωθείτε δημιουργοί, προγραμματιστές και επιχειρήσεις χρησιμοποιώντας TTS.ai