Δωρεάν AI Κείμενο σε λόγο

20+ μοντέλα ανοικτού κώδικα, 107+ φωνές, 32+ γλώσσες. Δεν απαιτείται λογαριασμός.

1K+
Δημιουργοί
2K+
γενιές
20+
Μοντέλα AI
107+
φωνές
0/500 χαρακτήρες Ατελώς
Like TTS.ai? Tell your friends!

Όλα όσα χρειάζεστε για τη Φωνή ΑΙ

30+ εργαλεία που κινούνται με μοντέλα AI ανοικτού κώδικα

20+ Φωνητικά Μοντέλα AI

Η πιο ολοκληρωμένη συλλογή μοντέλων TTS ανοικτού κώδικα σε μία πλατφόρμα

KokoroKokoro Free

Το Kokoro είναι ένα μοντέλο 82 εκατομμυρίων παραμέτρων κείμενο προς ομιλία που χτυπάει πολύ πάνω από την κατηγορία βάρους του. Παρά το μικρό του μέγεθος, παράγει αξιοσημείωτα φυσικό και εκφραστικό λόγο. Το Kokoro υποστηρίζει πολλές γλώσσες όπως αγγλικά, ιαπωνικά, κινεζικά και κορεάτικα με μια ποικιλία εκφραστικών φωνών.

Καλύτερα για: Υψηλής ποιότητας TTS με ελάχιστη καθυστέρηση, streaming εφαρμογές

Δοκιμάστε δωρεάν

PiperPiper Free

Η Piper είναι μια ελαφριά μηχανή κειμένου προς ομιλία που αναπτύχθηκε από Rasspy που χρησιμοποιεί VITS και αρχιτεκτονική λάρυγγα. Λειτουργεί εξ ολοκλήρου σε CPU, καθιστώντας την ιδανική για συσκευές άκρη, αυτοματισμού σπίτι, και εφαρμογές που απαιτούν offline TTS. Με πάνω από 100 φωνές σε 30+ γλώσσες, Piper παρέχει φυσικό-ηχητικό λόγο σε ταχύτητες σε πραγματικό χρόνο ακόμη και σε ένα Raspberry Pi 4.

Καλύτερα για: Γρήγορες προεπισκοπήσεις, προσβασιμότητα και ενσωματωμένες εφαρμογές

Δοκιμάστε δωρεάν

VITSVITS Free

Το VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) είναι μια παράλληλη μέθοδος end-to-end TTS που παράγει πιο φυσικό ήχο από τα τρέχοντα μοντέλα δύο σταδίων.

Καλύτερα για: text-to-speech γενικής χρήσης με φυσική προσθετικότητα

Δοκιμάστε δωρεάν

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai είναι μια πολύγλωσση βιβλιοθήκη TTS που υποστηρίζει Αγγλικά (Αμερικάνικη, Βρετανική, Ινδική, Αυστραλιανή), Ισπανικά, Γαλλικά, Κινέζικα, Ιαπωνικά, και Κορεάτικα. Είναι εξαιρετικά γρήγορη, επεξεργασία κειμένου σε σχεδόν ταχύτητα σε πραγματικό χρόνο σε CPU μόνο.

Καλύτερα για: Εφαρμογές παραγωγής που χρειάζονται γρήγορη, πολύγλωσση TTS

Δοκιμάστε δωρεάν

BarkBark Standard

Transformer-based text-to-audio μοντέλο που παράγει ρεαλιστική ομιλία, μουσική, και ηχητικά εφέ.

Προγραμματιστής: Suno · Άδεια: MIT

Δοκίμασέ το.

Bark SmallBark Small Standard

Ελαφρύτερη έκδοση του Μπαρκ με γρηγορότερο συμπέρασμα και χαμηλότερη χρήση μνήμης.

Προγραμματιστής: Suno · Άδεια: MIT

Δοκίμασέ το.

CosyVoice 2CosyVoice 2 Standard

Αλίμπαμπα κλιμακωτή ροή TTS με τη φύση του ανθρώπου-παροικίας και σχεδόν μηδέν καθυστέρηση.

Προγραμματιστής: Alibaba (Tongyi Lab) · Άδεια: Apache 2.0

Δοκίμασέ το.

Dia TTSDia TTS Standard

Multi-speaker μοντέλο γενεών διαλόγου που δημιουργεί φυσικές συνομιλίες μεταξύ των ηχείων.

Προγραμματιστής: Nari Labs · Άδεια: Apache 2.0

Δοκίμασέ το.

Parler TTSParler TTS Standard

Περιγράψτε τη φωνή που θέλετε στη φυσική γλώσσα και Parler παράγει αντίστοιχη ομιλία.

Προγραμματιστής: Hugging Face · Άδεια: Apache 2.0

Δοκίμασέ το.

GLM-TTSGLM-TTS Standard

Επιτυγχάνει το χαμηλότερο ποσοστό σφάλματος χαρακτήρα μεταξύ των μοντέλων TTS ανοικτού κώδικα.

Προγραμματιστής: Zhipu AI · Άδεια: GLM-4 License

Δοκίμασέ το.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS με λεπτό γρανίτη έλεγχο συναισθημάτων και υψηλή εκφραστικότητα.

Προγραμματιστής: Index Team · Άδεια: Bilibili Model License

Δοκίμασέ το.

Spark TTSSpark TTS Standard

Φωνή κλωνοποίησης TTS με ελεγχόμενο συναίσθημα και στυλ ομιλίας μέσω υποκινήσεων.

Προγραμματιστής: SparkAudio · Άδεια: CC BY-NC-SA 4.0

Δοκίμασέ το.

GPT-SoVITSGPT-SoVITS Standard

Λίγη φωνή που κλωνοποιεί TTS που αναπαριστά οποιαδήποτε φωνή από μόλις 5 δευτερόλεπτα ήχου.

Προγραμματιστής: RVC-Boss · Άδεια: MIT

Δοκίμασέ το.

OrpheusOrpheus Standard

Ανθρώπινο επίπεδο συναισθηματικό μοντέλο TTS εκπαιδευμένο σε δεδομένα ομιλίας 100K ώρες.

Προγραμματιστής: Canopy Labs · Άδεια: Llama 3.2 Community

Δοκίμασέ το.

Qwen3 TTSQwen3 TTS Standard

Το πολύγλωσσο TTS της Alibaba με κλωνοποίηση φωνής, προεπιλεγμένες φωνές και σχέδιο φωνής από το κείμενο.

Προγραμματιστής: Alibaba (Qwen) · Άδεια: Apache 2.0

Δοκίμασέ το.

ChatterboxChatterbox Premium

Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.

Ποιότητα:

Δοκίμασέ το.

Tortoise TTSTortoise TTS Premium

Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.

Ποιότητα:

Δοκίμασέ το.

StyleTTS 2StyleTTS 2 Premium

Ανθρώπινο επίπεδο κείμενο προς ομιλία μέσω της διάχυσης στυλ και αντιπερισπαστικής εκπαίδευσης.

Ποιότητα:

Δοκίμασέ το.

OpenVoiceOpenVoice Premium

Άμεση κλωνοποίηση φωνής με κοκκώδη έλεγχο πάνω στο στυλ, το συναίσθημα και την προφορά.

Ποιότητα:

Δοκίμασέ το.

Sesame CSMSesame CSM Premium

Μοντέλο συζήτησης ομιλίας που δημιουργεί φυσικό διάλογο με κατάλληλο συγχρονισμό και συναίσθημα.

Ποιότητα:

Δοκίμασέ το.

CosyVoice 2CosyVoice 2

Αλίμπαμπα κλιμακωτή ροή TTS με τη φύση του ανθρώπου-παροικίας και σχεδόν μηδέν καθυστέρηση.

Γλώσσες: en, zh, ja, ko, fr, de, it, es

Φωνή Κλώνου

GLM-TTSGLM-TTS

Επιτυγχάνει το χαμηλότερο ποσοστό σφάλματος χαρακτήρα μεταξύ των μοντέλων TTS ανοικτού κώδικα.

Γλώσσες: en, zh

Φωνή Κλώνου

IndexTTS-2IndexTTS-2

Zero-shot TTS με λεπτό γρανίτη έλεγχο συναισθημάτων και υψηλή εκφραστικότητα.

Γλώσσες: en, zh

Φωνή Κλώνου

Spark TTSSpark TTS

Φωνή κλωνοποίησης TTS με ελεγχόμενο συναίσθημα και στυλ ομιλίας μέσω υποκινήσεων.

Γλώσσες: en, zh

Φωνή Κλώνου

GPT-SoVITSGPT-SoVITS

Λίγη φωνή που κλωνοποιεί TTS που αναπαριστά οποιαδήποτε φωνή από μόλις 5 δευτερόλεπτα ήχου.

Γλώσσες: en, zh, ja, ko

Φωνή Κλώνου

ChatterboxChatterbox

Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.

Γλώσσες: en

Φωνή Κλώνου

Tortoise TTSTortoise TTS

Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.

Γλώσσες: en

Φωνή Κλώνου

OpenVoiceOpenVoice

Άμεση κλωνοποίηση φωνής με κοκκώδη έλεγχο πάνω στο στυλ, το συναίσθημα και την προφορά.

Γλώσσες: en, zh, ja, ko, fr, de, es, it

Φωνή Κλώνου

Qwen3 TTSQwen3 TTS

Το πολύγλωσσο TTS της Alibaba με κλωνοποίηση φωνής, προεπιλεγμένες φωνές και σχέδιο φωνής από το κείμενο.

Γλώσσες: en, zh, ja, ko, de, fr, ru, pt, es, it

Φωνή Κλώνου

Προγραμματιστής-Πρώτο API

OpenAI συμβατό REST API. Ένα τελικό σημείο, 22+ μοντέλα.

  • Μορφότυπος συμβατός με το OpenAI
  • Streaming TTS για εφαρμογές σε πραγματικό χρόνο
  • Επεξεργασία παρτίδας για μεγάλες θέσεις εργασίας
  • Γνωστοποιήσεις για το WebhookName
Προβολή Docs API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Απλή, Διαφανής Τιμή

Ξεκινήστε ελεύθερα, όσο μεγαλώνετε.

Ατελώς

$0

15 πιστώσεις

  • Kokoro, Piper, VITS, MeloTTS
  • όριο 500 χαρακτήρων
  • 3 γεν/ώρα (χωρίς λογαριασμό)
Εγγραφή δωρεάν

Εκκίνηση

$9/ου

500 πιστώσεις/μήνα

  • Όλα τα μοντέλα 22+
  • 100,000 chars ανά γενιά
  • Κλωνοποίηση φωνής
Ξεκινήστε
Πιο Δημοφιλή

Pro

$29/ου

2.000 πιστώσεις/μήνας

  • Τα πάντα στο Starter
  • Πρόσβαση API
  • Επεξεργασία προτεραιότητας
Πάρτε Pro

Επιχειρήσεις

$99/ου

10,000 πιστώσεις/μήνας

  • Τα πάντα σε Pro
  • Μαζική API
  • Σειρά προτεραιότητας
Βρες δουλειά.

Προβολή όλων των σχεδίων συμπεριλαμβανομένων των πακέτων χαρακτήρων →

Συχνές Ερωτήσεις

TTS.ai είναι η πιο ολοκληρωμένη πλατφόρμα φωνής AI, προσφέροντας 22+ μοντέλα κειμένου προς ομιλία, κλωνοποίηση φωνής, ομιλία προς κείμενο, και ακουστικά εργαλεία.

Ναι! TTS.ai προσφέρει δωρεάν κείμενο προς ομιλία με Kokoro, Piper, VITS, και MeloTTS μοντέλα. Δεν απαιτείται λογαριασμός. Εγγραφείτε για να πάρετε 15.000 δωρεάν χαρακτήρες και πρόσβαση σε όλα τα μοντέλα.

Για την ταχύτητα, χρησιμοποιήστε το Kokoro ή Piper. Για την ποιότητα, δοκιμάστε CosyVoice 2 ή Styletts 2. Για την κλωνοποίηση φωνής, χρησιμοποιήστε το Chatterbox ή το GPT-SoVITS. Για το διάλογο, χρησιμοποιήστε το Dia TTS. Δοκιμάστε πολλαπλά μοντέλα στο ίδιο κείμενο για να συγκρίνετε.

Ναι. OpenAI Συμβατό REST API για TTS, STT, κλωνοποίηση φωνής, και ηχητικά εργαλεία. Διατίθεται σε Pro (29/mo) και Enterprise ($99/mo) σχέδια. Δείτε τα έγγραφα στο tts.ai/api/.

Η ποιότητα της φωνής ποικίλλει ανάλογα με το μοντέλο. Premium μοντέλα όπως η CosyVoice 2, το Styletts 2, και το Chatterbox παράγουν σχεδόν ανθρώπινη ποιότητα ομιλίας με φυσικό τονισμό και το συναίσθημα.

Η TTS.ai υποστηρίζει 30+ γλώσσες σε όλη τη βιβλιοθήκη του μοντέλου. Αγγλικά έχει την ευρύτερη υποστήριξη μοντέλο, αλλά μοντέλα όπως CosyVoice 2 καλύπτουν κινέζικα, ιαπωνικά, και Κορεάτικα; GPT-SoVITS χειρίζεται κινέζικα, ιαπωνικά, κορεάτικα και αγγλικά; και MeloTTS υποστηρίζει αγγλικά, ισπανικά, γαλλικά, κινεζικά, ιαπωνικά και κορεάτικα.

Ναι. Όλη η επεξεργασία συμβαίνει στους ειδικούς διακομιστές GPU μας. Δεν αποθηκεύουμε την εισαγωγή του κειμένου σας ή την παραγωγή ήχου μετά την παράδοση. Ανεβάστε τα δείγματα φωνής για την κλωνοποίηση χρησιμοποιούνται μόνο για την τρέχουσα συνεδρία και δεν διατηρούνται. Ποτέ δεν μοιραζόμαστε τα δεδομένα σας με τρίτους ή τα χρησιμοποιούμε για να εκπαιδεύσουμε μοντέλα.

Ναι. Όλος ο ήχος που παράγεται στις TTS.ai είναι δικός σας για να χρησιμοποιήσετε εμπορικά, συμπεριλαμβανομένων για το YouTube βίντεο, podcasts, ακουστικά βιβλία, εφαρμογές, διαφημίσεις και προϊόντα. Τα μοντέλα μας είναι ανοιχτή πηγή κάτω από ανεκτικές άδειες (MIT, Apache 2.0). Δεν απαιτείται δικαιώματα ή απόδοση.

TTS.ai παράγει ήχου σε μορφή WAV από προεπιλογή για τη μέγιστη ποιότητα. Μπορείτε να μετατρέψετε σε MP3, FLAC, OGG, ή M4A χρησιμοποιώντας δωρεάν Audio Converter εργαλείο μας.

Ανεβάστε ένα σύντομο δείγμα ήχου (τουλάχιστον 5 δευτερόλεπτα) της φωνής που θέλετε να κλωνοποιήσετε, στη συνέχεια πληκτρολογήστε οποιοδήποτε κείμενο για να δημιουργήσετε ομιλία σε αυτή τη φωνή. Μοντέλα όπως Chatterbox, GPT-SoVITS, και CosyVoice 2 υποστήριξη κλωνοποίησης φωνής.

Τα δωρεάν μοντέλα (Kokoro, Piper, VITS, MeloTTS) δεν απαιτούν λογαριασμούς και δεν κοστίζουν τίποτα χαρακτήρες. Τα πρότυπα μοντέλα (2.000 χαρακτήρες/1K input) περιλαμβάνουν Bark, CosyVoice 2, F5-TTS, και Dia. Premium μοντέλα (4.000 χαρακτήρες/1K input) περιλαμβάνουν OpenVoice, Chatterbox, StyleTTS 2, και Tortoise. Τα μοντέλα paid προσφέρουν γενικά υψηλότερη ποιότητα, περισσότερες φωνές και πρόσθετα χαρακτηριστικά όπως η κλωνοποίηση φωνής.

Ναι. Το API υποστηρίζει την επεξεργασία παρτίδα για τη μετατροπή μεγάλου όγκου του κειμένου σε ομιλία. Υποβάλετε πολλαπλές αιτήσεις και να ανακτήσει τα αποτελέσματα ασύγχρονα χρησιμοποιώντας UUIDs εργασίας. Επιχειρηματικά σχέδια ($99/mo) περιλαμβάνουν προτεραιότητα ουρά πρόσβαση για ταχύτερη επεξεργασία παρτίδα. Ιδανικό για την παραγωγή ακουστικών βιβλίων, περιεχόμενο μαθημάτων, και μεγάλης κλίμακας έργα φωνητική.
4.0/5 (8)

Ξεκίνα να χρησιμοποιείς τη φωνή της Αλ σήμερα.

Ενωθείτε δημιουργοί, προγραμματιστές και επιχειρήσεις χρησιμοποιώντας TTS.ai