Δωρεάν AI Κείμενο σε λόγο

22+ μοντέλα ανοικτού κώδικα, 100+ φωνές, 32+ γλώσσες. Δεν απαιτείται λογαριασμός.

0/500 χαρακτήρες Ατελώς
Χωρίς πιστωτική κάρτα 50 δωρεάν πιστώσεις 32+ γλώσσες Εμπορική χρήση OK
0:00 / 0:00
Λήψη ήχου Η σύνδεση λήγει σε 24 ώρες
Πες το στους φίλους σου!

Όλα όσα χρειάζεστε για τη Φωνή ΑΙ

26 εργαλεία powered by 24+ open-source AI μοντέλα

22+ Μοντέλα φωνής AI

Η πιο ολοκληρωμένη συλλογή μοντέλων TTS ανοικτού κώδικα σε μία πλατφόρμα

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Καλύτερα για: High-quality TTS with minimal latency, streaming applications

Δοκιμάστε δωρεάν

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Καλύτερα για: Quick previews, accessibility, and embedded applications

Δοκιμάστε δωρεάν

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Καλύτερα για: General-purpose text-to-speech with natural prosody

Δοκιμάστε δωρεάν

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Καλύτερα για: Εφαρμογές παραγωγής που χρειάζονται γρήγορη, πολύγλωσση TTS

Δοκιμάστε δωρεάν

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Προγραμματιστής: Suno · Άδεια: MIT

Δοκίμασέ το.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Προγραμματιστής: Suno · Άδεια: MIT

Δοκίμασέ το.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Προγραμματιστής: Alibaba (Tongyi Lab) · Άδεια: Apache 2.0

Δοκίμασέ το.

Dia TTSDia TTS Standard

Multi-speaker μοντέλο γενεών διαλόγου που δημιουργεί φυσικές συνομιλίες μεταξύ των ηχείων.

Προγραμματιστής: Nari Labs · Άδεια: Apache 2.0

Δοκίμασέ το.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Προγραμματιστής: Hugging Face · Άδεια: Apache 2.0

Δοκίμασέ το.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Προγραμματιστής: Index Team · Άδεια: Apache 2.0

Δοκίμασέ το.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Προγραμματιστής: SparkAudio · Άδεια: Apache 2.0

Δοκίμασέ το.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Προγραμματιστής: RVC-Boss · Άδεια: MIT

Δοκίμασέ το.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Προγραμματιστής: Canopy Labs · Άδεια: Llama 3.2 Community

Δοκίμασέ το.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Προγραμματιστής: Alibaba (Qwen) · Άδεια: Apache 2.0

Δοκίμασέ το.

ChatterboxChatterbox Premium

Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.

Ποιότητα:

Δοκίμασέ το.

Tortoise TTSTortoise TTS Premium

Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.

Ποιότητα:

Δοκίμασέ το.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Ποιότητα:

Δοκίμασέ το.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Ποιότητα:

Δοκίμασέ το.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Γλώσσες: en, zh, ja, ko, fr, de, it, es

Φωνή Κλώνου

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Γλώσσες: en, zh

Φωνή Κλώνου

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Γλώσσες: en, zh

Φωνή Κλώνου

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Γλώσσες: en, zh, ja, ko

Φωνή Κλώνου

ChatterboxChatterbox

Η τελευταία λέξη της τεχνολογίας είναι η μηδενική κλωνοποίηση φωνής με συναισθηματικό έλεγχο από το Resemble AI.

Γλώσσες: en

Φωνή Κλώνου

Tortoise TTSTortoise TTS

Πολυφωνική κείμενο σε ομιλία επικεντρώθηκε στην ποιότητα με την αυτοκαταστροφική αρχιτεκτονική.

Γλώσσες: en

Φωνή Κλώνου

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Γλώσσες: en, zh, ja, ko, fr, de, es, it

Φωνή Κλώνου

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Γλώσσες: en, zh, ja, ko, de, fr, ru, pt, es, it

Φωνή Κλώνου

Προγραμματιστής-Πρώτο API

OpenAI συμβατό REST API. Ένα τελικό σημείο, 22+ μοντέλα.

  • Μορφότυπος συμβατός με το OpenAI
  • Streaming TTS για εφαρμογές σε πραγματικό χρόνο
  • Επεξεργασία παρτίδας για μεγάλες θέσεις εργασίας
  • Γνωστοποιήσεις για το WebhookName
Προβολή Docs API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Απλή, Διαφανής Τιμή

Ξεκινήστε ελεύθερα, όσο μεγαλώνετε.

Ατελώς

$0

50 πιστώσεις

  • Kokoro, Piper, VITS, MeloTTS
  • όριο 500 χαρακτήρων
  • 3 γεν/ώρα (χωρίς λογαριασμό)
Εγγραφή δωρεάν

Εκκίνηση

$9/ου

500 πιστώσεις/μήνα

  • Όλα τα μοντέλα 22+
  • όριο 5.000 χαρακτήρων
  • Κλωνοποίηση φωνής
Ξεκινήστε
Πιο Δημοφιλή

Pro

$29/ου

2.000 πιστώσεις/μήνας

  • Τα πάντα στο Starter
  • Πρόσβαση API
  • Επεξεργασία προτεραιότητας
Πάρτε Pro

ΕντερπράιζCity name (optional, probably does not need a translation)

$99/ου

10,000 πιστώσεις/μήνας

  • Τα πάντα σε Pro
  • Μαζική API
  • Σειρά προτεραιότητας
Πώληση επαφών

View all plans including credit packs →

Συχνές Ερωτήσεις

TTS.ai είναι η πιο ολοκληρωμένη πλατφόρμα φωνής AI, προσφέροντας 22+ μοντέλα κειμένου προς ομιλία, κλωνοποίηση φωνής, ομιλία προς κείμενο, και ακουστικά εργαλεία.

Ναι! TTS.ai προσφέρει δωρεάν κείμενο προς ομιλία με Kokoro, Piper, VITS, και MeloTTS μοντέλα. Δεν απαιτείται λογαριασμός. Εγγραφείτε για να πάρετε 50 δωρεάν πιστώσεις και πρόσβαση σε όλα τα μοντέλα.

Για την ταχύτητα, χρησιμοποιήστε το Kokoro ή Piper. Για την ποιότητα, δοκιμάστε CosyVoice 2 ή Styletts 2. Για την κλωνοποίηση φωνής, χρησιμοποιήστε το Chatterbox ή το GPT-SoVITS. Για το διάλογο, χρησιμοποιήστε το Dia TTS. Δοκιμάστε πολλαπλά μοντέλα στο ίδιο κείμενο για να συγκρίνετε.

Ναι. OpenAI Συμβατό REST API για TTS, STT, κλωνοποίηση φωνής, και ηχητικά εργαλεία. Διατίθεται σε Pro (29/mo) και Enterprise ($99/mo) σχέδια. Δείτε τα έγγραφα στο tts.ai/api/.

Η ποιότητα της φωνής ποικίλλει ανάλογα με το μοντέλο. Premium μοντέλα όπως η CosyVoice 2, το Styletts 2, και το Chatterbox παράγουν σχεδόν ανθρώπινη ποιότητα ομιλίας με φυσικό τονισμό και το συναίσθημα.

Η TTS.ai υποστηρίζει 30+ γλώσσες σε όλη τη βιβλιοθήκη του μοντέλου. Αγγλικά έχει την ευρύτερη υποστήριξη μοντέλο, αλλά μοντέλα όπως CosyVoice 2 καλύπτουν κινέζικα, ιαπωνικά, και Κορεάτικα; GPT-SoVITS χειρίζεται κινέζικα, ιαπωνικά, κορεάτικα και αγγλικά; και MeloTTS υποστηρίζει αγγλικά, ισπανικά, γαλλικά, κινεζικά, ιαπωνικά και κορεάτικα.

Ναι. Όλη η επεξεργασία συμβαίνει στους ειδικούς διακομιστές GPU μας. Δεν αποθηκεύουμε την εισαγωγή του κειμένου σας ή την παραγωγή ήχου μετά την παράδοση. Ανεβάστε τα δείγματα φωνής για την κλωνοποίηση χρησιμοποιούνται μόνο για την τρέχουσα συνεδρία και δεν διατηρούνται. Ποτέ δεν μοιραζόμαστε τα δεδομένα σας με τρίτους ή τα χρησιμοποιούμε για να εκπαιδεύσουμε μοντέλα.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai παράγει ήχου σε μορφή WAV από προεπιλογή για τη μέγιστη ποιότητα. Μπορείτε να μετατρέψετε σε MP3, FLAC, OGG, ή M4A χρησιμοποιώντας δωρεάν Audio Converter εργαλείο μας.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Τα δωρεάν μοντέλα (Kokoro, Piper, VITS, MeloTTS) δεν απαιτούν λογαριασμό και το κόστος μηδέν πιστώσεις. Τα πρότυπα μοντέλα (2 μονάδες/1K χαρακτήρες) περιλαμβάνουν Bark, CosyVoice 2, F5-TTS, και Dia. Premium μοντέλα (4 μονάδες/1K χαρακτήρες) περιλαμβάνουν OpenVoice, Chatterbox, StyleTTS 2, και Tortoise. Τα πρότυπα πληρωμής προσφέρουν γενικά υψηλότερη ποιότητα, περισσότερες φωνές, και πρόσθετα χαρακτηριστικά όπως η κλωνοποίηση φωνής.

Ναι. Το API υποστηρίζει την επεξεργασία παρτίδα για τη μετατροπή μεγάλου όγκου του κειμένου σε ομιλία. Υποβάλετε πολλαπλές αιτήσεις και να ανακτήσει τα αποτελέσματα ασύγχρονα χρησιμοποιώντας UUIDs εργασίας. Επιχειρηματικά σχέδια ($99/mo) περιλαμβάνουν προτεραιότητα ουρά πρόσβαση για ταχύτερη επεξεργασία παρτίδα. Ιδανικό για την παραγωγή ακουστικών βιβλίων, περιεχόμενο μαθημάτων, και μεγάλης κλίμακας έργα φωνητική.
5.0/5 (1)

Ξεκίνα να χρησιμοποιείς τη φωνή της Αλ σήμερα.

Ενταχθείτε δημιουργοί, προγραμματιστές, και επιχειρήσεις χρησιμοποιώντας TTS.ai