Αναφορά σφάλματος / αίτησης χαρακτηριστικών

Άνοιγμα κειμένου πηγαίου κώδικα σε πρότυπα λόγου

Κάθε μοντέλο TTS στην πλατφόρμα μας είναι ανοιχτή πηγή με εμπορικά φιλικές άδειες. MIT, Apache 2.0

Άνοιγμα πηγής Άδεια MIT Απάτσι 2.0 Αυτοκόλλητη GitHubCity name (optional, probably does not need a translation)

Πλήρης επεξεργαστής TTS Γιατροί APIConstellation name (optional, probably does not need a translation)

Δοκίμασέ το τώρα.

0/500

Δωρεάν με Kokoro, Piper, VITS, MeloTTS

Ο δημιουργημένος ήχος σου θα εμφανιστεί εδώ.

Άνοιγμα πλήρους επεξεργαστή TTS

Πλεονεκτήματα Open Source TTS

Γιατί τα μοντέλα ανοιχτού κώδικα έχουν σημασία για τα έργα σας

Όλες οι άδειες Open-Source

Κάθε μοντέλο στο TTS.ai χρησιμοποιεί μια ανεκτική άδεια ανοικτού κώδικα, χωρίς ιδιόκτητα μαύρα κουτιά, χωρίς κλειδαριά πωλητή, χωρίς απροσδόκητα τέλη αδειοδότησης.

MIT / Apache 2.0

Τα μοντέλα είναι αδειοδοτημένα με άδεια MIT ή Apache 2.0, οι πιο ανεκτικές άδειες ανοικτού κώδικα. Χρησιμοποιήστε εμπορικά, τροποποιείτε, αναδιανέμετε δεν περιορισμούς.

Αυτοκόλλητη

Κατεβάστε οποιοδήποτε μοντέλο και να το εκτελέσετε στο δικό σας υλικό. Πλήρης έλεγχος των δεδομένων σας, καθυστέρηση, και την υποδομή.

Βελτιστοποιημένη GPU

Μοντέλα βελτιστοποιούνται για NVIDIA GPUs με υποστήριξη CUDA. Piper τρέχει σε CPU μόνο. Τα περισσότερα μοντέλα χρειάζονται 2-8GB VRAM για την αποτελεσματική συμπεράσματα.

Κράτηση της Κοινότητας

Οι ενεργές κοινότητες ανοιχτού κώδικα διατηρούν και βελτιώνουν αυτά τα μοντέλα. Οι συνεισφορές καλωσορίζουν τους κοριούς, τις βελτιώσεις και τις νέες φωνές στο GitHub.

Εμπορική χρήση OK

Όλα τα μοντέλα επιτρέπουν την εμπορική χρήση με τις άδειές τους. Κατασκευάστε προϊόντα, πωλούν υπηρεσίες, και να δημιουργήσετε εμπορικό περιεχόμενο χωρίς δικαιώματα ή τέλη χρήσης.

Open Source Model Catalog μας

Κάθε μοντέλο, η άδειά του, και τι κάνει καλύτερα

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Γρήγορα. 5/5

Καλύτερα για: Apache 2.0 __ καλύτερης ποιότητας δωρεάν μοντέλο, 82M params, εύκολο να αυτο-φιλοξενήσει

Δοκίμασε. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Γρήγορα. 3/5

Καλύτερα για: MIT μόνο για CPU, ιδανικό για συσκευές ακμές και ενσωματωμένους αυτο-φιλοξενούμενους

Δοκίμασε. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Γρήγορα. 3/5

Καλύτερα για: MIT __

Δοκίμασε. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Αργά 4/5

Καλύτερα για: MIT □ μοναδικές δυνατότητες παραγωγής ήχου πέρα από το πρότυπο TTS

Δοκίμασε. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Αργά 5/5 Κλωνοποίηση φωνής

Καλύτερα για: Apache 2.0 ; μέγιστη ποιότητα, ευρέως υπό μελέτη εφαρμογή αναφοράς

Δοκίμασε. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Μεσαίο 4/5 Κλωνοποίηση φωνής

Καλύτερα για: MIT □ κλωνοποίηση ανοιχτής πηγής φωνής με έλεγχο κοκκώδους στυλ

Δοκίμασε. OpenVoice

Πώς να χρησιμοποιήσετε το Open Source TTS

Χρησιμοποιήστε το hosted API μας ή να εκτελέσετε τα μοντέλα μόνοι σας

Εξερευνήστε τα μοντέλα Open-Source

Περιηγηθείτε στον κατάλογό μας των μοντέλων TTS 20+ open-source. Κάθε σελίδα μοντέλου δείχνει την άδεια, την αρχιτεκτονική, τις δυνατότητες και τις απαιτήσεις αυτο-φιλοξενήσεως.

Προσπαθήστε στο πρόγραμμα περιήγησης σας

Δοκιμάστε οποιοδήποτε μοντέλο απευθείας σε TTS.ai χωρίς να εγκαθιστά τίποτα. GPU διακομιστές μας χειρίζονται την επεξεργασία έτσι ώστε να μπορείτε να αξιολογήσει την ποιότητα πριν από τη δέσμευση να αυτο-φιλοξενήσει.

Αυτοκόλλητο ή χρήση API μας

Μοντέλο Clone repos από το GitHub και να τρέξει τοπικά, ή να χρησιμοποιήσετε το φιλοξένησε API μας για την παραγωγή.

Κατασκευή της εφαρμογής σας

Ενσωμάτωση TTS στο προϊόν σας χρησιμοποιώντας αυτο-φιλοξενούμενα μοντέλα ή REST API μας. Όλα τα μοντέλα είναι εμπορικά χρησιμοποιήσιμα χωρίς τέλη αδειοδότησης ή δικαιώματα.

Σύγκριση άδειας χρήσης

Όλα τα μοντέλα σε TTS.ai χρησιμοποιούν εμπορικά φιλικές άδειες ανοικτού κώδικα

Υπόδειγμα	Άδεια	Καταβολή
Kokoro	Apache 2.0	Απαιτείται
Piper	MIT	Προαιρετικό
VITS	MIT	Προαιρετικό
MeloTTS	MIT	Προαιρετικό
Chatterbox	MIT	Προαιρετικό
Tortoise TTS	Apache 2.0	Απαιτείται
StyleTTS 2	MIT	Προαιρετικό
OpenVoice	MIT	Προαιρετικό
Sesame CSM	Apache 2.0	Απαιτείται
Orpheus	Llama 3.2	"Built with Llama"

Δοκιμάστε αυτά τα μοντέλα δωρεάν

Self-Hosting vs Hosted API

Εκτελέστε τα μοντέλα μόνοι σας ή αφήστε μας να χειριστούμε την υποδομή

Αυτοκόλλητο στο υλικό σας

Κάθε μοντέλο στο TTS.ai είναι διαθέσιμο ως ένα ανοικτό έργο για GitHub ή Hugging Face. Κατεβάστε τα βάρη, εγκαταστήστε τις εξαρτήσεις, και να τρέξει συμπέρασμα για τη δική σας GPUs. Έχετε πλήρη έλεγχο της καθυστέρησης, την ιδιωτικότητα, και την κλιμάκωση.

Πλήρης ιδιωτικότητα των δεδομένων Ο ήχος δεν αφήνει ποτέ τον διακομιστή σας
Δεν υπάρχει κόστος ανά αίτηση μετά την αρχική εγκατάσταση
Προσαρμοσμένη ρύθμιση με βάση τα δικά σας δεδομένα
Απαιτεί υλικό GPU (συστήνεται η NVIDIA)
Διαχειρίζεστε ενημερώσεις, κλιμακώσεις, και εξαρτήσεις

Χρήση TTS.ai Hosted API

Αποκτήστε άμεση πρόσβαση σε όλα τα μοντέλα 20+ μέσω ενός ενιαίου REST API. Χειριζόμαστε την παροχή GPU, ενημερώσεις μοντέλων, διαχείριση ουρά, και κλιμάκωση.

Δεν απαιτείται υλικό GPU
Όλα τα μοντέλα 20+ μέσω ενός API
Αυτόματες ενημερώσεις μοντέλων και βελτιώσεις
99,9% uptime με περιττές υποδομές
Πληρώστε μόνο για ό, τι χρησιμοποιείτε

Χρήση Hosted API Αντ' αυτού

Γρήγορη εκκίνηση: API ή αυτο-Host

Χρησιμοποιήστε το ξενώνα μας API, ή να εγκαταστήσετε το Kokoro τοπικά σε λίγα λεπτά

Επιλογή 1: TTS.ai Hosted API Πιο εύκολο.

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Επιλογή 2: Αυτο-Host με pip Πλήρης έλεγχος

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Προβολή τεκμηρίωσης API

Άνοιγμα Πηγής, Προσιτή Τιμή

Το φιλοξενούμενο μας API καθιστά προσιτή την ανοιχτή πηγή TTS χωρίς τη διαχείριση των GPU.

Δωρεάν κατηγορία

50 πιστώσεις για εγγραφή

4 μοντέλα ανοικτού κώδικα δωρεάν
Καμία εγγραφή για βασική χρήση
Επιτρέπεται η εμπορική χρήση

Εκκίνηση

500.000 χαρακτήρες/μήνας

Όλα τα μοντέλα ανοικτού κώδικα 20+
Κλωνοποίηση φωνής
Πρόσβαση API

Pro

$29

2.000.000 χαρακτήρες/μήνας

Επεξεργασία GPU προτεραιότητας
Όλα τα μοντέλα πριμοδότησης
Υποστήριξη των επιχειρήσεων

Προβολή πλήρους τιμής

Συχνές Ερωτήσεις

Κοινές ερωτήσεις σχετικά με το κείμενο ανοιχτής πηγής στην ομιλία

Ναι. Κάθε μοντέλο στο TTS.ai χρησιμοποιεί μια ανεκτική άδεια ανοικτού κώδικα είτε MIT είτε Apache 2.0. Αποκλείουμε συγκεκριμένα μοντέλα με περιοριστικές άδειες (όπως το CPML Coqui's ή το μη εμπορικό CC-BY-NC). Μπορείτε να επιβεβαιώσετε την άδεια κάθε μοντέλου στο αποθετήριό του GitHub.

Και οι δύο είναι ανεκτικές άδειες ανοικτού κώδικα που επιτρέπουν την εμπορική χρήση, τροποποίηση, και αναδιανομή. Apache 2.0 προσθέτει σαφείς επιχορηγήσεις διπλωμάτων ευρεσιτεχνίας και απαιτεί την αναφορά αλλαγών αν τροποποιείτε τον κώδικα. MIT είναι απλούστερο με λιγότερες απαιτήσεις. Και οι δύο είναι φιλικές προς τις επιχειρήσεις.

Ναι. Κάθε μοντέλο μπορεί να αυτο-φιλοξενηθεί. Κλείστε το αποθετήριο μοντέλων από το GitHub, εγκαταστήστε εξαρτήσεις, κατεβάστε τα βάρη μοντέλο, και να εκτελέσετε τα συμπεράσματα.

Οι απαιτήσεις διαφέρουν ανάλογα με το μοντέλο. Piper δεν χρειάζεται GPU (μόνο CPU). Kokoro και MeloTTS χρειάζονται 1-2GB VRAM. Τα περισσότερα πρότυπα μοντέλα χρειάζονται 4GB VRAM. Tortoise και Σουσάμι CSM χρειάζονται 8GB. Μια NVIDIA RTX 3060 (12GB) μπορεί να τρέξει τα περισσότερα μοντέλα άνετα.

Τα μοντέλα όπως GPT-SoVITS και Bark παρέχουν scripts λεπτής ρύθμισης. Μπορείτε να εκπαιδεύσετε μοντέλα με τα δικά σας φωνητικά δεδομένα για να δημιουργήσετε προσαρμοσμένες φωνές ή να βελτιώσετε την απόδοση για συγκεκριμένες γλώσσες.

Κορυφαία μοντέλα ανοικτού κώδικα (Kokoro, StyleTTS 2, Chatterbox) τώρα ταιριάζουν ή υπερβαίνουν τις εμπορικές υπηρεσίες όπως Έντεκα Labs και Google TTS σε δείκτες αναφοράς ποιότητας.

Τους έχουμε ήδη αποκλείσει. XTTS/XTTS-v2 (Coqui's CPML - μη εμπορικού χαρακτήρα), F5-TTS (CC-BY-NC - μη εμπορικού χαρακτήρα) και Higgs-v2 (Boson License - V2) απομακρύνθηκαν όλα. Κάθε μοντέλο στο TTS.ai είναι επαληθευμένο χρηματοκιβώτιο εμπορικής χρήσης.

Ναι. Τα περισσότερα μοντέλα δέχονται κοινοτικές συνεισφορές μέσω του GitHub. Μπορείτε να υποβάλετε αναφορές σφαλμάτων, ηχογραφήσεις φωνής για νέες γλώσσες, βελτιώσεις κώδικα, και τεκμηρίωση.

Φορτώστε τα μοντέλα on-demand και ξεφορτώστε όταν δεν είναι διαθέσιμο για να μοιραστείτε τη μνήμη GPU. Ο διακομιστής GPU τρέχει 20+ μοντέλα σε 4x Tesla P40 (συνολική VRAM 96GB) χρησιμοποιώντας δυναμική φόρτωση.

Πολλά μοντέλα παρέχουν επίσημες εικόνες Docker ή Dockerfiles. Για την εκτέλεση πολλαπλών μοντέλων, μπορείτε να δημιουργήσετε μια προσαρμοσμένη ρύθμιση Docker με NVIDIA Container Toolkit για την πρόσβαση GPU. API αρχιτεκτονική μας μπορεί να χρησιμεύσει ως μια εφαρμογή αναφοράς.

Τα περισσότερα μοντέλα απαιτούν Python 3.10-3.12. Coqui TTS (VITS) ειδικά χρειάζεται Python 3.11. Σας συνιστούμε Python 3.12 για τα περισσότερα μοντέλα. Ελέγξτε τις απαιτήσεις κάθε μοντέλου.txt για την ακριβή συμβατότητα έκδοσης.

Ναι. Οι άδειες MIT και Apache 2.0 επιτρέπουν ρητά την εμπορική χρήση. Μπορείτε να οικοδομήσετε προϊόντα SaaS, mobile εφαρμογές, παιχνίδια και υπηρεσίες χρησιμοποιώντας αυτά τα μοντέλα χωρίς τέλη αδειοδότησης, δικαιώματα ή απαιτήσεις απόδοσης (αν και εκτιμάται η απόδοση).

5.0/5 (1)

Δοκιμάστε Open Source TTS Σήμερα

20+ μοντέλα ανοιχτής πηγής, όλα εμπορικά άδεια. Χρησιμοποιήστε API μας ή αυτο-ξενώνας μας η επιλογή είναι δική σας.

Εγγραφή δωρεάν Προβολή τιμής

Άνοιγμα κειμένου πηγαίου κώδικα σε πρότυπα λόγου

Δοκίμασέ το τώρα.

Αγάπη TTS.ai; Πες στους φίλους σου!

Πλεονεκτήματα Open Source TTS

Όλες οι άδειες Open-Source

MIT / Apache 2.0

Αυτοκόλλητη

Βελτιστοποιημένη GPU

Κράτηση της Κοινότητας

Εμπορική χρήση OK

Open Source Model Catalog μας

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Πώς να χρησιμοποιήσετε το Open Source TTS

Εξερευνήστε τα μοντέλα Open-Source

Προσπαθήστε στο πρόγραμμα περιήγησης σας

Αυτοκόλλητο ή χρήση API μας

Κατασκευή της εφαρμογής σας

Σύγκριση άδειας χρήσης

Self-Hosting vs Hosted API

Αυτοκόλλητο στο υλικό σας

Χρήση TTS.ai Hosted API

Γρήγορη εκκίνηση: API ή αυτο-Host

Άνοιγμα Πηγής, Προσιτή Τιμή

Δωρεάν κατηγορία

Εκκίνηση

Pro

Συχνές Ερωτήσεις

Είναι όλα τα TTS.ai μοντέλα πραγματικά ανοιχτή πηγή;

Ποια είναι η διαφορά μεταξύ των αδειών MIT και Apache 2.0;

Μπορώ να φτιάξω αυτά τα μοντέλα στον δικό μου σέρβερ;

Τι GPU χρειάζομαι για να αυτο-ξεχωρίσω μοντέλα TTS;

Μπορώ να βρω μοντέλα TTS ανοιχτής πηγής;

Πώς συγκρίνονται τα μοντέλα TTS ανοικτού κώδικα με τις εμπορικές υπηρεσίες;

Υπάρχουν μοντέλα με περιοριστικές άδειες που πρέπει να αποφύγω;

Μπορώ να συνεισφέρω σε αυτά τα μοντέλα ανοικτού κώδικα;

Πώς μπορώ να εκτελέσω πολλαπλά μοντέλα σε έναν διακομιστή GPU;

Υπάρχει εικόνα του Ντόκερ για αυτοξεπέραση;

Ποια έκδοση Python χρειάζομαι για την αυτο-φιλοξενούμενη;

Μπορώ να φτιάξω ένα εμπορικό προϊόν χρησιμοποιώντας αυτά τα μοντέλα;

Δοκιμάστε Open Source TTS Σήμερα