Άνοιγμα κειμένου πηγαίου κώδικα σε πρότυπα λόγου
Κάθε μοντέλο TTS στην πλατφόρμα μας είναι ανοιχτή πηγή με εμπορικά φιλικές άδειες. MIT, Apache 2.0
Δοκίμασέ το τώρα.
Πλεονεκτήματα Open Source TTS
Γιατί τα μοντέλα ανοιχτού κώδικα έχουν σημασία για τα έργα σας
Όλες οι άδειες Open-Source
Κάθε μοντέλο στο TTS.ai χρησιμοποιεί μια ανεκτική άδεια ανοικτού κώδικα, χωρίς ιδιόκτητα μαύρα κουτιά, χωρίς κλειδαριά πωλητή, χωρίς απροσδόκητα τέλη αδειοδότησης.
MIT / Apache 2.0
Τα μοντέλα είναι αδειοδοτημένα με άδεια MIT ή Apache 2.0, οι πιο ανεκτικές άδειες ανοικτού κώδικα. Χρησιμοποιήστε εμπορικά, τροποποιείτε, αναδιανέμετε δεν περιορισμούς.
Αυτοκόλλητη
Κατεβάστε οποιοδήποτε μοντέλο και να το εκτελέσετε στο δικό σας υλικό. Πλήρης έλεγχος των δεδομένων σας, καθυστέρηση, και την υποδομή.
Βελτιστοποιημένη GPU
Μοντέλα βελτιστοποιούνται για NVIDIA GPUs με υποστήριξη CUDA. Piper τρέχει σε CPU μόνο. Τα περισσότερα μοντέλα χρειάζονται 2-8GB VRAM για την αποτελεσματική συμπεράσματα.
Κράτηση της Κοινότητας
Οι ενεργές κοινότητες ανοιχτού κώδικα διατηρούν και βελτιώνουν αυτά τα μοντέλα. Οι συνεισφορές καλωσορίζουν τους κοριούς, τις βελτιώσεις και τις νέες φωνές στο GitHub.
Εμπορική χρήση OK
Όλα τα μοντέλα επιτρέπουν την εμπορική χρήση με τις άδειές τους. Κατασκευάστε προϊόντα, πωλούν υπηρεσίες, και να δημιουργήσετε εμπορικό περιεχόμενο χωρίς δικαιώματα ή τέλη χρήσης.
Open Source Model Catalog μας
Κάθε μοντέλο, η άδειά του, και τι κάνει καλύτερα
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Καλύτερα για: Apache 2.0 __ καλύτερης ποιότητας δωρεάν μοντέλο, 82M params, εύκολο να αυτο-φιλοξενήσει
Δοκίμασε. Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Καλύτερα για: MIT μόνο για CPU, ιδανικό για συσκευές ακμές και ενσωματωμένους αυτο-φιλοξενούμενους
Δοκίμασε. Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Καλύτερα για: MIT — foundational architecture used by many downstream models
Δοκίμασε. VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Καλύτερα για: MIT □ μοναδικές δυνατότητες παραγωγής ήχου πέρα από το πρότυπο TTS
Δοκίμασε. Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Καλύτερα για: Apache 2.0 ; μέγιστη ποιότητα, ευρέως υπό μελέτη εφαρμογή αναφοράς
Δοκίμασε. Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Καλύτερα για: MIT □ κλωνοποίηση ανοιχτής πηγής φωνής με έλεγχο κοκκώδους στυλ
Δοκίμασε. OpenVoiceΠώς να χρησιμοποιήσετε το Open Source TTS
Χρησιμοποιήστε το hosted API μας ή να εκτελέσετε τα μοντέλα μόνοι σας
Εξερευνήστε τα μοντέλα Open-Source
Περιηγηθείτε στον κατάλογό μας των μοντέλων TTS 20+ open-source. Κάθε σελίδα μοντέλου δείχνει την άδεια, την αρχιτεκτονική, τις δυνατότητες και τις απαιτήσεις αυτο-φιλοξενήσεως.
Προσπαθήστε στο πρόγραμμα περιήγησης σας
Δοκιμάστε οποιοδήποτε μοντέλο απευθείας σε TTS.ai χωρίς να εγκαθιστά τίποτα. GPU διακομιστές μας χειρίζονται την επεξεργασία έτσι ώστε να μπορείτε να αξιολογήσει την ποιότητα πριν από τη δέσμευση να αυτο-φιλοξενήσει.
Αυτοκόλλητο ή χρήση API μας
Μοντέλο Clone repos από το GitHub και να τρέξει τοπικά, ή να χρησιμοποιήσετε το φιλοξένησε API μας για την παραγωγή.
Κατασκευή της εφαρμογής σας
Ενσωμάτωση TTS στο προϊόν σας χρησιμοποιώντας αυτο-φιλοξενούμενα μοντέλα ή REST API μας. Όλα τα μοντέλα είναι εμπορικά χρησιμοποιήσιμα χωρίς τέλη αδειοδότησης ή δικαιώματα.
Σύγκριση άδειας χρήσης
Όλα τα μοντέλα σε TTS.ai χρησιμοποιούν εμπορικά φιλικές άδειες ανοικτού κώδικα
| Υπόδειγμα | Άδεια | Εμπορική χρήση | Τροποποίηση | Αυτοκόλλητο | Καταβολή |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Απαιτείται | |||
| Piper | MIT | Προαιρετικό | |||
| VITS | MIT | Προαιρετικό | |||
| MeloTTS | MIT | Προαιρετικό | |||
| Chatterbox | MIT | Προαιρετικό | |||
| Tortoise TTS | Apache 2.0 | Απαιτείται | |||
| StyleTTS 2 | MIT | Προαιρετικό | |||
| OpenVoice | MIT | Προαιρετικό | |||
| Sesame CSM | Apache 2.0 | Απαιτείται | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Self-Hosting vs Hosted API
Εκτελέστε τα μοντέλα μόνοι σας ή αφήστε μας να χειριστούμε την υποδομή
Αυτοκόλλητο στο υλικό σας
Κάθε μοντέλο στο TTS.ai είναι διαθέσιμο ως ένα ανοικτό έργο για GitHub ή Hugging Face. Κατεβάστε τα βάρη, εγκαταστήστε τις εξαρτήσεις, και να τρέξει συμπέρασμα για τη δική σας GPUs. Έχετε πλήρη έλεγχο της καθυστέρησης, την ιδιωτικότητα, και την κλιμάκωση.
- Πλήρης ιδιωτικότητα των δεδομένων Ο ήχος δεν αφήνει ποτέ τον διακομιστή σας
- Δεν υπάρχει κόστος ανά αίτηση μετά την αρχική εγκατάσταση
- Προσαρμοσμένη ρύθμιση με βάση τα δικά σας δεδομένα
- Απαιτεί υλικό GPU (συστήνεται η NVIDIA)
- Διαχειρίζεστε ενημερώσεις, κλιμακώσεις, και εξαρτήσεις
Χρήση TTS.ai Hosted API
Αποκτήστε άμεση πρόσβαση σε όλα τα μοντέλα 20+ μέσω ενός ενιαίου REST API. Χειριζόμαστε την παροχή GPU, ενημερώσεις μοντέλων, διαχείριση ουρά, και κλιμάκωση.
- Δεν απαιτείται υλικό GPU
- Όλα τα μοντέλα 20+ μέσω ενός API
- Αυτόματες ενημερώσεις μοντέλων και βελτιώσεις
- 99,9% uptime με περιττές υποδομές
- Πληρώστε μόνο για ό, τι χρησιμοποιείτε
Γρήγορη εκκίνηση: API ή αυτο-Host
Χρησιμοποιήστε το ξενώνα μας API, ή να εγκαταστήσετε το Kokoro τοπικά σε λίγα λεπτά
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Άνοιγμα Πηγής, Προσιτή Τιμή
Το φιλοξενούμενο μας API καθιστά προσιτή την ανοιχτή πηγή TTS χωρίς τη διαχείριση των GPU.
Δωρεάν κατηγορία
$0
50 πιστώσεις για εγγραφή
- 4 μοντέλα ανοικτού κώδικα δωρεάν
- Καμία εγγραφή για βασική χρήση
- Επιτρέπεται η εμπορική χρήση
Εκκίνηση
$9
500.000 χαρακτήρες/μήνας
- Όλα τα μοντέλα ανοικτού κώδικα 20+
- Κλωνοποίηση φωνής
- Πρόσβαση API
Pro
$29
2.000.000 χαρακτήρες/μήνας
- Επεξεργασία GPU προτεραιότητας
- Όλα τα μοντέλα πριμοδότησης
- Υποστήριξη των επιχειρήσεων
Συχνές Ερωτήσεις
Κοινές ερωτήσεις σχετικά με το κείμενο ανοιχτής πηγής στην ομιλία
Τι θα μπορούσαμε να βελτιώσουμε; Τα σχόλιά σας μάς βοηθούν να διορθώσουμε τα ζητήματα.
Δοκιμάστε Open Source TTS Σήμερα
20+ μοντέλα ανοιχτής πηγής, όλα εμπορικά άδεια. Χρησιμοποιήστε API μας ή αυτο-ξενώνας μας η επιλογή είναι δική σας.