Άνοιγμα κειμένου πηγαίου κώδικα σε πρότυπα λόγου

Κάθε μοντέλο TTS στην πλατφόρμα μας είναι ανοιχτή πηγή με εμπορικά φιλικές άδειες. MIT, Apache 2.0

Άνοιγμα πηγής Άδεια MIT Απάτσι 2.0 Αυτοκόλλητη GitHubCity name (optional, probably does not need a translation)

Δοκίμασέ το τώρα.

Δωρεάν με Kokoro, Piper, VITS, MeloTTS
Ο δημιουργημένος ήχος σου θα εμφανιστεί εδώ.
Δημιουργήθηκε
Λήψη
Αγάπη TTS.ai; Πες στους φίλους σου!

Πλεονεκτήματα Open Source TTS

Γιατί τα μοντέλα ανοιχτού κώδικα έχουν σημασία για τα έργα σας

Όλες οι άδειες Open-Source

Κάθε μοντέλο στο TTS.ai χρησιμοποιεί μια ανεκτική άδεια ανοικτού κώδικα, χωρίς ιδιόκτητα μαύρα κουτιά, χωρίς κλειδαριά πωλητή, χωρίς απροσδόκητα τέλη αδειοδότησης.

MIT / Apache 2.0

Τα μοντέλα είναι αδειοδοτημένα με άδεια MIT ή Apache 2.0, οι πιο ανεκτικές άδειες ανοικτού κώδικα. Χρησιμοποιήστε εμπορικά, τροποποιείτε, αναδιανέμετε δεν περιορισμούς.

Αυτοκόλλητη

Κατεβάστε οποιοδήποτε μοντέλο και να το εκτελέσετε στο δικό σας υλικό. Πλήρης έλεγχος των δεδομένων σας, καθυστέρηση, και την υποδομή.

Βελτιστοποιημένη GPU

Μοντέλα βελτιστοποιούνται για NVIDIA GPUs με υποστήριξη CUDA. Piper τρέχει σε CPU μόνο. Τα περισσότερα μοντέλα χρειάζονται 2-8GB VRAM για την αποτελεσματική συμπεράσματα.

Κράτηση της Κοινότητας

Οι ενεργές κοινότητες ανοιχτού κώδικα διατηρούν και βελτιώνουν αυτά τα μοντέλα. Οι συνεισφορές καλωσορίζουν τους κοριούς, τις βελτιώσεις και τις νέες φωνές στο GitHub.

Εμπορική χρήση OK

Όλα τα μοντέλα επιτρέπουν την εμπορική χρήση με τις άδειές τους. Κατασκευάστε προϊόντα, πωλούν υπηρεσίες, και να δημιουργήσετε εμπορικό περιεχόμενο χωρίς δικαιώματα ή τέλη χρήσης.

Open Source Model Catalog μας

Κάθε μοντέλο, η άδειά του, και τι κάνει καλύτερα

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Καλύτερα για: Apache 2.0 __ καλύτερης ποιότητας δωρεάν μοντέλο, 82M params, εύκολο να αυτο-φιλοξενήσει

Δοκίμασε. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Καλύτερα για: MIT μόνο για CPU, ιδανικό για συσκευές ακμές και ενσωματωμένους αυτο-φιλοξενούμενους

Δοκίμασε. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Καλύτερα για: MIT — foundational architecture used by many downstream models

Δοκίμασε. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Καλύτερα για: MIT □ μοναδικές δυνατότητες παραγωγής ήχου πέρα από το πρότυπο TTS

Δοκίμασε. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Κλωνοποίηση φωνής

Καλύτερα για: Apache 2.0 ; μέγιστη ποιότητα, ευρέως υπό μελέτη εφαρμογή αναφοράς

Δοκίμασε. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Κλωνοποίηση φωνής

Καλύτερα για: MIT □ κλωνοποίηση ανοιχτής πηγής φωνής με έλεγχο κοκκώδους στυλ

Δοκίμασε. OpenVoice

Πώς να χρησιμοποιήσετε το Open Source TTS

Χρησιμοποιήστε το hosted API μας ή να εκτελέσετε τα μοντέλα μόνοι σας

1

Εξερευνήστε τα μοντέλα Open-Source

Περιηγηθείτε στον κατάλογό μας των μοντέλων TTS 20+ open-source. Κάθε σελίδα μοντέλου δείχνει την άδεια, την αρχιτεκτονική, τις δυνατότητες και τις απαιτήσεις αυτο-φιλοξενήσεως.

2

Προσπαθήστε στο πρόγραμμα περιήγησης σας

Δοκιμάστε οποιοδήποτε μοντέλο απευθείας σε TTS.ai χωρίς να εγκαθιστά τίποτα. GPU διακομιστές μας χειρίζονται την επεξεργασία έτσι ώστε να μπορείτε να αξιολογήσει την ποιότητα πριν από τη δέσμευση να αυτο-φιλοξενήσει.

3

Αυτοκόλλητο ή χρήση API μας

Μοντέλο Clone repos από το GitHub και να τρέξει τοπικά, ή να χρησιμοποιήσετε το φιλοξένησε API μας για την παραγωγή.

4

Κατασκευή της εφαρμογής σας

Ενσωμάτωση TTS στο προϊόν σας χρησιμοποιώντας αυτο-φιλοξενούμενα μοντέλα ή REST API μας. Όλα τα μοντέλα είναι εμπορικά χρησιμοποιήσιμα χωρίς τέλη αδειοδότησης ή δικαιώματα.

Σύγκριση άδειας χρήσης

Όλα τα μοντέλα σε TTS.ai χρησιμοποιούν εμπορικά φιλικές άδειες ανοικτού κώδικα

Υπόδειγμα Άδεια Εμπορική χρήση Τροποποίηση Αυτοκόλλητο Καταβολή
Kokoro Apache 2.0 Απαιτείται
Piper MIT Προαιρετικό
VITS MIT Προαιρετικό
MeloTTS MIT Προαιρετικό
Chatterbox MIT Προαιρετικό
Tortoise TTS Apache 2.0 Απαιτείται
StyleTTS 2 MIT Προαιρετικό
OpenVoice MIT Προαιρετικό
Sesame CSM Apache 2.0 Απαιτείται
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs Hosted API

Εκτελέστε τα μοντέλα μόνοι σας ή αφήστε μας να χειριστούμε την υποδομή

Αυτοκόλλητο στο υλικό σας

Κάθε μοντέλο στο TTS.ai είναι διαθέσιμο ως ένα ανοικτό έργο για GitHub ή Hugging Face. Κατεβάστε τα βάρη, εγκαταστήστε τις εξαρτήσεις, και να τρέξει συμπέρασμα για τη δική σας GPUs. Έχετε πλήρη έλεγχο της καθυστέρησης, την ιδιωτικότητα, και την κλιμάκωση.

  • Πλήρης ιδιωτικότητα των δεδομένων Ο ήχος δεν αφήνει ποτέ τον διακομιστή σας
  • Δεν υπάρχει κόστος ανά αίτηση μετά την αρχική εγκατάσταση
  • Προσαρμοσμένη ρύθμιση με βάση τα δικά σας δεδομένα
  • Απαιτεί υλικό GPU (συστήνεται η NVIDIA)
  • Διαχειρίζεστε ενημερώσεις, κλιμακώσεις, και εξαρτήσεις

Χρήση TTS.ai Hosted API

Αποκτήστε άμεση πρόσβαση σε όλα τα μοντέλα 20+ μέσω ενός ενιαίου REST API. Χειριζόμαστε την παροχή GPU, ενημερώσεις μοντέλων, διαχείριση ουρά, και κλιμάκωση.

  • Δεν απαιτείται υλικό GPU
  • Όλα τα μοντέλα 20+ μέσω ενός API
  • Αυτόματες ενημερώσεις μοντέλων και βελτιώσεις
  • 99,9% uptime με περιττές υποδομές
  • Πληρώστε μόνο για ό, τι χρησιμοποιείτε

Γρήγορη εκκίνηση: API ή αυτο-Host

Χρησιμοποιήστε το ξενώνα μας API, ή να εγκαταστήσετε το Kokoro τοπικά σε λίγα λεπτά

Επιλογή 1: TTS.ai Hosted API Πιο εύκολο.
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Επιλογή 2: Αυτο-Host με pip Πλήρης έλεγχος
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Άνοιγμα Πηγής, Προσιτή Τιμή

Το φιλοξενούμενο μας API καθιστά προσιτή την ανοιχτή πηγή TTS χωρίς τη διαχείριση των GPU.

Δωρεάν κατηγορία

$0

50 πιστώσεις για εγγραφή

  • 4 μοντέλα ανοικτού κώδικα δωρεάν
  • Καμία εγγραφή για βασική χρήση
  • Επιτρέπεται η εμπορική χρήση

Εκκίνηση

$9

500.000 χαρακτήρες/μήνας

  • Όλα τα μοντέλα ανοικτού κώδικα 20+
  • Κλωνοποίηση φωνής
  • Πρόσβαση API

Pro

$29

2.000.000 χαρακτήρες/μήνας

  • Επεξεργασία GPU προτεραιότητας
  • Όλα τα μοντέλα πριμοδότησης
  • Υποστήριξη των επιχειρήσεων
Προβολή πλήρους τιμής

Συχνές Ερωτήσεις

Κοινές ερωτήσεις σχετικά με το κείμενο ανοιχτής πηγής στην ομιλία

Ναι. Κάθε μοντέλο στο TTS.ai χρησιμοποιεί μια ανεκτική άδεια ανοικτού κώδικα είτε MIT είτε Apache 2.0. Αποκλείουμε συγκεκριμένα μοντέλα με περιοριστικές άδειες (όπως το CPML Coqui's ή το μη εμπορικό CC-BY-NC). Μπορείτε να επιβεβαιώσετε την άδεια κάθε μοντέλου στο αποθετήριό του GitHub.

Και οι δύο είναι ανεκτικές άδειες ανοικτού κώδικα που επιτρέπουν την εμπορική χρήση, τροποποίηση, και αναδιανομή. Apache 2.0 προσθέτει σαφείς επιχορηγήσεις διπλωμάτων ευρεσιτεχνίας και απαιτεί την αναφορά αλλαγών αν τροποποιείτε τον κώδικα. MIT είναι απλούστερο με λιγότερες απαιτήσεις. Και οι δύο είναι φιλικές προς τις επιχειρήσεις.

Ναι. Κάθε μοντέλο μπορεί να αυτο-φιλοξενηθεί. Κλείστε το αποθετήριο μοντέλων από το GitHub, εγκαταστήστε εξαρτήσεις, κατεβάστε τα βάρη μοντέλο, και να εκτελέσετε τα συμπεράσματα.

Οι απαιτήσεις διαφέρουν ανάλογα με το μοντέλο. Piper δεν χρειάζεται GPU (μόνο CPU). Kokoro και MeloTTS χρειάζονται 1-2GB VRAM. Τα περισσότερα πρότυπα μοντέλα χρειάζονται 4GB VRAM. Tortoise και Σουσάμι CSM χρειάζονται 8GB. Μια NVIDIA RTX 3060 (12GB) μπορεί να τρέξει τα περισσότερα μοντέλα άνετα.

Τα μοντέλα όπως GPT-SoVITS και Bark παρέχουν scripts λεπτής ρύθμισης. Μπορείτε να εκπαιδεύσετε μοντέλα με τα δικά σας φωνητικά δεδομένα για να δημιουργήσετε προσαρμοσμένες φωνές ή να βελτιώσετε την απόδοση για συγκεκριμένες γλώσσες.

Κορυφαία μοντέλα ανοικτού κώδικα (Kokoro, StyleTTS 2, Chatterbox) τώρα ταιριάζουν ή υπερβαίνουν τις εμπορικές υπηρεσίες όπως Έντεκα Labs και Google TTS σε δείκτες αναφοράς ποιότητας.

Τους έχουμε ήδη αποκλείσει. XTTS/XTTS-v2 (Coqui's CPML - μη εμπορικού χαρακτήρα), F5-TTS (CC-BY-NC - μη εμπορικού χαρακτήρα) και Higgs-v2 (Boson License - V2) απομακρύνθηκαν όλα. Κάθε μοντέλο στο TTS.ai είναι επαληθευμένο χρηματοκιβώτιο εμπορικής χρήσης.

Ναι. Τα περισσότερα μοντέλα δέχονται κοινοτικές συνεισφορές μέσω του GitHub. Μπορείτε να υποβάλετε αναφορές σφαλμάτων, ηχογραφήσεις φωνής για νέες γλώσσες, βελτιώσεις κώδικα, και τεκμηρίωση.

Φορτώστε τα μοντέλα on-demand και ξεφορτώστε όταν δεν είναι διαθέσιμο για να μοιραστείτε τη μνήμη GPU. Ο διακομιστής GPU τρέχει 20+ μοντέλα σε 4x Tesla P40 (συνολική VRAM 96GB) χρησιμοποιώντας δυναμική φόρτωση.

Πολλά μοντέλα παρέχουν επίσημες εικόνες Docker ή Dockerfiles. Για την εκτέλεση πολλαπλών μοντέλων, μπορείτε να δημιουργήσετε μια προσαρμοσμένη ρύθμιση Docker με NVIDIA Container Toolkit για την πρόσβαση GPU. API αρχιτεκτονική μας μπορεί να χρησιμεύσει ως μια εφαρμογή αναφοράς.

Τα περισσότερα μοντέλα απαιτούν Python 3.10-3.12. Coqui TTS (VITS) ειδικά χρειάζεται Python 3.11. Σας συνιστούμε Python 3.12 για τα περισσότερα μοντέλα. Ελέγξτε τις απαιτήσεις κάθε μοντέλου.txt για την ακριβή συμβατότητα έκδοσης.

Ναι. Οι άδειες MIT και Apache 2.0 επιτρέπουν ρητά την εμπορική χρήση. Μπορείτε να οικοδομήσετε προϊόντα SaaS, mobile εφαρμογές, παιχνίδια και υπηρεσίες χρησιμοποιώντας αυτά τα μοντέλα χωρίς τέλη αδειοδότησης, δικαιώματα ή απαιτήσεις απόδοσης (αν και εκτιμάται η απόδοση).
5.0/5 (1)

Τι θα μπορούσαμε να βελτιώσουμε; Τα σχόλιά σας μάς βοηθούν να διορθώσουμε τα ζητήματα.

Δοκιμάστε Open Source TTS Σήμερα

20+ μοντέλα ανοιχτής πηγής, όλα εμπορικά άδεια. Χρησιμοποιήστε API μας ή αυτο-ξενώνας μας η επιλογή είναι δική σας.