Σε πραγματικό χρόνο TTS
Streaming text-to-Speech with sub-second first-audio lateency. Χτισμένο για φωνητικούς παράγοντες και ζωντανές εφαρμογές.
Πώς λειτουργεί το Streaming TTS
1. Αποστολή κειμένου
POST κείμενο στο /v1/tts/stream/ ως αίτημα Server- Sent Events.
2. Μοντέλο δημιουργεί
Kokoro τεμαχίζει το κείμενο και παράγει ηχητικό δείγμα-κατά-δείγμα στην GPU.
3. Stream Chunks
Base64-κωδικοποιημένα κομμάτια WAV φτάνουν πάνω από SSE και να αρχίσει να παίζει αμέσως.
4. Ακούστε Ζωντανά
Ο χρήστης ακούει την έναρξη της πρότασης σε λιγότερο από ένα δευτερόλεπτο, ακόμη και σε μεγάλες εισροές.
Υpiοθέσει χρήση
Όπου η υποδευτερόλεπτη καθυστέρηση ξεκλειδώνει νέες εμπειρίες.
Φωνητικά Πράκτορες
Συνομιλία bots που ανταποκρίνονται τόσο γρήγορα όσο ένας άνθρωπος.
Live Dubbing
Μεταφράστε και dub ένα ρεύμα σε πραγματικό χρόνο χωρίς αναστολή παύση.
Παιχνίδια
Διάλογος NPC που αντιδρά σε επιλογές παικτών αμέσως, δεν προ-παραχωρήθηκε VO.
Προσβασιμότητα
Αναγνώστες οθόνης και βοηθητικά εργαλεία που αρχίζουν να μιλούν τη στιγμή που ένας χρήστης κάνει κλικ.
Σχέδια TTS σε πραγματικό χρόνο
Ξεκινήστε δωρεάν, αναβαθμίστε όταν χρειάζεστε περισσότερα
- Κόκορο streaming (ελεύθερο μοντέλο)
- 500 χαρακτήρες ανά γενιά
- 10 δωρεάν ροές/ημέρα ανά ανώνυμο χρήστη
- Υποδευτερόλεπτη καθυστέρηση πρώτου ήχου
- SSE streaming over HTTPS
- 15.000 χαρακτήρες κατά την εγγραφή
- 5.000 chars ανά ρέμα
- κλειδί API για την πρόσβαση σε προγράμματα
- Ιστορικό γενεών
- Δεν υπάρχει ημερήσιο καπάκι ροής
- MOSS-TTS-Realtime (όταν ζεις)
- 100,000 chars ανά ρέμα
- Σειρά προτεραιότητας GPU
- Φωνητικός παράγοντας + ενσωμάτωση Twilio
- Όρια υψηλότερων ποσοστών
Συχνές Ερωτήσεις
Τι θα μπορούσαμε να βελτιώσουμε; Τα σχόλιά σας μάς βοηθούν να διορθώσουμε τα ζητήματα.
Stream Speam Speech in Real Time
Δωρεάν για τις πρώτες 10 γενιές την ημέρα. Εγγραφείτε για να ξεκλειδώσετε το πλήρες επίδομα χαρακτήρα και API πρόσβαση.