Κείμενο στο Λόγο API για τους προγραμματιστές
Φτιάξτε φωνητικές εφαρμογές με το REST API μας. Προσθέστε φυσικό κείμενο-to-speech, κλωνοποίηση φωνής, ομιλία-to-text, και επεξεργασία ήχου στις εφαρμογές σας, chatbots, βοηθούς φωνής, και SaaS προϊόντα. OpenAI συμβατή μορφή, 20+ μοντέλα, απλή ενσωμάτωση.
Δοκίμασέ το τώρα.
Χαρακτηριστικά API για τους προγραμματιστές
Όλα όσα χρειάζεστε για να δημιουργήσετε φωνητικές εφαρμογές
Απλή REST API
Ένα αίτημα POST για τη δημιουργία λόγου. JSON αίτημα, απάντηση ήχου. Λειτουργεί με οποιαδήποτε γλώσσα προγραμματισμού που υποστηρίζει HTTP.
OpenAI-Compatible
Ανταλλακτικό drop-in για OpenAI TTS API. Εναλλαγή βάσης_url και API κλειδί σας λειτουργεί άμεσα ο υφιστάμενος κώδικας.
24+ Μοντέλα Διαθέσιμα
Πρόσβαση σε κάθε μοντέλο μέσω ενός μόνο API. Διακόπτης μοντέλα με την αλλαγή μιας παραμέτρου. Συγκρίνετε την ποιότητα, την ταχύτητα και το κόστος.
Υποδευτεροβάθμια
Kokoro παράγει ήχου σε λιγότερο από 1 δευτερόλεπτο. Ιδανικό για πραγματικό χρόνο chatbots, βοηθούς φωνής, και διαδραστικές εφαρμογές.
Φωνητική κλωνοποίηση API
Κλώνε οποιαδήποτε φωνή από ένα σύντομο δείγμα ήχου μέσω του API. Χρησιμοποιήστε κλωνοποιημένες φωνές για όλες τις επόμενες γενιές.
Πολλαπλές μορφές
Έξοδος ως WAV, MP3, OGG, ή FLAC. Επιλέξτε ρυθμό δειγμάτων και bit βάθος.
Καλύτερα πρότυπα για την ενσωμάτωση των προγραμματιστών
Επιλέξτε το σωστό μοντέλο για τις απαιτήσεις ταχύτητας, ποιότητας και κόστους της εφαρμογής σας
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Καλύτερα για: Γρήγορο μοντέλο & second standency, ιδανικό για εφαρμογές σε πραγματικό χρόνο και chatbots
Δοκίμασε. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Καλύτερα για: Streaming TTS με φωνητική κλωνοποίηση για φωνητικές εφαρμογές βοηθού
Δοκίμασε. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Καλύτερα για: Συνομιλία AI με φυσικό συγχρονισμό για chatbot και βοηθός φωνής
Δοκίμασε. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Καλύτερα για: Δωρεάν, μοντέλο μόνο CPU για εφαρμογές μεγάλου όγκου με μηδενικό πιστωτικό κόστος
Δοκίμασε. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Καλύτερα για: Ηχητική γενιά με ηχητικά εφέ για δημιουργικές και ψυχαγωγικές εφαρμογές
Δοκίμασε. BarkΠώς να ολοκληρώσετε το TTS API
Από την εγγραφή στην πρώτη κλήση API σε λιγότερο από 5 λεπτά
Πάρτε το κλειδί API σας
Εγγραφείτε δωρεάν και δημιουργήστε ένα πλήκτρο API από το ταμπλό του λογαριασμού σας.
Κάντε την Πρώτη Σας Κλήση
POST να /v1/tts με κείμενο, μοντέλο, και τη φωνή. Αποκτήστε ήχου bytes πίσω. Κάτω από 5 γραμμές κώδικα.
Επιλέξτε το πρότυπό σας
Συγκρίνετε την ταχύτητα, την ποιότητα και το κόστος ανά γενιά.
Πλοίο προς Παραγωγή
Καθυστέρηση με pay-as-you-go χαρακτήρες. Δεν όρια τιμών για πληρωμένα σχέδια. Παρακολουθήστε τη χρήση στο ταμπλό σας.
Παραδείγματα κώδικα γρήγορης εκκίνησης
Ενσωμάτωση TTS.ai σε οποιαδήποτε γλώσσα με REST API μας
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Τι Κατασκευάζουν οι Προγραμματιστές με TTS.ai
Κοινά πρότυπα και εφαρμογές ενσωμάτωσης
AI Chatbots & Assistants
Προσθέστε την έξοδο φωνής στο chatbot σας ή βοηθό AI. Απαντήσεις σωλήνα LLM μέσω TTS για συνδέσεις φωνητικής ενεργοποίησης. Το Kokoro παρέχει υποδευτερόλεπτη καθυστέρηση για συνομιλίες σε πραγματικό χρόνο.
- LLM απάντηση στον αγωγό ομιλίας
- Υποδευτερόλεπτη καθυστέρηση με το Kokoro
- Συνομιλία με το Consume CSM
- Στροφή εξόδου ήχου
Κινητές και φωνητικές εφαρμογές
Κατασκευάστε εφαρμογές κινητής τηλεφωνίας, εργαλεία προσβασιμότητας, εφαρμογές ανάγνωσης και πλατφόρμες εκμάθησης γλωσσών. REST API μας λειτουργεί με οποιοδήποτε κινητό πλαίσιο. Κατεβάστε αρχεία ήχου ή stream απευθείας στον πελάτη.
- React Native, Flutter, Swift, Kotlin
- Εφαρμογές προσβασιμότητας και ανάγνωσης
- Πλατφόρμες εκμάθησης γλωσσών
- Παραγωγή ηχητικού περιεχομένου
Προϊόντα SaaS
Λευκές δυνατότητες φωνής στο προϊόν SaaS σας. Προσθέστε TTS, STT, κλωνοποίηση φωνής, και επεξεργασία ήχου ως χαρακτηριστικά στην πλατφόρμα σας. Χρησιμοποιήστε API μας ως φωνητικό backend σας χωρίς τη διαχείριση της υποδομής GPU.
- Χαρακτηριστικά φωνής λευκού σήματος
- Δεν απαιτείται υποδομή GPU
- Τιμή πληρωμής ανά χρήση
- 20+ μοντέλα για να προσφέρετε τους χρήστες σας
Αγωγοί αυτοματισμού
Ενσωμάτωση της παραγωγής φωνής σε αγωγούς CI / CD, αυτοματισμού περιεχομένου, και των ροών εργασίας επεξεργασίας παρτίδα. Δημιουργήστε χιλιάδες αρχεία ήχου από τα δεδομένα υπολογιστικών φύλλων, την παραγωγή automate podcast, ή να οικοδομήσουμε αγωγούς εντοπισμού περιεχομένου.
- Επεξεργασία παρτίδας μέσω API
- Αγωγοί εντοπισμού περιεχομένου
- Ενσωμάτωση CI/CD
- Υπολογιστικό φύλλο σε ακουστική αυτοματοποίηση
Προδιαγραφές API
Κατασκευασμένο για εφαρμογές παραγωγής
20+
Μοντέλα TTS
100+
Φωνές
30+
Γλώσσες
<1s
Latency (Kokoro)
Συχνές Ερωτήσεις
Κοινές ερωτήσεις σχετικά με τον TTS.ai προγραμματιστή API
Τι θα μπορούσαμε να βελτιώσουμε; Τα σχόλιά σας μάς βοηθούν να διορθώσουμε τα ζητήματα.
Έτοιμος να Φτιάξεις με Φωνητική Αλ;
Αποκτήστε το δωρεάν κλειδί API και ξεκινήστε την οικοδόμηση. 50 μονάδες για την εγγραφή, δωρεάν μοντέλα διαθέσιμα, περιεκτική τεκμηρίωση.