Rəsmi TTS

Səs agentləri və canlı tətbiqlər üçün yaradılmış mətn-söhbətə axını, saniyənin altındakı ilk səs ləngiməsi ilə.

Sizin dilində hələlik TTS səsləri yoxdur. Bizə öz səslərinizi əlavə etməyə kömək edin! Səsini Sat

Mətn

Dağıdım
0/5,000 hərflər ~0.3s ilk audio

Səs Qurğuları

Yalnız stream-qabiliyyətli modellər.

Yayımlama Gecikməsi

İlk səs gecikməsini ölçmək üçün axını sıx

Çıxış

Audio parçaları axın daxil olduqda burada oynanacaq.

0:00
İlk parça:
Toplam parçalar: 0
Toplam vaxt:

TTS-in necə axını

Mətni Göndər

/v1/tts/stream/-ə server-göndərilmiş hadisələr tələbi kimi POST mətni göndər.

2. Model Yarat

Kokoro mətni parçalayır və GPU-da audio nümunə-nəsnə-nəsnə yaradır.

3. Axın parçaları

Base64-kodlaşdırılmış WAV parçaları SSE üzərindən gəlir və dərhal oynamağa başlayır.

4. Yayını Dinlə

İstifadəçi cümlənin başlanğıcını bir saniyədən az müddətdə, hətta uzun girişlərdə də eşidir.

İstifadə halları

Yeni texnologiyalar yeni imkanlar açır.

Səs Agentləri

İnsan kimi tez cavab verən söhbət botları.

Yay

Buffering fasiləsiz real vaxtda axını tərcümə və dublaj et.

Oyunlar

Oyunçu seçimlərinə dərhal reaksiya verən NPC dialoqu, əvvəlcədən göstərilmiş VO yoxdur.

Yetişilə Bilənlik

İstifadəçi basınca danışan ekran oxuyucuları və köməkçi alətlər.

Rəsmi TTS Planları

Pulsuz başlayın, daha çoxuna ehtiyacınız olduqda yüksəldin

Pulsuz
  • Kokoro axını (pulsuz model)
  • 500 karakter
  • 10 pulsuz axın/gün anonim istifadəçi başına
  • Birinci səsin saniyədən aşağı gecikməsi
  • HTTPS üzərindən SSE axını
Ən populyar
Hesab
  • 15,000 karakter qeydiyyatda
  • 5,000 karakter
  • Proqramlaşdırma üçün API açarı
  • Yaradıcılıq keçmişi
  • Günlük axın həddi yoxdur
Qeydiyyatdan keç
Pro
  • MOSS-TTS-Realtime (canlı olduqda)
  • 100,000 karakter
  • GPU-nun prioritet qrupu
  • Səs agenti + Twilio inteqrasiyası
  • Yüksək sürət həddi
Yenilə

Tez-tez Sorulan Sual

Rəsmi mətn-söhbətə axını bütün cümlənin bitməsini gözləmək əvəzinə səs parçalarını yaradıldıqda axıdır. İlk səs nümunəsi bir saniyədən az müddətdə gəlir, bu da onu canlı səs agentləri, dublaj və vaxtı çox olan interaktiv tətbiqlər üçün uyğun edir.

Əsas TTS heç nə geri qaytarmadan əvvəl tam audio faylı yaradır - siz gözləyirsiniz, sonra isə bütün cümləni bir anda eşidirsiniz. Rəsmi TTS modelin onları istehsal etdiyi kimi qısa audio parçalarını axıtmaq üçün Server-Send Events (SSE) istifadə edir. İstifadəçi uzun girişlərdə belə cümlənin başlanğıcını tez eşidir.

Kokoro ön qurğulu arxa qurğudur - müasir GPU-da real vaxtdan təxminən 100x sürətli səs yaradır. Biz MOSS-TTS-Realtime-ni daha keyfiyyətli alternativ kimi birləşdiririk; istifadəçilər bu təklif edildikdən sonra istəklərinə görə seçmək imkanı əldə edəcəklər.

Kokoroda ilk səsin gözləmə müddəti ictimai bağlantı üzərində 300-800ms-dir. Bundan sonra şəbəkənin dönmə sürəti üstünlük təşkil edir. Səhifə UI-də ilk səsin gözləmə müddətini göstərir, beləliklə hər bir istəyin nə qədər vaxt çəkdiyini görə bilərsiniz.

Konversasiya ilə cavab verən səs agentləri, canlı media üçün canlı dublaj, interaktiv oyun NPC-ləri, istifadəçinin kliklədiyi anda danışmağa başlayan əlçatanlıq oxucular və audio üçün iki və ya üç saniyə gözləmək üçün hər hansı bir tətbiq yavaş hiss edəcək.

Bəli. POST-u https://api.tts.ai/v1/tts/stream/-ə /v1/tts/ son nöqtəsi ilə eyni bədənlə göndər. Cavab SSE-də base64-kodlaşdırılmış WAV parçalarından ibarət axındır. Pulsuz səviyyə anonim istifadəçi üçün gündə 10 nəsil dəstəkləyir; tanınan istifadəçilər hesab üçün tam karakter icazəsini alır.

Kokoro əvvəlcədən hazırlanmış səsləri istifadə edir və klonlamaz. MOSS-TTS-Realtime (iqtisadi olaraq birləşdirildikdə) 3 saniyəlik istinaddan zero-shot səs klonlamasını dəstəkləyir. Bu gün tam səs klonlaması üçün Chatterbox və ya GPT-SoVITS ilə /text-to-speech/ səhifəsindən istifadə edin - bunlar axın qabiliyyəti yoxdur, lakin öz səslərini istehsal edirlər.

Əsas TTS son nöqtəsi kimi eyni xarakter qiyməti. Kokoro pulsuz səviyyəlidir (1x qiymət). MOSS-TTS-Realtime fəallaşdırıldıqda standart səviyyədə (2x qiymət) işləyər. İşıqlandırma protokolu heç bir qiymət əlavəsi əlavə etmir.

Bəli — axın son nöqtəsi telefon zənginə canlı səs göndərmək üçün Twilio səs webhook ilə cütləşir. Bizim səs agent platformamızın bu işi IVR və çıxan zənglər üçün artıq edir. Telefon zəngində son-son gecikmə STT və LLM cavabı da daxil olmaqla 1-2 saniyədir.

Əgər şəbəkənin bir hissəsi keçiddə dağılsa, axın oynatıcısı dayanmadan əvvəl irəli gedəcəkdir. Açıqlara dözə bilməyən proqramlar üçün, axın olmayan normal son nöqtəyə geri dön, ya da oynatma başlamazdan əvvəl 500ms audio ara yaddaşı saxla.
5.0/5 (1)

Nəyi yaxşılaşdıra bilərik? Sizin rəyiniz problemləri düzəltməyə kömək edir.

Göründüyü kimi səsi axın et

Gündə ilk 10 nəsil üçün pulsuzdur. Tam simvol icazəsi və API girişi üçün qeyd olun.