Вақти воқеӣ TTS

Матни- ба- сухан бо лаҳзаи интизории аудиои аввал дар як сония. Барои агентҳои овозӣ ва барномаҳои зинда сохта шудааст.

Мо ҳанӯз овозҳои TTS-ро ба забони шумо надорем. Ба мо дар илова кардани овозҳои худ кӯмак кунед! Садои шуморо фурӯшед

& Матн

& Давом
0/5,000 Аломатҳо ~0.3s аудиои аввал

& Танзимоти овоз

Фақат моделҳои қодир ба интиқоли иттилоот.

Дараҷаи таъхир

Барои чен кардани интизории аудиои аввал ба ҷараён ангушт занед

& Хуруҷ

Дар ин ҷо қисмҳои аудиоӣ ба монанди равонкунӣ бозӣ карда мешаванд.

0:00
Қисми якум:
Ҳамагӣ қисмҳо: 0
Вақти умумӣ:

Чӣ тавр Stream TTS кор мекунад

1. Фиристодани матн

1999 – «Садои дил» – барои суруди «Садои дил»-и М.

2. Намунаи эҷодшуда

Kokoro матнро ба қисмҳо ҷудо мекунад ва намунаи аудиоро дар GPU эҷод мекунад.

3. Қисми ҷараён

1964 - «Шоҳнома»-и Фирдавсӣ ба забони тоҷикӣ ба табъ расид.

4. Ба таври зинда гӯш кардан

Дар ин ҷо ибтидои пайдоиши забони тоҷикӣ, яъне давраи аввали пайдоиши забони тоҷикӣ дар давраи Сомониён ба назар мерасад.

Истифодаи ҳолатҳо

Дар ин ҷо барои гузаронидани тадқиқоти илмӣ шароити мусоид фароҳам оварда шудааст.

Агентҳои овоз

Ботҳои муошират, ки ба таври зуд ба монанди инсон ҷавоб медиҳанд.

Дубора сабт кардан

Тарҷума ва дубляжи раванд дар вақти воқеӣ бе таваққуфҳои буферӣ.

Бозиҳо

Диалоги NPC, ки ба интихоби бозингар фавран ҷавоб медиҳад, бе VO- и пешакӣ сохташуда.

Дастрасӣ

Хонандагони экран ва асбобҳои ёрирасон, ки ҳангоми пахш кардани корбар сухан гуфтанро оғоз мекунанд.

Нақшаҳои TTS- и вақти воқеӣ

Бепул оғоз кунед, вақте ки ба шумо бештар лозим аст, навсозӣ кунед

Озод
  • Kokoro-и равон (модели озод)
  • 500 аломат дар як насл
  • 10 равониҳои ройгон/рӯз барои ҳар як корбари номаълум
  • Задержка первого звука до субсекунды
  • SSE-и равон аз HTTPS
Беҳтарин
Ҳисоби озод
  • 15000 аломат ҳангоми воридшавӣ
  • 5000 аломат дар як равон
  • Калиди API барои дастрасии барномавӣ
  • Таърихи эҷодкунӣ
  • Бе маҳдудияти рӯзона
Бақайдгирӣ
Про
  • MOSS- TTS- Realtime (ҳангоми зинда)
  • 100, 000 аломат дар як равон
  • Навбати GPU- и пешрафта
  • Агентҳои овозӣ ва якҷоякунии Twilio
  • Маҳдудияти суръати баланд
Навсозӣ

Саволҳои пурсидашаванда

Матни ба гуфтугӯи воқеӣ барои эҷоди қисмҳои аудиоӣ, ба ҷои интизори пурра ба итмом расидани ҷадвал, равон мекунад. Намунаи аудиоии аввал дар як сония меояд, ки ин барои агентҳои овозии зинда, дубляж ва барномаҳои интерактивӣ, ки дар он вақт аҳамият дорад, мувофиқ аст.

ТТС- и муқаррарӣ файли аудиоии пурраро пеш аз баргардонидани ягон чиз эҷод мекунад — шумо интизор мешавед, сипас тамоми ҷумларо якбора мешунавед. ТТС- и вақти воқеӣ ҳодисаҳои фиристодаи серверро (SSE) барои интиқоли қисмҳои аудиоии кӯтоҳ истифода мебарад, чунки модел онҳоро истеҳсол мекунад. Корванд оғози ҷумларо қариб ба таври худкор мешунавад, ҳатто дар воридоти дароз.

Kokoro пуштибонии пешфарзӣ мебошад — он садоро тақрибан 100x тезтар аз вақти воқеӣ дар GPU-и муосир эҷод мекунад. Мо MOSS-TTS-Realtime-ро ҳамчун алтернативаи сифати баландтар муттаҳид мекунем; истифодабарандагон метавонанд барои ҳар як дархост интихоб кунанд, вақте ки он фиристода мешавад.

Дархостҳои ибтидоии аудиоӣ дар Kokoro 300-800 мс дар пайвастшавии ҷамъиятӣ аст. Баъд аз он, сафари шабака ба ду тараф ҳукмрон аст. Саҳифа вақти ибтидоии аудиоиро дар интерфейси корбар нишон медиҳад, то шумо аниқ бубинед, ки ҳар як дархост чӣ қадар вақтро мегирад.

Дар ин ҷо барои гузаронидани машғулиятҳои гуногун, аз қабили омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ, омӯзиши забонҳои хориҷӣ ва ғайра, 2-3 соат вақт ҷудо карда мешавад.

Ба ростӣ. POST ба https://api.tts.ai/v1/tts/stream/ бо ҳамон ҷисм ҳамчун нуқтаи охирини муқаррарии /v1/tts/. Ҷавоб - SSE-и ҷараёни base64-кодшудаи WAV-и ченкунӣ. Сатҳи ройгон 10 наслро дар як рӯз барои ҳар як корбари номаълум дастгирӣ мекунад; корбарони аслшиносӣ барои ҳар як ҳисоб аломатҳои пурраро мегиранд.

Kokoro овозҳои аз пеш тайёршударо истифода мебарад ва клон намекунад. MOSS- TTS- Realtime (вақте ки интеграция шудааст) клонкунии овози zero- shot- ро аз истиноди 3- сония дастгирӣ мекунад. Барои клонкунии овози пурра имрӯз, саҳифаи муқаррарии / text- to- speech / - ро бо Chatterbox ё GPT- SoVITS истифода баред - онҳо қодир ба интиқоли овоз нестанд, аммо овозҳои оддиро истеҳсол мекунанд.

Ҳамон арзиши аломатҳо, ки дар нуқтаи охирини муқаррарии TTS. Kokoro дараҷаи ройгон (1x арзиш). MOSS- TTS- Realtime дар дараҷаи стандартӣ (2x арзиш) иҷро мешавад, вақте ки фаъол аст. Протоколи интиқоли иттилоот ягон арзиши иловагӣ илова намекунад.

Да — соедините конечную точку потока с веб-связкой голоса Twilio для подачи живого аудио в телефонный звонок. Платформа агента голоса нашего уже делает это для IVR и выходящих звонков. Задержка от конца к концу телефонного звонка обычно составляет 1-2 секунды, включая ответы STT и LLM.

Агар шабакаи шумо дар гузариш қисмеро аз даст диҳад, плеер ба ҷои боздоштан ба пеш ҳаракат мекунад. Барои замимаҳое, ки фосилаҳоро қабул намекунанд, ба нуқтаи охирини оддии бе гузариш баргардед ё 500 мс аудиоро пеш аз оғози бозикунӣ буферӣ кунед.
5.0/5 (1)

Чӣ чизро метавонем беҳтар кунем? Бозгашти шумо ба мо дар ислоҳи мушкилиҳо кӯмак мекунад.

Иттилооти фаврӣComment

Бепул барои 10 насли аввал дар як рӯз. Барои кушодани имконияти пурраи аломатҳо ва дастрасӣ ба API ба қайд гиред.