የጊዜ ርዝመት

የጽሑፍ-ወደ-ንግግር ስትሪሚንግ በሁለተኛው መጀመሪያ-ኦዲዮ ላቴንሲ. ለድምፅ ኤጀንቶች እና ለነፃ ፕሮግራሞች የተገነባ ነው.

አሁንም በቋንቋህ ላይ የቲቲኤስ ድምፆች የለንም። የራስህን ጨምርልን! ድምፅዎን ይሸጡ

ጽሑፍ

ስትሪሚንግ
0/5,000 ፊደላት ~0.3s የመጀመሪያው ድምፅ

የድምፅ ምርጫዎች

የቀጥታ-አቅጣጫ ሞዴሎች ብቻ

የቀን መቁጠሪያው ቀለም

የፊተኛ-ኦዲዮ ላቴንሲን ለመለካት ስትሪም ላይ ጠቅ ያድርጉ

ውጤት

የድምፅ ክፍሎች እዚህ ውስጥ ሲመጡ ይጫወታሉ

0:00
የመጀመሪያው ክፍል:
የሁሉንም ክፍሎች: 0
የጊዜ መጠን:

የቲቲኤስ ስትሪሚንግ እንዴት እንደሚሠራ

1. ጽሑፉን ላክ

የፖስት ጽሑፍ ወደ /v1/tts/stream/ እንደ ሰርቨር-የተላከ ክስተት ጥያቄ

2. ሞዴል ይፈጥራል

ኮኮሮ ጽሑፉን በክፍልዎች ይከፍላል እንዲሁም የድምፅ ምሳሌ-በምሳሌ በጂፒዩ ላይ ያወጣል

3. የዝግጅት ክፍሎች

Base64-encoded WAV chunk በSSE ላይ ይመጣል እና በፍጥነት መጫወት ይጀምራል

4. ቀጥታ መስማት

ተጠቃሚው የፍቺውን መጀመሪያ ከሁለት ሰከንዶች በታች ይሰማል፣ ረዥም መዝገቦች ላይም ቢሆን።

ጥቅም

የሁለተኛው ክፍለ ጊዜ ልዩነት አዲስ ተሞክሮዎችን የሚያከፈትበት ቦታ።

የድምፅ አሳሾች

እንደ ሰው በፍጥነት የሚመልሱ የንግግር ሮቦቶች

ቀጥ ያለ ድምፅ

በትክክል ጊዜ ውስጥ ቀጥል እና ድምፅ ቀጥል

ጨዋታዎች (_G)

የNPC ማያያዣ በፍጥነት ለጨዋታ ምርጫዎች የሚመለስ፣ ምንም ቀደም ሲል የተሰራ VO የለም

አቅላይነት

የስክሪን አንባቢዎች እና ተጠቃሚው ጠቅ ሲያደርግ የሚናገሩት የረዳት መሣሪያዎች

የጊዜ ርዝመት

ነጻ ይጀምሩ፣ የበለጠ ያስፈልግዎት ከሆነ ያሻሽሉ

ነጻ
  • ኮኮሮ ስትሪሚንግ (ነፃ ሞዴል)
  • ፊደላት
  • 10 ነጻ ስትሪም / ቀን ለእያንዳንዱ ያልታወቀ ተጠቃሚ
  • የሁለተኛው መጀመሪያ-ኦዲዮ ቀጠሮ
  • SSE በ HTTPS ላይ ስትሮሚንግ
በጣም ተወዳጅ
ነጻ
  • 15,000 አርእስቶች በምዝገባ
  • ፊደላት
  • የፕሮግራም መዳረሻ API ቁልፍ
  • የቀድሞው ዕይታ
  • የዕለት ስትሪም ጫፍ የለም
ነጻ
  • MOSS-TTS-Realtime (በሕይወት ወቅት)
  • ፊደላት
  • የGPU ፋይል
  • የድምፅ አሳሽ + Twilio ማቀናጀት
  • የከፍተኛ ፍጥነት ገደቦች
ደረጃ አሰጣጥ

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

የቀን-ጊዜ ጽሑፍ-ወደ-ንግግር ድምፅ ቅርጾች እንደ እነርሱ የተፈጠሩ, ሙሉ ቃላት ለማጠናቀቅ መጠበቅ አይደለም. የመጀመሪያው የድምፅ ምሳሌ በአንድ ሰከንድ ውስጥ ይመጣል, ለነፃ የድምፅ ኤጀንቶች, doubling, እና interactivity applications where latency matters ተስማሚ ያደርገዋል.

የቀን ተቀን TTS ምንም ከመመለሱ በፊት የሙሉውን የድምፅ ፋይል ያወጣል - ይታገሱ፣ ከዚያም ሙሉውን ቃል በአንድ ጊዜ ይሰማሉ። የወቅቱ TTS ሰርቨር-የተላኩ ክስተቶች (SSE) ቅርንጫፎችን ለመስጠት ሞዴሉ እንደሚያወጣቸው ይጠቀማል። ተጠቃሚው የቃልን መጀመሪያ በቀጥታ ይሰማል፣ ረዥም መዝገቦች ላይም ቢሆን።

ኮኮሮ የቀድሞው ኋላፊ ነው - በዘመናዊ ጂፒዩ ላይ ከውጤታማ ጊዜ በ 100x የበለጠ ፍጥነት ድምፅን ያወጣል. MOSS-TTS-Realtimeን እንደ ከፍተኛ ጥራት ያለው አማራጭ እናካትታለን፤ ተጠቃሚዎች በአንድ ጊዜ በአንድ ጥያቄ መምረጥ ይችላሉ።

የኮኮሮ መጀመሪያ-ድምፅ ማራዘሚያ በሕዝብ ግንኙነት ላይ 300-800 ሚሊሴኮንዶች ነው. ከዚያ በኋላ የኔትወርክ ዙር ጉዞ ይመራል። ገጹ በዩአይኤ ውስጥ የቀድሞውን ድምፅ ለመቀበል የቀረበውን ጊዜ ያሳያል ስለዚህ ጥያቄው ምን ያህል ጊዜ እንደወሰደ በትክክል ማየት ይችላሉ።

በንግግር የሚመለሱ የድምፅ አጋሮች፣ ለሚዲያ ስትሪሚንግ የቀጥታ ድምጽ ማጉያ፣ ተለዋዋጭ የጨዋታ NPCs፣ ተጠቃሚው በክሊክ ጊዜ የሚናገሩ የአቅላይነት አንባቢዎች፣ እና ለድምፅ ሁለት ወይም ሦስት ሰከንዶች መጠበቅ የሚቆይበት ማንኛውም ፕሮግራም ረዘም ያለ ጊዜ እንደሚወስድ ይሰማል።

አዎ. POST ወደ https://api.tts.ai/v1/tts/stream/ እንደ መደበኛ /v1/tts/ መጨረሻ ነጥብ ተመሳሳይ አካል ጋር. መልሱ የbase64-encoded WAV chunk SSE ስትሪም ነው. ነፃ ደረጃ ለየቀኑ ለየተጠቃሚው 10 ትውልዶች ይደግፋል; የተረጋገጡ ተጠቃሚዎች ለየሂሳብ ፊደል ሙሉውን ክፍያ ያገኛሉ.

ኮኮሮ ከፊት ለፊት የተሠሩ ድምጾችን ይጠቀማል እናም አይክሎን. MOSS-TTS-Realtime (በተካተተ ጊዜ) ከ3 ሰከንዶች መዝገብ ቤት ጀምሮ የዝግ-አውቶማቲክ የድምፅ ክሎኒንግን ይደግፋል. ዛሬ ለሙሉ የድምፅ ክሎኒንግ፣ የ/text-to-speech/ ገጽን ከቻተርቦክስ ወይም ከጂፒቲ-ሶቪትስ ጋር ይጠቀሙ - እነሱ ስትሪሚንግ-አቅኚ አይደሉም ግን የተለመዱ ድምጾችን ያመጡታል።

የፊደል ቅርጽ ዋጋ እንደ መደበኛ TTS መጨረሻ ነጥብ. ኮኮሮ ነጻ-ደረጃ (1x ዋጋ) ነው. MOSS-TTS-Realtime በተቻለ ጊዜ በስታንዳርድ ደረጃ (2x ዋጋ) ይሠራል. የስትሪም ፕሮቶኮል ምንም ዋጋ ተጨማሪ ዋጋ አይጨምርም.

አዎ - የቀጥታ መጨረሻ ነጥብ ጋር አንድ Twilio ድምፅ webhook ወደ ስልክ ጥሪ ውስጥ ቀጥታ ድምፅ ለመስጠት ማስተካከል. የድምፅ ኤጀንሲ መድረክችን አሁንም ይህ ለ IVR እና ውጭ ጥሪ ያደርጋል. መጨረሻ-ወደ-መጨረሻው ላቴንሲ በ ስልክ ጥሪ ላይ STT እና LLM መልስ ጨምሮ በዋናነት 1-2 ሰከንዶች ነው.

ኔትወርክዎ በትራንስፖርት ላይ ቢያልፍ፣ የስትሪም ተጫዋቹ ከመቆም ይልቅ ወደፊት ይሻገራል። ለፕሮግራሞች ክፍተቶችን ለመቋቋም የማይችሉ፣ ወደ መደበኛ ያልሆነ የመጨረሻ ነጥብ ይመለሱ፣ ወይም መጫወት ከመጀመሩ በፊት የድምፅ 500 ሚሊሰኮንዶችን ይቆጥቡ።
5.0/5 (1)

ምን ማሻሻል እንችላለን? አስተያየቶችዎ ችግሮችን ለመፍታት ይረዳሉ.

የንግግር መስመር

ለመጀመሪያዎቹ 10 ትውልዶች በየቀኑ ነፃ ነው. የሙሉ የፊደል መጠን እና API መዳረሻን ለመክፈት ይመዝገቡ.