உண்மையான நேரம் TTS

உரை-இன்-பேச்சு-இணையத்தை-நேரடி-முதற்-ஒலி-தொலைவு-இடமாற்றத்துடன். குரல்-அதிகாரிகள் மற்றும் நேரடி பயன்பாடுகளுக்கு உருவாக்கப்பட்டது.

உங்கள் மொழியில் TTS குரல்கள் இன்னும் எங்களிடம் இல்லை. உங்களை சேர்க்க எங்களுக்கு உதவுங்கள்! உமது குரலை விற்றுவிடு

உரை

ஒலிபரப்பு
0/5,000 எழுத்துக்கள் ~0.3s முதல் ஒலி

குரல் அமைப்புகள்

திறந்த-வழி வடிவங்கள் மட்டுமே.

நேரடி தாமதம்

முதல்-ஒலி தாமதத்தை அளவிட ஸ்டிரீம் க்ளிக் செய்யவும்

வெளியீடு

ஒலி துண்டுகள் இங்கே ஒலிக்கப்படும்.

0:00
முதல் துண்டு:
மொத்த துண்டுகள்: 0
மொத்த நேரம்:

TTS செயல்பாடுகள் எப்படிName

1. உரை அனுப்பு

POST உரை /v1/tts/stream/ க்கு சேவையகம்-அனுப்பிய நிகழ்வுகள் கோரிக்கையாகும்.

2. மாதிரி உருவாக்குகிறது

கோகோரோ உரைகளைச் சுருக்கி, ஒலி மாதிரி-அடிப்படையில் மாதிரியை ஜிபியுவில் உருவாக்குகிறது.

3. ஸ்டிரீம் ச்ங்கக்ஸ்

Base64-குறியாக்கப்பட்ட WAV துண்டுகள் SSE வழியாக வந்து உடனடியாக விளையாடத் தொடங்குகின்றன.

4. நேரடி கேட்பு

பயனர் ஒரு நொடிக்கு கீழ் வாக்கியத்தின் தொடக்கத்தைக் கேட்கிறார், நீண்ட உள்ளீடுகள் மீது கூட.

பயன்பாட்டு வழக்கங்கள்

அங்கு sub-வினாடி தாமதம் புதிய அனுபவங்களை திறக்க.

குரல் செயலிகள்

ஒரு மனிதன் செய்யும் விரைவாக பதில் உரையாடல் ரோபோட்டுகள்.

நேரடி ஒலி மாற்றம்

இடைமாற்றம் இடைநிறுத்தங்கள் இல்லாமல் ஒரு பாய்வை மொழிபெயர்க்கவும், உண்மையான நேரத்தில் ஒலிக்கவும்.

விளையாட்டுகள்

NPC உரையாடல் விளையாட்டாளர் தேர்வுகளுக்கு உடனடியாக பதிலளிக்கிறது, முன்- காட்சிப்படுத்தப்பட்ட VO இல்லை.

அணுகக்கூடிய

திரை வாசிப்பவர்களும் உதவியாளர் கருவிகளும் பயனர் க்ளிக் செய்தவுடன் பேசத் தொடங்கும்.

உண்மையான நேரம் TTS திட்டங்கள்

இலவசமாகத் தொடங்கவும், தேவைப்படும் போது மேம்படுத்தவும்

இலவச
  • கோகோரோ ஒலிபரப்பு (இலவச மாதிரி)
  • ஒவ்வொரு தலைமுறைக்கும் 500 எழுத்துக்கள்
  • 10 இலவச ஒளிபரப்புகள்/நாள் ஒரு பெயரிடப்படாத பயனர்
  • துணை-நொடி முதல்-ஒலி தாமதம்
  • HTTPS க்கு மேல் SSE ஒலிபரப்பு
மிகவும் பிரபலமான
இலவச கணக்கு
  • 15,000 எழுத்துக்கள் பதிவு
  • ஒவ்வொரு பீடைக்கும் 5,000 எழுத்துக்கள்
  • நிரல் அணுகலுக்கு API விசை
  • தலைமுறை வரலாறு
  • தினசரி பாய்வு வரம்பு இல்லை
பதிவு செய்யவும்
புரொ
  • MOSS- TTS- உண்மையான நேரம் (உயிருள்ள போது)
  • ஒவ்வொரு பீடைக்கும் 100,000 எழுத்துக்கள்
  • முன்னுரிமை GPU வரிசை
  • குரல் செயலி + Twilio ஒருங்கிணைப்பு
  • அதிக விகித வரம்புகள்
மேம்படுத்தல்

அடிக்கடி கேட்கப்படும் கேள்விகள்

உண்மையான நேர உரை- இருந்து- பேச்சு ஒலி துண்டுகளை உருவாக்குகிறது, முழு வாக்கியமும் முடிவடைவதற்கு காத்திருப்பதை விட. முதல் ஒலி மாதிரி ஒரு நொடிக்கு கீழே வருகிறது, இது நேரடி குரல் எஜென்ட்களுக்கு, ஒலி மாற்று, மற்றும் நேரடியான பயன்பாடுகளுக்கு பொருத்தமானது.

வழக்கமான TTS முழு ஒலி கோப்பினை உருவாக்குகிறது, எதையும் திரும்பக் கொடுக்கும் முன் - நீங்கள் காத்திருக்க, பின்னர் முழு வாக்கியத்தையும் ஒரே நேரத்தில் கேட்கலாம். உண்மையான நேரம் TTS சேவையகம்- அனுப்பிய நிகழ்வுகளை (SSE) பயன்படுத்துகிறது, அவற்றை மாதிரி உருவாக்கும் போது குறுகிய ஒலி துண்டுகளை ஒலிக்கச் செய்கிறது. பயனர் வாக்கியத்தின் ஆரம்பத்தை கிட்டத்தட்ட உடனடியாகக் கேட்கிறார், நீண்ட உள்ளீடுகள் இருந்தாலும் கூட.

கோகோரோ முன்னிருப்பு பின்னணி - இது நவீன GPU யில் உண்மையான நேரத்தை விட சுமார் 100x வேகமாக ஒலியை உருவாக்குகிறது. நாம் MOSS-TTS-Realtime ஐ உயர்தர மாற்று வழியாக ஒருங்கிணைத்துள்ளோம்; பயனர்கள் ஒருமுறை அனுப்பப்பட்டால் ஒவ்வொரு கோரிக்கையிலும் தேர்ந்தெடுக்க முடியும்.

பொதுவான முதல்- ஒலி தாமதம் Kokoro ல் பொதுவான 300- 800ms பொதுவான இணைப்பு. பிணைய சுற்று- பயணம் அதன் பிறகு ஆதிக்கம் செலுத்துகிறது. இந்த பக்கம் UI யில் நேரடியாக அளவிடப்பட்ட முதல்- ஒலிக்கு நேரம் வெளிப்படுத்துகிறது எனவே ஒவ்வொரு கோரிக்கையும் எவ்வளவு நேரம் எடுத்தது என்பதை நீங்கள் சரியாக பார்க்கலாம்.

உரையாடலாக பதில் அளிக்கும் குரல் எஜென்ட்கள், ஊடகங்களை ஒளிபரப்புவதற்கான நேரடி ஒலிப்பதிவு, இடைமுக விளையாட்டு NPCகள், பயனர் க்ளிக் செய்யும் போது பேசத் தொடங்கும் அணுகக்கூடிய வாசகர்கள், ஒலிக்கு இரண்டு அல்லது மூன்று விநாடிகள் காத்திருக்கும் எந்தவொரு பயன்பாடும் மந்தமாக இருக்கும்.

ஆம். POST to https://api.tts.ai/v1/tts/stream/ with the same body as the regular /v1/tts/ endpoint. The response is an SSE stream of base64-encoded WAV chunks. The free tier supports 10 generations per day per anonymous user; authenticated users get the full per-account character allowance.

கோகோரோ முன் பயிற்சி பெற்ற குரல்களை பயன்படுத்துகிறது மற்றும் ஒத்ததில்லை. MOSS-TTS-Realtime (ஒத்துழைக்கப்பட்டால்)3விநாடிகள் குறிப்பிலிருந்து சுழல்-சொட்டு குரல் ஒத்ததை ஆதரிக்கிறது. முழுமையான குரல் ஒத்ததை இன்று, வழக்கமான /text-to-speech/ பக்கத்தை பயன்படுத்தவும் Chatterbox அல்லது GPT-SoVITS - அவை ஒலிபரப்பு செய்ய இயலாதவை ஆனால் தனிப்பயன் குரல்களை உருவாக்குகின்றன.

வழக்கமான TTS முடிப்பு புள்ளிக்கு ஒரே எழுத்து செலவு. Kokoro இலவச- தளத்தில் (1x செலவு). MOSS- TTS- உண்மையான நேரம் இயங்கும் போது நிலையான தளத்தில் (2x செலவு). இந்த ஒலித்தொடர்பு நெறிமுறை எந்த விலை கூடுதல் செலவையும் சேர்க்காது.

ஆம் - தொலைபேசி அழைப்புகளுக்கு நேரடி ஒலியை வழங்குவதற்கு டிவிலியோ குரல் வலைகூக்குடன் ஒலி ஒலியை இணைக்கவும். எங்கள் குரல் ஏஜென்ட் தளம் ஏற்கனவே IVR மற்றும் வெளியேறும் அழைப்புகளுக்கு இதைச் செய்கிறது. தொலைபேசி அழைப்பில் முடிவிலிருந்து முடிவிற்கு தாமதம் STT மற்றும் LLM பதில் உள்ளிட்ட 1-2 விநாடிகள்.

உங்கள் பிணையத்தின் ஒரு பகுதி போக்குவரத்தில் வீழ்ந்தால், ஒலி ஒலிப்பதிவு இயந்திரம் நிறுத்தப்படுவதை விட முன்னேறிவிடும். இடைவெளிகளை சகிக்க முடியாத பயன்பாடுகளுக்கு, வழக்கமான ஒலி ஒலிப்பதிவு இல்லாத முடிவுக்கு திரும்பவும், அல்லது ஒலி ஒலிப்பதிவைத் தொடங்குவதற்கு முன் 500 மில்லிசெகண்டுகள் இடைமாற்றம் செய்யவும்.
5.0/5 (1)

நாம் என்ன மேம்படுத்த முடியும்? உங்கள் கருத்துகள் பிரச்சினைகளை சரிசெய்ய உதவுகிறது.

உரையாடலை நேரடியாக ஒலிக்கச் செய்Name

ஒரு நாளைக்கு முதல் 10 தலைமுறைகளுக்கு இலவசம். முழு எழுத்து உரிமம் மற்றும் API அணுகலை திறக்க பதிவு செய்யவும்.