რეალურ დროში TTS
ტექსტის საუბრად გადამუშავება აუდიოს პირველი ხმა 1 წამის დაგვიანებით. შექმნილია საუბრის აგენტებისთვის და აქტიური პროგრამებისთვის. Name
ტექსტი
სტრიმინგიხმოვანი პარამეტრებიName
როგორ მუშაობს TTS- ის გადაცემა
1. ტექსტის გაგზავნა
PostScript 1.0-ის ოფიციალური საიტი PostScript 1.0-ის ოფიციალური საიტი PostScript 1.0-ის ოფიციალური საიტი
2. მოდელის შექმნა
Kokoro-მ ტექსტი დაჭერს და აუდიოს ნამუშევრები GPU-ზე გამოსცემს.
3. ნაკადის ნაჭრები
Base64-ით კოდირებულ WAV-ის ნაჭრები SSE-ზე მოდიან და იწყებენ თამაშს.
4. მყისიერი მოსმენა
ოჲრჲმ ოჲფსგჟრგა ჟვკსნეა ოჲ-კჲლკს ჟვ ჱაოჲფგა ოპვეთჱგჲეჲრ, თ ნა ეჲლდთ გლვჱნთ.
გამოყენების შემთხვევები
ჱაეყლზვნთვრჲ ჲრ ნწკჲლკჲ ჟვკსნეთ ჲრგჲპწ ნჲგთ ოპვზთგწგანთწ.
ხმოვანი აგენტებიName
ჟოჲპჲგთ ბჲრთ, კჲთრჲ ჲრდჲგჲპწრ ბყპჱჲ კარჲ ფჲგვკ.
ჟურნალი
აუდიოს გადათარგმნა და დუბაიტი რეალურ დროში, უბაფერის შეწყვეტის გარეშე.
თამაშებიName
NPC დიალოგი, რომელიც რეაგირებს მოთამაშის არჩევანს, არანაირი წინასწარ გაკეთებული VO.
დამხმარე ობიექტები
ეკრანის მკითხველი და დახმარების ინსტრუმენტები, რომლებიც იწყებენ საუბარს მომხმარებლის დაჭერის მომენტში.
რეალურ დროში TTS გეგმები
ჱაოჲფნთ ბვჱოლარნჲ, ოპვმვჟრთ ჟვ, კჲდარჲ რთ რპწბგა ოჲგვფვ
- Kokoro-ს სტრიმინგი (საბავშვო მოდელი)
- 500 სიმბოლო ერთ გენერაციაში
- 10 უფასო ნაკადი დღეში ანონსებულ მომხმარებელზე
- აუდიოს პირველი ხმა
- SSE-ს გადაცემა HTTPS-ზე
- 15000 სიმბოლო რეგისტრაციისას
- 5000 სიმბოლო ერთ ნაკადში
- API ღილაკი პროგრამული წვდომისათვის
- ისტორიის შექმნა
- ყოველდღიური ნაკადის საზღვრის არქონა
- MOSS- TTS- რეალურ დროში (თუ აქტიურია)
- 100, 000 სიმბოლო ერთ ნაკადში
- GPU- ს რიგის პრიორიტეტი
- ხმოვანი აგენტი + Twilio ინტეგრაციაName
- მაღალ დონეზე საზღვრები
ხშირად დასმული კითხვები
ჲბპარნარა ჟთ ჲბაგვჟრ ნთ ოჲმადა ეა ჟოპაგთმ ოპჲბლვმთრვ.
საუბრის რეალურ დროში გადაცემაName
უფასო დღეში პირველი 10 თაობისთვის. რეგისტრაცია, რომ გააქტიურდეს სიმბოლოების სრული რაოდენობა და API წვდომა.