Тодорхойгүй
Нэг секундын доторх эхний дууны саадгүйгээр текстээс яриа руу дамжуулах. Хэлний агентууд болон амьд програмуудад зориулсан.
ТТС-ийн дамжуулалт хэрхэн ажилладаг вэ
1. Хуваалцах
/v1/tts/stream/ руу POST текстийг серверээс илгээсэн үйл явдлын хүсэлт болгон илгээнэ.
2. Модель үүсгэнэ
Kokoro нь текстийг хэсэгчлэн хувааж, GPU дээр аудиог жишээгээр нь үүсгэнэ.
3. Хуваалцах
Base64-ээр кодлогдсон WAV файлууд SSE-ээр орж ирээд шууд тоглож эхэлнэ.
4. Жинхэнэ сонсох
Хэрэглэгч үгийн эхлэлийг секундээс бага хугацаанд сонсдог, урт оруулалт ч гэсэн.
Ашиглах тохиолдол
Нэг секундын дотор шинэ мэдрэмжийг нээж өгдөг.
Дууны агентууд
Хүний адилаар хурдан хариулах ярианы боттууд.
Жинхэнэ дуураймал
Буферийн завсарлагагүйгээр бодит цаг хугацаанд дамжуулалтыг орчуулж, дубляжлах.
Тоглоомууд
НӨХ-ийн сонголтод шууд хариу үйлдэл үзүүлдэг, өмнөх байдлаар дүрслэгдэж байгаагүй дууны дохио.
Хэрэглэгдэхүүн
Хэрэглэгч дарахад нь ярих дэлгэц унших болон туслах хэрэгслүүд.
Тодорхойгүй
Үнэгүйгээр эхэл, илүү хэрэгтэй бол шинэчл
- Kokoro дамжуулалт (хөнгөн загвар)
- 500 тэмдэгт нэг үе
- 10 үнэгүй урсгал/өдөр бүр нууц хэрэглэгч бүрт
- Хоёр дахь дууны дохионы хугацаа
- HTTPS дээрх SSE дамжуулалт
- 15000 тэмдэгт бүртгүүлэх үед
- 5000 тэмдэгт нэг урсгалд
- Программ нэвтрэх API түлхүүр
- Үйл явдлын түүх
- Өдөртхөгч урсгал хязгааргүй
- MOSS- TTS- Realtime (үнэгүй)
- 100,000 тэмдэгт нэг урсгалд
- График процессорын тэргүүлэх зэрэглэл
- Дуу дохионы агент + Twilio нэгдэл
- Дээд хурдны хязгаар
Заримдаа асуудаг асуултууд
Бид юуг сайжруулах ёстой вэ? Таны санал бодол бидэнд асуудал шийдвэрлэхэд тусалдаг.
Үнэн цаг хугацаанд яриа дамжуулах
Өдөрт эхний 10 үеийн хувьд үнэгүй. Бүх тэмдэгтийг ашиглах болон API-г ашиглах бол бүртгүүлээрэй.