ຂໍ້ຄວາມ​ເປັນ​ການ​ເວົ້າ API ສໍາລັບ​ຜູ້​ພັດທະນາ

ສ້າງແອັບພລິເຄຊັນທີ່ຮອງຮັບສຽງດ້ວຍ REST API ຂອງພວກເຮົາ. ເພີ່ມຂໍ້ຄວາມທໍາມະຊາດໄປສູ່ການເວົ້າ, ການກັ່ນຕອງສຽງ, ການເວົ້າໄປຫາຂໍ້ຄວາມ, ແລະ ການປຸງແຕ່ງສຽງໃຫ້ກັບແອັບພລິເຄຊັນ, chatbots, ຜູ້ຊ່ວຍສຽງ, ແລະຜະລິດຕະພັນ SaaS ຂອງທ່ານ. ຮູບແບບທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI, ແບບ 20 +, ການລວມຕົວງ່າຍດາຍ.

REST API ສົນທະນາ​ កម្មវិធី​ສຽງName ຜະລິດຕະພັນ SaaS ການ​ເຮັດ​ໃຫ້​ອັດຕະໂນມັດ

ທົດລອງໃຊ້​ມັນ​ດຽວ​ນີ້

ຟຣີ​ກັບ Kokoro, Piper, VITS, MeloTTS
ສຽງ​ທີ່​ໄດ້​ສ້າງ​ຂຶ້ນ​ຂອງ​ທ່ານ​ຈະ​ປາກົດ​ຢູ່​ທີ່​ນີ້
ສ້າງ​ຂຶ້ນ
ດາວໂຫລດ
ຮັກ TTS.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!

ຄຸນສົມບັດ API ສຳ ລັບ​ຜູ້ພັດທະນາ

ທຸກ​ສິ່ງ​ທີ່​ທ່ານ​ຕ້ອງການ​ເພື່ອ​ສ້າງ​ໂປແກຼມ​ທີ່​ສາມາດ​ເວົ້າ​ໄດ້

REST API ງ່າຍ

ຄໍາຮ້ອງຂໍ POST ຫນຶ່ງເພື່ອສ້າງການເວົ້າ. ຄໍາຮ້ອງຂໍ JSON, ການຕອບສະຫນອງສຽງ. ເຮັດວຽກກັບພາສາໂປຣແກຣມໃດຫນຶ່ງທີ່ສະຫນັບສະຫນູນ HTTP.

ເຂົ້າກັນໄດ້​ກັບ OpenAI

Drop-in ແທນ OpenAI TTS API. ປ່ຽນ base_url ແລະ API ຂອງທ່ານ - ລະຫັດທີ່ມີຢູ່ເຮັດວຽກທັນທີ.

24+ ແບບທີ່ມີຢູ່

ເຂົ້າເຖິງທຸກແບບຜ່ານ API ດຽວ. ປ່ຽນແບບໂດຍການປ່ຽນປັອບແວ. ປຽບທຽບຄຸນນະພາບ, ຄວາມໄວແລະຄ່າໃຊ້ຈ່າຍ.

ເວລາ​ລໍຖ້າ​ພາຍ​ໃຕ້​ວິນາທີ

Kokoro ສ້າງສຽງໃນ 1 ວິນາທີ. ສົມບູນແບບ ສຳ ລັບ chatbots ເວລາຈິງ, ຜູ້ຊ່ວຍສຽງ, ແລະ កម្មវិធីທີ່ຕອບໂຕ້.

ສຽງ​ Cloning API

ຖ່າຍ​ແບບສຽງ​ໃດ​ກໍ​ໄດ້​ຈາກ​ຕົວຢ່າງ​ສຽງ​ສັ້ນໆ​ຜ່ານ API. ໃຊ້​ສຽງ​ທີ່​ຖ່າຍ​ແບບ​ສຳລັບ​ທຸກໆ​ລຸ້ນ​ຕໍ່​ໄປ.

ຫຼາຍຮູບແບບ

ສົ່ງອອກເປັນ WAV, MP3, OGG, ຫຼື FLAC. ເລືອກ​ອັດຕາ​ຕົວຢ່າງ ແລະ ຄວາມເລິກ​ບິດ. ສະໜັບສະໜູນ​ການ​ຖ່າຍ​ທອດ​ສຽງ​ສຳລັບ​ແອັບພລິເຄຊັນ​ເວລາ​ຈິງ.

ແບບຢ່າງທີ່ດີທີ່ສຸດ ສຳ ລັບຜູ້ພັດທະນາທີ່ລວມເຂົ້າກັນ

ເລືອກ​ແບບທີ່​ເໝາະສົມ​ກັບ​ຄວາມ​ໄວ, ຄຸນນະພາບ ແລະ ຄ່າໃຊ້ຈ່າຍ​ຂອງ​ໂປແກຼມ​ຂອງທ່ານ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ດີທີ່ສຸດ ສຳ ລັບ: ແບບທີ່ໄວທີ່ສຸດ - ຄວາມລໍຖ້າພາຍໃຕ້ວິນາທີ, ດີເລີດ ສຳ ລັບແອັບພລິເຄຊັນເວລາຈິງແລະ chatbots

ພະຍາຍາມ Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ການ​ກັ່ນຕອງ​ສຽງ

ດີທີ່ສຸດ ສຳ ລັບ: ຖ່າຍທອດ TTS ດ້ວຍ​ການ​ກັ່ນຕອງ​ສຽງ​ສຳລັບ​ແອັບພລິເຄຊັນ​ຜູ້ຊ່ວຍ​ສຽງ

ພະຍາຍາມ CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

ດີທີ່ສຸດ ສຳ ລັບ: AI ການສົນທະນາທີ່ມີເວລາທໍາມະຊາດ ສຳ ລັບ chatbot ແລະ ສຽງຜູ້ຊ່ວຍ

ພະຍາຍາມ Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

ດີທີ່ສຸດ ສຳ ລັບ: ແບບຟອມ CPU-only ຟຣີ ສຳ ລັບ​ໂປແກຼມ​ທີ່ມີ​ປະລິມານ​ສູງ​ທີ່​ບໍ່​ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ

ພະຍາຍາມ Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ດີທີ່ສຸດ ສຳ ລັບ: ສ້າງສຽງດ້ວຍຜົນງານສຽງສຳລັບແອັບພລິເຄຊັນທີ່ສ້າງສັນ ແລະ ບັນເທີງ

ພະຍາຍາມ Bark

ວິທີການລວມເອົາ TTS API

ຈາກການລົງທະບຽນຈົນເຖິງການໂທ API ຄັ້ງ ທຳ ອິດໃນ5ນາທີ

1

ເອົາ​ກຸນແຈ API ຂອງທ່ານ

ລົງທະບຽນສໍາລັບການຟຣີແລະສ້າງກຸນແຈ API ຈາກ dashboard ບັນຊີຂອງທ່ານ. 15,000 ຕົວອັກສອນລວມ.

2

ໂທ​ຄັ້ງ​ທຳ​ອິດ​ຂອງທ່ານ

POST to /v1/tts with text, model, and voice. ເອົາ​ໂອ​ດີ​ໂອ​ໄບ​ທັດ​ຄືນ​ມາ. ​ພາຍ​ໃຕ້ 5​ ​ແຖວ​ຂອງ​ລະຫັດ.

3

ເລືອກ​ແບບ​ຂອງ​ທ່ານ

ທົດສອບແບບທີ່ແຕກຕ່າງກັນສໍາລັບກໍລະນີການນໍາໃຊ້ຂອງທ່ານ. ປຽບທຽບຄວາມໄວ, ຄຸນນະພາບ, ແລະຄ່າໃຊ້ຈ່າຍໃນແຕ່ລະລຸ້ນ.

4

ສົ່ງ​ໄປ​ຍັງ​ການ​ຜະລິດ

ຂະ ໜາດ ທີ່ມີຕົວອັກສອນຈ່າຍ-ຕາມ-ທ່ານ-ໄປ. ບໍ່ມີອັດຕາຈໍາກັດກ່ຽວກັບແຜນທີ່ຈ່າຍ. ຕິດຕາມການໃຊ້ງານໃນ dashboard ຂອງທ່ານ.

ຕົວຢ່າງ​ໂປຣແກຣມ​ເລີ່ມ​ຕົ້ນ​ໄວ

ລວມເອົາ TTS.ai ໃນພາສາໃດກໍ່ໄດ້ກັບ REST API ຂອງພວກເຮົາ

Python ນິຍົມ
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL ທົ່ວ​ໄປ
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
ຮູບແບບ​ທີ່​ເຂົ້າ​ກັນ​ໄດ້​ກັບ OpenAI ຫຼຸດ​ລົງ
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

ຜູ້ພັດທະນາສ້າງຫຍັງກັບ TTS.ai

ແບບຟອມການລວມຕົວແລະໂປແກຼມທີ່ໃຊ້ໄດ້ທົ່ວໄປ

AI Chatbots ແລະ ຜູ້ຊ່ວຍ

ເພີ່ມສຽງອອກມາໃຫ້ກັບ chatbot ຫຼືຜູ້ຊ່ວຍ AI ຂອງທ່ານ. ຕອບສະຫນອງ LLM ຜ່ານ TTS ສຳ ລັບອິນເຕີເຟດທີ່ອະນຸຍາດໃຫ້ມີສຽງ. Kokoro ສະຫນອງການຊັກຊ້າພາຍໃຕ້ສອງວິນາທີ ສຳ ລັບການສົນທະນາເວລາຈິງ. Sesame CSM ສ້າງການສົນທະນາສົນທະນາດ້ວຍເວລາທໍາມະຊາດ.

  • ການ​ຕອບ​ໂຕ້ LLM ໄປ​ຫາ​ສາຍ​ສົ່ງ​ການ​ເວົ້າ
  • ເວລາລໍຖ້າ​ພາຍໃຕ້​ວິນາທີ​ກັບ Kokoro
  • ເວົ້າ​ແບບ​ສົນທະນາ​ກັບ Sesame CSM
  • ຜົນອອກສຽງ​ສົດ

ໂທລະສັບມືຖື & ສຽງ

ສ້າງແອັບພລິເຄຊັນມືຖືທີ່ມີສຽງ, ເຄື່ອງມືເຂົ້າເຖິງ, ແອັບພລິເຄຊັນການອ່ານ, ແລະເວທີການຮຽນຮູ້ພາສາ. REST API ຂອງພວກເຮົາເຮັດວຽກກັບກອບມືຖືໃດໆ. ດາວໂຫລດໄຟລ໌ສຽງຫຼືສະທ້ອນໂດຍກົງໄປຫາລູກຄ້າ.

  • React Native, Flutter, Swift, Kotlin
  • ການ​ເຂົ້າ​ເຖິງ​ງ່າຍ ແລະ កម្មវិធី​ອ່ານ
  • ເວທີການຮຽນຮູ້ພາສາ
  • ສ້າງ​ເນື້ອໃນ​ສຽງ

ຜະລິດຕະພັນ SaaS

White-label ຄວາມສາມາດສຽງໃນຜະລິດຕະພັນ SaaS ຂອງທ່ານ. ເພີ່ມ TTS, STT, ການກັ່ນຕອງສຽງ, ແລະການປຸງແຕ່ງສຽງເປັນຄຸນລັກສະນະໃນເວທີຂອງທ່ານ. ນໍາໃຊ້ API ຂອງພວກເຮົາເປັນ backend ສຽງຂອງທ່ານໂດຍບໍ່ມີການບໍລິຫານພື້ນຖານໂຄງລ່າງ GPU.

  • ຄຸນສົມບັດ​ສຽງ White-label
  • ບໍ່ມີ​ພື້ນຖານ​ໂຄງລ່າງ GPU ທີ່​ຕ້ອງການ
  • ຄ່າໃຊ້ຈ່າຍ​ຕໍ່​ການ​ໃຊ້
  • 20+ ແບບຈໍາລອງທີ່ຈະສະເຫນີໃຫ້ຜູ້ໃຊ້ຂອງທ່ານ

ສາຍ​ສົ່ງ​ການ​自動化

ລວມການສ້າງສຽງເຂົ້າໃນການໄຫຼຂອງ CI / CD, ການອັດຕະໂນມັດເນື້ອຫາ, ແລະ ການໄຫຼຂອງການເຮັດວຽກການປຸງແຕ່ງ batch. ສ້າງໄຟລ໌ສຽງເປັນພັນໆຈາກຂໍ້ມູນ spreadsheet, ການຜະລິດ podcast ອັດຕະໂນມັດ, ຫຼືສ້າງເນື້ອຫາການຕັ້ງຄ່າທ້ອງຖິ່ນ.

  • ដំណើរការ​ແບດ​ຜ່ານ API
  • ສາຍ​ສົ່ງ​ການ​ແປ​ເນື້ອ​ໃນ​ເປັນ​ພາສາ
  • ການ​ລວມ​ເອົາ CI/CD
  • ແຜ່ນສະຫລຸບ​ໄປ​ຫາ​ການ​ອັດຕະໂນມັດ​ສຽງ

ຂໍ້​ກຳນົດ​ຂອງ API

ສ້າງ​ຂຶ້ນ​ເພື່ອ​ໃຊ້​ງານ​ໃນ​ການຜະລິດ

20+

ແບບ TTS

100+

ສຽງ

30+

ພາສາ

<1s

ເວລາ​ລໍຖ້າ (Kokoro)

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

ຄໍາຖາມທົ່ວໄປກ່ຽວກັບ TTS.ai ຜູ້ພັດທະນາ API

ຍິນດີ. API ຂອງພວກເຮົາປະຕິບັດຕາມຮູບແບບການເວົ້າສຽງ OpenAI. ຖ້າທ່ານໃຊ້ OpenAI Python ຫຼື JavaScript client library, ທ່ານສາມາດປ່ຽນເປັນ TTS.ai ໂດຍປ່ຽນຕົວກໍານົດການ base_url ແລະ api_key. ລະຫັດທີ່ໃຊ້ຢູ່ຂອງທ່ານເຮັດວຽກໂດຍບໍ່ຕ້ອງປ່ຽນແປງ.

Kokoro ສ້າງສຽງໃນພາຍໃຕ້ 1 ວິນາທີສໍາລັບຄໍາສັບທົ່ວໄປ. CosyVoice 2ສະຫນັບສະຫນູນການອອກສຽງສົດສໍາລັບ latency ຕ່ໍາກວ່າ. ສໍາລັບ chatbots ແລະຜູ້ຊ່ວຍສຽງ, ເວລາທັງຫມ round-trip ແມ່ນປົກກະຕິແລ້ວ 1-3 ວິນາທີຂຶ້ນກັບຄວາມຍາວຂອງຂໍ້ຄວາມແລະຕົວແບບການເລືອກ.

ແບບຟອມຟຣີ (Kokoro, Piper, VITS, MeloTTS) ຄ່າໃຊ້ຈ່າຍສະເລ່ຍ 0. ແບບຟອມມາດຕະຖານ 2. ຄ່າໃຊ້ຈ່າຍໃນແຕ່ລະ 1,000 ຕົວອັກສອນ. ແບບຟອມພິເສດ 4. ຄ່າໃຊ້ຈ່າຍໃນແຕ່ລະ 1,000 ຕົວອັກສອນ. ລົງທະບຽນຟຣີກັບ 15 ຄະແນນ. ແຜນເລີ່ມຕົ້ນທີ່ $9/ເດືອນສໍາລັບ 500 ຄະແນນ.

ຍອມຮັບ. ອັບໂຫລດຕົວຢ່າງສຽງທີ່ອ້າງອີງ (5-30 ວິນາທີ) ໄປຍັງຈຸດສຸດທ້າຍຂອງການຖ່າຍທອດສຽງ, ຈາກນັ້ນໃຊ້ລະຫັດສຽງທີ່ຖ່າຍທອດໃນຄໍາຮ້ອງຂໍ TTS ຕໍ່ໄປ. ແບບທີ່ສະຫນັບສະຫນູນການຖ່າຍທອດປະກອບມີ CosyVoice 2, Chatterbox, Fish Speech, ແລະ GPT-SoVITS.

ຊັ້ນຟຣີມີອັດຕາການຈໍາກັດພື້ນຖານ (3 ຄໍາຮ້ອງສະຫມັກຕໍ່ຊົ່ວໂມງໂດຍບໍ່ມີບັນຊີ). ແຜນທີ່ຈ່າຍມີອັດຕາການຈໍາກັດທີ່ເຫມາະສົມສໍາລັບຄໍາຮ້ອງສະຫມັກການຜະລິດ.

WAV (ບໍ່​ໄດ້​ບີບອັດ, ຄຸນ​ນະ​ພາບ​ສູງ​ສຸດ), MP3 (ບີບອັດ, ໄຟ​ລ໌​ທີ່​ນ້ອຍ​ກວ່າ), OGG (ຮູບແບບ​ເປີດ), ແລະ FLAC (ບີບອັດ​ທີ່​ບໍ່ມີ​ການ​ສູນ​ເສຍ). ລະບຸ​ຮູບແບບ​ໃນ​ການ​ຮ້ອງຂໍ​ຂອງທ່ານ. ແບບ​ເດີມ​ແມ່ນ WAV ທີ່​ອັດຕາ​ຕົວຢ່າງ​ຂອງ​ແບບ​ແບບ.

ຍິນດີຕ້ອນຮັບ. ລວມເອົາ TTS API ຂອງພວກເຮົາກັບແບບຟອມການເວົ້າ-ຫາ-ຂໍ້ຄວາມແລະ LLM ເພື່ອສ້າງສາຍສົ່ງຜູ້ຊ່ວຍສຽງທີ່ສົມບູນແບບ. Kokoro ສະຫນອງການຊັກຊ້າພາຍໃຕ້ວິນາທີທີ່ເຫມາະສົມສໍາລັບການສົນທະນາເວລາຈິງ. CosyVoice 2ສະຫນັບສະຫນູນການອອກສຽງສົດສໍາລັບເວລາຕອບສະຫນອງທີ່ຍັງຕ່ໍາກວ່າ.

CosyVoice2ແລະ Kokoro ສະໜັບສະໜູນການສົ່ງອອກສຽງແບບສົດໆ ບ່ອນທີ່ຊິ້ນສຽງຖືກສົ່ງອອກເມື່ອພວກມັນຖືກສ້າງຂຶ້ນ. ສິ່ງນີ້ຫຼຸດເວລາ-ເຖິງ-ໄບທີ-ທຳອິດ ສຳ ລັບ​ໂປແກຼມເວລາຈິງ ເຊັ່ນ​ຜູ້ຊ່ວຍສຽງ ແລະ ປະສົບການ​ແບບ​ໂຕ້ຕອບ.

API ສົ່ງຄືນລະຫັດສະຖານະ HTTP ມາດຕະຖານ. ປະຕິບັດ backoff ຕົວເລກສໍາລັບຂໍ້ຜິດພາດ 5xx ແລະອັດຕາການຕອບສະຫນອງຈໍາກັດ. ສໍາລັບໂຄງການ mission-critical, ເພີ່ມຄໍາສັ່ງກັບຕໍາແຫນ່ງລໍຖ້າ. API ຂອງພວກເຮົາມີເວລາສູງຂຶ້ນແຕ່ການແກ້ໄຂຂໍ້ຜິດພາດທີ່ແຂງແຮງແມ່ນແນະນໍາໃຫ້ເປັນປົກກະຕິ.

ແມ່ນແລ້ວ. ຈຸດສຸດທ້າຍ /v1/voices ແລະ /v1/models ສົ່ງຄືນລາຍຊື່ JSON ຂອງສຽງ ແລະ ແບບຟອມທີ່ໃຊ້ໄດ້ທັງ ໝົດ ພ້ອມດ້ວຍ metadata ຂອງພວກມັນ (ການສະໜັບສະໜູນພາສາ, ການຈັດອັນດັບຄຸນນະພາບ, ການຈັດອັນດັບຄວາມໄວ, ແລະ ລະດັບລາຄາ). ໃຊ້ພວກມັນເພື່ອສ້າງຕົວເລືອກແບບຟອມແບບດັ້ງເດີມໃນໂປແກຼມຂອງທ່ານ.

ແບບຟອມຟຣີ (Kokoro, Piper, VITS, MeloTTS) ໃຫ້ບໍລິການເປັນ sandbox ທີ່ມີປະສິດຕິຜົນນັບຕັ້ງແຕ່ພວກເຂົາມີຄ່າໃຊ້ຈ່າຍສະເລ່ຍສະເລ່ຍ. ທົດສອບການລວມຕົວຂອງທ່ານກັບແບບຟອມຟຣີ, ຫຼັງຈາກນັ້ນປ່ຽນເປັນແບບຟອມ premium ໃນການຜະລິດໂດຍການປ່ຽນຕົວກໍານົດການແບບຟອມ. ບໍ່ມີສະພາບແວດລ້ອມການທົດສອບທີ່ແຍກຕ່າງຫາກທີ່ຕ້ອງການ.

ແບບຈໍາລອງສ່ວນຫຼາຍຂອງພວກເຮົາແມ່ນ Open Source ແລະສາມາດເປັນເຈົ້າພາບຕົນເອງໄດ້. ຢ່າງໃດກໍຕາມ, ການເປັນເຈົ້າພາບຕົນເອງຮຽກຮ້ອງໃຫ້ມີຊັບພະຍາກອນ GPU ຢ່າງຫຼວງຫຼາຍ (ພວກເຮົາໃຊ້ 4x NVIDIA Tesla P40 ດ້ວຍ 96GB VRAM ລວມ). API ສະຫນອງທາງເລືອກທີ່ມີປະສິດທິພາບທາງດ້ານການເງິນໂດຍບໍ່ມີການບໍລິຫານພື້ນຖານໂຄງລ່າງ.
5.0/5 (1)

ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.

ພ້ອມທີ່ຈະສ້າງດ້ວຍ Voice AI ແລ້ວບໍ?

ໄດ້ຮັບຟຣີຂອງທ່ານ API ລະຫັດແລະເລີ່ມຕົ້ນການສ້າງ. 15,000 ຕົວອັກສອນກ່ຽວກັບລົງທະບຽນ, ແບບຟອມຟຣີມີ, ເອກະສານທີ່ກວ້າງຂວາງ.