Хөгжүүлэгчдэд зориулсан текстээс ярианы APIName

Бидний REST API-г ашиглан дуут програмуудыг бүтээ. Таны програм, чатбот, дуут туслах, SaaS бүтээгдэхүүнүүдэд байгалийн текстээс яриа, дууны клон, дуунаас текст, аудио боловсруулалтыг нэмнэ. OpenAI-тай нийцтэй формат, 20+ загвар, энгийн нэгтгэх.

REST API Чатботууд Сонсголын програмууд Бүтээгдэхүүн Автоматжуулалт

Одоо оролдох

Кокоро, Пайпер, VITS, МелоTTS-тэй чөлөөт
Таны үүсгэсэн дуу энд гарч ирнэ
Бүтээгдэхүүн
Дэлгэц
TTS.ai-г хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Хөгжүүлэгчдэд зориулсан API

Сонсголыг дэмжсэн програм бүтээхэд шаардлагатай бүх зүйл

Хөнгөн REST API

Нэг POST хүсэлтээр яриа үүсгэх. JSON хүсэлт, аудио хариулт. HTTP дэмждэг бүх програмчлалын хэл дээр ажиллана.

OpenAI-тай нийцтэй

OpenAI TTS API-ийн шилжүүлэгч. Таны base_url болон API түлхүүрийг солино - одоогийн код шууд ажиллана.

24+ загварууд

Бүх загварыг нэг API-аар нэвтрэх. Нэг параметрээр загварыг солих. Чадал, хурд, үнэ цэнийг харьцуулах.

Хоёрдахь секундын хугацаа алдалт

Kokoro нь 1 секундэд дууг үүсгэдэг. Үнэгүй чатбот, дууны туслах, интерактив програмуудад тохиромжтой.

Хөгжүүлэгч

Хэт авианы өгөгдлийг API- ээр дамжуулан олж авах. Бүх дараагийн үеийнхний хувьд олж авсан дуу хоолойг ашиглана.

Олон хэлбэрүүд

WAV, MP3, OGG, эсвэл FLAC хэлбэрээр гаргана. Жишээ авах хурд болон битийн гүнийг сонгоно. Үнэн цагийн програмуудад аудио дамжуулалтыг дэмжинэ.

Хөгжүүлэгчдийн нэгтгэх хамгийн сайн загварууд

Таны програмын хурд, чанар, өртөгт тохирсон загварыг сонгоно уу

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Хамгийн тохиромжтой: Хамгийн хурдан загвар - секундын доторх саатал, бодит цагийн програмууд болон чатботуудад тохиромжтой

Хийх Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Хөгжүүлэгч

Хамгийн тохиромжтой: Хөгжмийн туслах програмуудад зориулсан дууны клонтой TTS-ийг дамжуулах

Хийх CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Хамгийн тохиромжтой: Чатбот болон туслах дууны хувьд тохиромжтой цагийг тохируулсан ярианы AI

Хийх Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Хамгийн тохиромжтой: Үнэгүй, зөвхөн CPU-г ашигладаг, их хэмжээний програмуудад зориулсан, төлбөргүй загвар

Хийх Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Хамгийн тохиромжтой: Урлаг, зугаа цэнгэлийн програмуудад зориулсан дууны эффекттэй аудио үүсгэх

Хийх Bark

TTS API-г хэрхэн нэгтгэх вэ

Бүртгүүлэхээс эхлээд анхны API дуудлага5минутаас бага

1

Таны API түлхүүрийг авна

Үнэгүй бүртгүүлж, дансныхаа удирдлагын самбараас API түлхүүр үүсгэх. 15,000 тэмдэгт багтсан.

2

Эхний дуудлага

/v1/tts руу текст, загвар, дуугаар POST хийнэ. Аудио байтуудыг олж авна. 5-н мөрний код.

3

Таны загварыг сонгоно уу

Өөрийн хэрэглээний хэрэгцээнд тохирсон өөр өөр загваруудыг туршиж үзээрэй. Хурд, чанар, өртгийг харьцуулж үзээрэй.

4

Үйлдвэрлэлд илгээх

Татвар төлөх тэмдэгтүүдийг ашиглан хэмжээг өөрчлөх. Татвар төлөх төлөвлөгөөнд тарифын хязгаарлалт байхгүй. Дасгалжуулалтын самбар дээр хэрэглээг хянах.

Хурдан эхлүүлэх кодын жишээнүүд

REST API-тай TTS.ai-ийг ямар ч хэл дээр нэгтгэх

Python Хамгийн алдартай
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Олон улсын
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-тай нийцсэн хэв маяг Буцаах
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

TTS.ai-ийн хөгжүүлэгчид юу бүтээдэг вэ

Нэгдсэн нэгтгэх загварууд ба програмууд

AI Чатботууд ба туслахууд

Чатбот эсвэл AI туслахдаа дууны өгөгдлийг нэмнэ. LLM хариултыг дууны интерфэйсийг дэмжих TTS-ээр дамжуулна. Kokoro нь бодит цаг хугацаанд ярихдаа секундын дотор хариу өгөх боломжтой. Sesame CSM нь оновчтой цаг хугацаагаар ярих дууг үүсгэнэ.

  • LLM-ийн ярианы хоолойн хариуComment
  • Кокоротой секундын доод хагаст
  • Sesame CSM-ийн ярианы яриа
  • Аудио дамжуулалт

Зөөврийн болон дуут програмуудName

Хөгжим сонсох боломжтой гар утасны аппликейшн, хүртээмжтэй байдлын хэрэгслүүд, унших аппликейшн, хэл сурах платформуудыг бүтээ. Манай REST API нь ямар ч гар утасны програмтай ажиллана. Аудио файлуудыг татаж аваад шууд клиентэд дамжуулна.

  • React Native, Flutter, Swift, Kotlin
  • Хөгжлийн болон унших програмууд
  • Хэл сурах платформууд
  • Аудио агуулга үүсгэх

Үйлчилгээ

Таны SaaS бүтээгдэхүүнд White-label дуу хоолойн боломжууд. TTS, STT, дуу хоолойг дуурайлгах, аудио боловсруулалтыг платформдоо нэмнэ. Бидний API-г GPU дэд бүтцийг удирдах шаардлагагүйгээр дуу хоолойн backend болгон ашиглана.

  • Хэлний онцлогComment
  • График процессорын дэд бүтэц шаардагддаггүй
  • Хэрэглэхэд-төлбөр-төлбөр
  • Хэрэглэгчдэд санал болгох 20+ загвар

Автоматжуулалтын хоолой

CI/CD хоолой, агуулга автоматжуулалт, багц боловсруулалтын ажлын урсгалд дууны үүсгэгчийг нэгтгэх. Тоон гарын үсгийн мэдээллээс мянган аудио файл үүсгэх, подкаст үйлдвэрлэлийг автоматжуулах, эсвэл агуулга орчуулгын хоолойг бүтээх.

  • API-ээр багцлан боловсруулна
  • Контейнрийн орчуулгын хоолой
  • CI/CD нэгтгэх
  • Аудио автоматжуулалтад цахим хуудас

API тодорхойлолт

Үйлдвэрлэлийн програмууд

20+

ТТС загварууд

100+

Дуунууд

30+

Хэл

<1s

Хоцролт (Kokoro)

Заримдаа асуудаг асуултууд

TTS.ai хөгжүүлэгчийн API-ийн талаархи түгээмэл асуултууд

Тийм ээ. Бидний API нь OpenAI аудио ярианы форматыг дагадаг. Хэрэв та OpenAI Python эсвэл JavaScript клиентийн сан ашиглаж байгаа бол base_ url болон api_ key параметрүүдийг өөрчилснөөр TTS.ai руу шилжиж болно. Таны одоогийн код өөрчлөгдөөгүйгээр ажиллана.

Kokoro нь ердийн өгүүлбэрийг 1 секундын дотор бичнэ. CosyVoice 2- ийн урсгалын өгөгдлийг дэмждэг бөгөөд энэ нь илүү бага хугацаа шаарддаг. Чатбот болон дууны туслахуудын хувьд нийт аяллын хугацаа нь текстийн урт болон сонгосон загвараас хамааран 1-3секундын хооронд байдаг.

Үнэгүй загварууд (Kokoro, Piper, VITS, MeloTTS) 0кредитийн үнэтэй. Стандарт загварууд 1000 тэмдэгт тутамд 2кредитийн үнэтэй. Хамгийн үнэтэй загварууд 1000 тэмдэгт тутамд 4кредитийн үнэтэй. 15кредитийн үнэгүй бүртгэл. 500кредитийн төлөвлөгөө нь сарын 9$-оос эхэлнэ.

Тийм ээ. Хөгжүүлэгчийн дууны үр дүнг (5-30 секунд) дууны үр дүнгийн эцсийн цэг рүү татаж, дараагийн TTS хүсэлтүүдэд үр дүнгийн дууны ID-г ашиглана. Хөгжүүлэгчийн дууны үр дүнг дэмждэг загварууд нь CosyVoice 2, Chatterbox, Fish Speech, GPT-SoVITS.

Үнэгүй түвшин нь үндсэн хурдны хязгаарлалттай (3 хүсэлт цаг тутамд бүртгэлгүйгээр). Төлбөртэй төлөвлөгөө нь үйлдвэрлэлийн програмуудад тохиромжтой өндөр хурдны хязгаарлалттай. Аж ахуйн нэгжийн түвшний дамжуулалтын шаардлагыг бидэнтэй холбоо барина уу.

WAV (суулгаагүй, хамгийн өндөр чанартай), MP3 (суулгасан, жижиг файлууд), OGG (ойролцоогоор нээлттэй формат), FLAC (хамгаалалтын түвшин багатай). Хэлэлцээрт форматыг заана уу. Өгөгдөл нь загварын үндсэн дээжийн хурдтай WAV.

Тийм ээ. Бидний TTS API-г ярианаас текст болгох загвар болон LLM-тэй хослуулан дууны туслах хоолойг бүрэн бүтээж болно. Kokoro нь бодит цаг хугацаанд ярихдаа секундын доторх эргэлтийн хугацааг санал болгодог. CosyVoice 2 нь илүү бага хариулах хугацааг санал болгодог.

CosyVoice 2, Kokoro нь аудио хэсгүүдийг үүсгэхдээ шууд дамжуулах аудио дамжуулалтыг дэмждэг. Энэ нь дууны туслах болон интерактив туршлага зэрэг бодит цагийн програмуудад анхны байтыг гаргахад зарцуулах хугацааг багасгадаг.

API нь стандарт HTTP- ийн байдал кодыг буцаадаг. 5xx алдаа болон хурдны хязгаарлалт хариултуудад өргөтгөлийн буцаалт хийнэ. Ажилдаа чухал хэрэгслүүдэд дахин оролдох логиктой хүлээлт нэмнэ. Манай API нь өндөр ажиллагаатай боловч алдаа засах нь үргэлж зөвлөгддөг.

Тийм ээ. /v1/voices болон /v1/models төгсгөлийн цэгүүд нь бүх дуунууд болон загваруудын JSON жагсаалтыг мета өгөгдөлтэй нь (хэлний дэмжлэг, чанарын үнэлгээ, хурдны үнэлгээ, үнэлгээний түвшин) эргүүлж өгнө. Үүнийг програмдаа динамик загвар сонгогчийг бүтээхэд ашиглана уу.

Үнэгүй загварууд (Kokoro, Piper, VITS, MeloTTS) үнэгүй загваруудтай нэгтгэх боломжийг олгодог. Үүний дараа загварын параметрийг өөрчилснөөр үнэтэй загвар руу шилжинэ. Өөр өөр туршилтын орчин хэрэггүй.

Манай загваруудын ихэнх нь нээлттэй эхийн бөгөөд өөрсдөө байрлуулах боломжтой. Гэсэн хэдий ч, өөрсдөө байрлуулах нь ихээхэн хэмжээний ГПУ-ийн ресурс шаарддаг (бид 4x NVIDIA Tesla P40-ийг нийт 96GB VRAM-тай ашигладаг). API нь дэд бүтцийн удирдлагагүйгээр өртөг багатай сонголтыг санал болгодог.
5.0/5 (1)

Бид юуг сайжруулах ёстой вэ? Таны санал бодол бидэнд асуудал шийдвэрлэхэд тусалдаг.

Хэлний хиймэл оюун ухаанаар бүтээх бэлэн үү?

Таны үнэгүй API түлхүүрийг аваад бүтээж эхлээрэй. 15 кредит бүртгүүлэхэд, үнэгүй загварууд, дэлгэрэнгүй баримт бичиг.