የጽሑፍ-ወደ-ንግግር API ለተጠቃሚዎች

REST API ጋር የድምፅ-ተስማሚ ፕሮግራሞችን ይፍጠሩ. ተፈጥሯዊ ጽሑፍ-ወደ-ንግግር, የድምፅ ክሎኒንግ, ንግግር-ወደ-ጽሑፍ, እና የድምፅ ማቀነባበሪያን ወደ አፕሊኬሽኖች, ቻትቦቶች, የድምፅ ረዳቶች, እና SaaS ምርቶች. OpenAI-ተስማሚ ቅርጸት, 20 + ሞዴሎች, ቀላል ማቀናጀት.

REST API ቻትቦቶች የድምፅ ፕሮግራሞች ምርቶች አውቶማቲክ

አሁን ይሞክሩት

ነጻ ከኮኮሮ, ፒፐር, VITS, MeloTTS ጋር
የድምፅ ፋይል
የተፈጠረ
ያውርዱ
TTS.aiን ወዳጅነት?

ለተጠቃሚዎች

የድምፅ ፕሮግራሞችን ለመገንባት የሚያስፈልግዎ ሁሉ

ቀላል REST API

አንድ POST ጥያቄ ንግግር ለመፍጠር. JSON ጥያቄ, የድምፅ መልስ. ከ HTTP የሚደግፍ ማንኛውም ፕሮግራም ቋንቋ ጋር ይሠራል.

OpenAI-የሚስማማ

ለ OpenAI TTS API መተካት. base_url እና API ቁልፍዎን ይለውጡ - አሁን ያለው ኮድ በፍጥነት ይሠራል

24+ ሞዴሎች

ሁሉንም ሞዴሎች በአንድ API በመጠቀም ይጎብኙ. አንድ ፓራሜትር በመቀየር ሞዴሎችን ይለውጡ. ጥራት, ፍጥነት እና ዋጋን ይወዳደሩ.

ሴኮንዶች

ኮኮሮ ድምፅን በ1 ሰከንድ ውስጥ ያወጣል. ለነጻ-ጊዜ ቻትቦቶች፣ ለድምፅ ረዳቶች፣ እና ለተግባራዊ ፕሮግራሞች ተስማሚ ነው

የድምፅ ክሎኒንግ

የድምፅ ቅጂን ከቅርብ የድምፅ ምሳሌ በመጠቀም ከAPI ይደውሉ. ለሁሉም የወደፊቱ ትውልዶች የተጠለፉ ድምጾችን ይጠቀሙ

ብዙ ቅርጸቶች

ውጤቱን እንደ WAV, MP3, OGG, ወይም FLAC ይላኩ። የሳምፕ ፍጥነት እና የቢት ጥልቀት ይምረጡ። ለወቅታዊ ፕሮግራሞች የድምፅ ድጋፍ

የዲቨሎፐር ማቀናጀት

የፕሮግራምዎን ፍጥነት፣ ጥራት እና የገንዘብ ፍላጎቶች የሚስማማውን ሞዴል ይምረጡ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ምርጥ ለ: ፈጣን ሞዴል - የሁለተኛው ክፍል latency, ለ እውነተኛ ጊዜ አፕሊኬሽኖች እና ቻትቦቶች ተስማሚ

ሞክሩ Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 የድምፅ ክሎኒንግ

ምርጥ ለ: ለድምፅ ረዳት ፕሮግራሞች የድምፅ ክሎኒንግ ጋር TTS ማስተላለፍ

ሞክሩ CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

ምርጥ ለ: ቻትቦት እና ረዳት ድምፅ ጋር ተፈጥሯዊ ጊዜ ጋር ቃለመጠይቅ AI

ሞክሩ Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

ምርጥ ለ: ነጻ, CPU- ብቻ ሞዴል ለከፍተኛ መጠን ፕሮግራሞች ጋር Zero ክሬዲት ዋጋ

ሞክሩ Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ምርጥ ለ: የድምፅ ውጤቶች ለፈጠራ እና ለመዝናኛ ፕሮግራሞች

ሞክሩ Bark

የቲቲኤስ አፒአይ እንዴት ማቀናጀት እንደሚቻል

ከመዝገብ ወደ የመጀመሪያው API ጥሪ በ5 ደቂቃዎች ውስጥ

1

የእርስዎን API ቁልፍ ማግኘት

ነጻ ለመመዝገብ እና ከእርስዎ የሂሳብ ዳሽቦርድ አንድ API ቁልፍ ማመንጨት. 15,000 አርዕስት ተካትቷል.

2

የመጀመሪያው ጥሪዎን ያድርጉ

POST ወደ /v1/tts በጽሑፍ, ሞዴል, እና ድምፅ. ድምፅ ባይቶች ወደ ኋላ ማግኘት. በ 5 መስመር ኮድ.

3

ሞዴል ይምረጡ

የተለያዩ ሞዴሎችን ለሚጠቀሙበት ሁኔታ ይሞከሩ. ፍጥነት, ጥራት, እና ወጪ በአንድ ትውልድ ላይ ያነፃፅሩ.

4

ምርት

በየጊዜው የሚከፈለው ፊደልን በመጠቀም መጠንን ይለኩ። በየጊዜው የሚከፈለው ዕቅድ የፍጥነት ገደብ የለውም። በዳሽቦርዱ ውስጥ ጥቅሙን ይቆጣጠሩ።

የቅደም ተከተል ምሳሌዎች

REST API ጋር በየትኛውም ቋንቋ TTS.ai ያካትቱ

Python ተወዳጅ
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL ዓለም አቀፍ
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
የቀን/ሰዓት ፎርማት ተንሸራታች
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

የዲቨሎፕመንቶች TTS.ai ጋር የሚሠሩት

የቀድሞው

AI ቻትቦቶች እና ረዳቶች

የድምፅ ውጤት ወደ ቻትቦት ወይም AI ረዳት ይጨምሩ. LLM መልሶች በ TTS በኩል ለድምፅ-ተስማሚ አቀማመጦች ያስተላልፉ. ኮኮሮ ለወቅታዊ ውይይቶች የሁለት ሰከንዶች ቅደም ተከተል ይሰጣል. ሴሳም CSM በትክክለኛ ጊዜ ውይይት ንግግርን ይፈጥራል.

  • የLLM መልስ ለንግግር ቧንቧ
  • የኮኮሮ ሴኮንድ-አስቀድሞ
  • ከሴሴም ሲኤስኤም ጋር የተደረገ ቃለ ምልልስ
  • የድምፅ ውጤት

የድምፅ ፕሮግራሞች

የድምፅ ተንቀሳቃሽ አፕሊኬሽኖችን፣ የአቅላይነት መሣሪያዎችን፣ የማንበብ አፕሊኬሽኖችን እና የቋንቋ መማር መድረኮችን ይፍጠሩ። የእኛ REST API ከማንኛውም የሞባይል ፍሬም ጋር ይሰራል። የድምፅ ፋይሎችን ያውርዱ ወይም በቀጥታ ወደ ክለሳው ይተላለፉ።

  • React Native, ፍሉተር, ስዊፍት, ኮትሊን
  • የአቅላይነት እና የማንበብ ፕሮግራሞች
  • የቋንቋ መማር መድረኮች
  • የድምፅ ይዘት ማምረት

ምርቶች

White-label የድምፅ ችሎታዎች በእርስዎ SaaS ምርት. TTS ጨምሩ, STT, የድምፅ ክሎኒንግ, እና የድምፅ ማቀነባበሪያ እንደ ባህሪያት በፕላትፎርሙ. GPU መሰረተ ልማት ሳይመሩ እንደ ድምፅ backend መጠቀም API.

  • የድምፅ ባህሪያት
  • ምንም የጂፒዩ ኢንፍራሬድ የለም
  • የክፍያ-ለ-መጠቀሚያ ዋጋ
  • 20+ ተጠቃሚዎችዎ ለመስጠት ሞዴሎች

አውቶማቲክ

የድምፅ ማመንጫ ወደ CI / CD ቧንቧዎች, ይዘት አውቶማቲክ, እና batch ማቀነባበሪያ ሥራ ፍሰቶች ማቀናጀት. ከ spreadsheet መረጃዎች የድምፅ ፋይሎችን መቶዎች ማመንጫ, አውቶማቲክ የፖድካስት ምርት, ወይም ይዘት የቋንቋ ማቀናጀት ቧንቧዎች መፍጠር.

  • የባች ሂደት
  • የጽሑፍ ይዘት
  • CI/CD ማቀናጀት
  • የድምፅ አውቶማቲክ

የAPI ዝርዝሮች

ለምርት ፕሮግራሞች የተገነባ

20+

የTTS ሞዴሎች

100+

ድምጾች

30+

ቋንቋዎች

<1s

ላታንሲ (ኮኮሮ)

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

ስለ TTS.ai የዳታቤዝ API የተለመዱ ጥያቄዎች

አዎ. APIችን የኦፕንአይ ኦዲዮ ንግግር ቅርጸት ይከተላል. የኦፕንአይ ፓይተን ወይም የጃቫስክሪፕት ክላስተር ላብራቶሪን ብትጠቀሙ፣ የbase_url እና api_key ፓራሜትሮችን በመቀየር ወደ TTS.ai መቀየር ይችላሉ። የእርስዎ የቀድሞ ኮድ ያለማስተካከል ይሠራል።

ኮኮሮ ለተለመዱ ቃላት ድምፅን በ1 ሰከንድ ውስጥ ያወጣል. ኮሲቮይስ 2 ለከፍተኛው የሰማው ላቴንሲ ስትሪሚንግ አወጣጥን ይደግፋል. ለቻትቦቶች እና ለድምፅ ረዳቶች፣ የሙሉ ጉዞው ጊዜ በጽሑፍ ርዝመት እና በሞዴል ምርጫ ላይ በመመርኮዝ 1-3 ሰከንዶች ነው

ነፃ ሞዴሎች (ኮኮሮ, Piper, VITS, MeloTTS) በሙሉ ነፃ ናቸው. ስታንዳርድ ሞዴሎች 2x ፊደላትን ለ 1K ፅሁፍ ይጠቀማሉ. ፕሪሚየም ሞዴሎች ለ 1K ፅሁፍ 4x ፊደላትን ይጠቀማሉ. 15,000 ፊደላትን ነፃ ይመዝገቡ. 500,000 ፊደላትን ለ 9 ዶላር / ወር ይጀምራሉ.

አዎ. የድምፅ ክሎኒንግ መጨረሻ ነጥብ ላይ የድምፅ ቅጂ (5-30 ሰከንዶች) ይጫኑ፣ ከዚያም በተከታታይ የቲቲኤስ ጥያቄዎች ውስጥ የክሎኒንግ የድምፅ አይዲን ይጠቀሙ። ክሎኒንግን የሚደግፉ ሞዴሎች ኮሲቮይስ 2፣ ቻተርቦክስ፣ ፊሽ ስፕሪንግ፣ እና ጂፒቲ-ሶቪትስ ናቸው።

ነጻ ደረጃ መሠረታዊ ፍጥነት መቀነስ አለው (3 ጥያቄዎች በሳምንት ያለ አክሲዮን). የተከፈለ ዕቅዶች ምርት ፕሮግራሞች ተስማሚ ታላቅ ፍጥነት መቀነስ አላቸው. enterprise-level ፍጥነት ፍላጎቶች እኛን ያነጋግሩን.

WAV (አልተጠናከረ፣ ከፍተኛ ጥራት ያለው), MP3 (ተጠናከረ፣ ትንሽ ፋይሎች), OGG (የተከፈተ ቅርጸት), እና FLAC (የማይጠፋ ቅርጸት). ቅርጸቱን በጠየቃችሁ ጊዜ ግለጹ። መነሻው WAV በሞዴሉ ተወላጅ ሳምፕል ፍጥነት ላይ ነው

አዎ. የ TTS API ከንግግር-ወደ-ጽሑፍ ሞዴል እና የ LLM ጋር የተሟላ የድምፅ ረዳት ቧንቧን ለመገንባት ያገናኙት. ኮኮሮ ለወቅታዊ ውይይት ተስማሚ የሆነ የሁለተኛው ክፍል latency ይሰጣል. CosyVoice 2 ለተሻለ የተሰማው መልስ ጊዜዎች የቀጥታ ውጤትን ይደግፋል.

ኮሲቮይስ 2 እና ኮኮሮ የድምፅ ፋይሎችን እንደተፈጠሩ ሆነው የሚቀርቡበትን የድምፅ ፋይል ማውጫን ይደግፋሉ፡፡ ይህም እንደ ድምፅ ረዳቶች እና ተለዋዋጭ ተሞክሮዎች ያሉ የወቅቱ ፕሮግራሞችን ከመጀመሪያው ባይቴ እስከ ጊዜው የሚቀንሱበትን ጊዜ ይቀንሳል።

የ API ስታንዳርድ HTTP ሁኔታ ኮዶች ይመለሳል. ለ 5xx ስህተቶች እና የፍጥነት ገደብ መልሶች ከፍ ያለ backoff ይጫኑ. ለ ተግባር-kritical ፕሮግራሞች, ደጋግሞ ሞክረው ሎጂክ ጋር መስመር ጨምር. APIችን ከፍተኛ አፕታይም አለው ነገር ግን ረጅም ስህተት መያዝ ሁልጊዜ ጠቃሚ ነው.

አዎ. /v1/voices እና /v1/models መጨረሻ ነጥቦች ሁሉንም የተገኙ ድምጾች እና ሞዴሎችን ከሜታ-ዳታዎቻቸው (የቋንቋ ድጋፍ፣ የጥራት ደረጃዎች፣ የፍጥነት ደረጃዎች እና የዋጋ ደረጃዎች) ጋር የ JSON ዝርዝሮችን ይመልሳሉ. እነዚህን በፕሮግራምዎ ውስጥ ዲናሚክ ሞዴል ምርጫዎችን ለመገንባት ይጠቀሙ.

ነጻ ሞዴሎች (ኮኮሮ, ፒፐር, VITS, MeloTTS) እንደ ውጤታማ ሳንድቦክስ ያገለግላሉ ምክንያቱም እነሱ 0 ክሬዲቶችን ያስከፍላሉ. ነፃ ሞዴሎች ጋር ማቀናጀትዎን ይሞከሩ፣ ከዚያም የሞዴል ፓራሜትር በመለወጥ በምርት ውስጥ ወደ ፕሪሚየም ሞዴሎች ይለወጡ። ምንም የተለየ የሞዴል አካባቢ ያስፈልጋል ፡፡

አብዛኛዎቹ ሞዴሎቻችን የክፍል ምንጭ ናቸው እናም በራሳቸው ሊስተናገዱ ይችላሉ. ምንም እንኳን በራሳቸው መስተንግዶዎች ትልቅ የጂፒዩ ምንጮችን ይፈልጋሉ (4x NVIDIA Tesla P40 ን በ 96GB VRAM በሙሉ እንጠቀማለን).
5.0/5 (1)

ምን ማሻሻል እንችላለን? አስተያየቶችዎ ችግሮችን ለመፍታት ይረዳሉ.

የድምፅ AI ለመገንባት ዝግጁ ነዎት?

ነጻ የእርስዎን API ቁልፍ ማግኘት እና ግንባታ ጀምር. 50 ክሬዲቶች ላይ መመዝገብ, ነፃ ሞዴሎች ይገኛሉ, አጠቃላይ ሰነዶች.