ડેવલોપર્સ માટે લખાણને બોલવામાં APIName

અમારા REST API સાથે અવાજ સક્રિય કાર્યક્રમો બનાવો. તમારા એપ્લિકેશનો, ચેટબોટ્સ, અવાજ સહાયકો, અને SaaS ઉત્પાદનો માટે કુદરતી લખાણ-થી-ભાષણ, અવાજ ક્લોનિંગ, અવાજ-થી-લેખન, અને ઓડિયો પ્રક્રિયાને ઉમેરો. OpenAI-સુસંગત બંધારણ, ૨૦+ મોડેલો, સરળ એકીકરણ.

REST API ચેટબોટ્સ અવાજ કાર્યક્રમો SaaS ઉત્પાદનો આપોઆપ

હવે પ્રયત્ન કરો

કોકોરો, પાઇપર, VITS, MeloTTS સાથે મુક્ત
તમારું ઉત્પન્ન થયેલ ઓડિયો અહીં દેખાશે
બનાવેલ
ડાઉનલોડ
TTS.ai ને પ્રેમ કરો છો? તમારા મિત્રોને કહી દો!

ડેવલોપર્સ માટે API લાક્ષણિકતાઓ

વૉઇસ સક્રિય કાર્યક્રમો બનાવવા માટે તમારે જરૂરી બધુંName

સરળ REST API

બોલવાનું ઉત્પન્ન કરવા માટે એક POST વિનંતી. JSON વિનંતી, ઓડિયો જવાબ. કોઇપણ પ્રોગ્રામિંગ ભાષા સાથે કામ કરે છે કે જે HTTP ને આધાર આપે છે.

OpenAI- સુસંગત

OpenAI TTS API માટે ડ્રોપ-ઇન બદલો. તમારી base_url અને API કી બદલો - વર્તમાન કોડ તરત જ કામ કરે છે.

24+ મોડેલો ઉપલબ્ધ છે

એક API દ્દારા દરેક મોડેલને વાપરો. એક પરિમાણ બદલીને મોડેલો બદલો. ગુણવત્તા, ઝડપ અને ખર્ચની સરખામણી કરો.

ઉપ-સેકન્ડ લેટેન્સી

કોકોરો ૧ સેકન્ડ ની અંદર ઓડિયો પેદા કરે છે. વાસ્તવિક સમયના ચેટબોટ્સ, અવાજ સહાયકો, અને ઇન્ટરેક્ટિવ કાર્યક્રમો માટે સંપૂર્ણ છે.

અવાજ ક્લોનીંગ API

API મારફતે ટૂંકા ઓડિયો નમૂનામાંથી કોઇપણ અવાજનો ક્લોન કરો. બધા પછીના પેઢીઓ માટે ક્લોન થયેલ અવાજોને વાપરો.

ઘણાબધા બંધારણો

WAV, MP3, OGG, અથવા FLAC તરીકે આઉટપુટ. નમૂના દર અને બીટ ઊંડાઈ પસંદ કરો. વાસ્તવિક સમય કાર્યક્રમો માટે સ્ટ્રીમિંગ ઓડિયો આધાર.

ડેવલોપર સંકલન માટે શ્રેષ્ઠ મોડેલો

તમારા કાર્યક્રમની ઝડપ, ગુણવત્તા, અને ખર્ચની જરૂરિયાતો માટે યોગ્ય મોડેલ પસંદ કરો

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

માટે શ્રેષ્ઠ: ઝડપી મોડેલ - ઉપ-સેકન્ડ લેટેન્સી, વાસ્તવિક સમય કાર્યક્રમો અને ચેટબોટ્સ માટે આદર્શ

પ્રયત્ન કરો Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 અવાજ ક્લોનિંગ

માટે શ્રેષ્ઠ: અવાજ સહાયક કાર્યક્રમો માટે અવાજ ક્લોનીંગ સાથે TTS સ્ટ્રીમિંગ

પ્રયત્ન કરો CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

માટે શ્રેષ્ઠ: વાતચીતબોટ અને સહાયક અવાજ માટે કુદરતી સમય સાથે સંવાદ AI

પ્રયત્ન કરો Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

માટે શ્રેષ્ઠ: શૂન્ય ક્રેડિટ ખર્ચ સાથે ઉચ્ચ-વોલ્યુમ કાર્યક્રમો માટે મફત, CPU-only મોડેલ

પ્રયત્ન કરો Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

માટે શ્રેષ્ઠ: રચનાત્મક અને મનોરંજન કાર્યક્રમો માટે ધ્વનિ અસરો સાથે ઓડિયો ઉત્પન્ન કરો

પ્રયત્ન કરો Bark

TTS API ને કેવી રીતે એકીકૃત કરવું

નોંધણીથી પ્રથમ API કોલ સુધી5મિનિટ નીચે

1

તમારી API કી મેળવો

મફત માટે નોંધણી કરો અને તમારા ખાતા ડેશબોર્ડમાંથી API કી ઉત્પન્ન કરો. 50 ક્રેડિટ્સ સમાવેશ થાય છે.

2

તમારો પહેલો કોલ કરો

/v1/tts ને લખાણ, મોડેલ, અને અવાજ સાથે POST કરો. ઓડિયો બાઇટો પાછા મેળવો. કોડની ૫ લીટીઓ નીચે.

3

તમારું મોડેલ પસંદ કરો

તમારા વપરાશ કેસ માટે વિવિધ મોડેલો ચકાસો. ઝડપ, ગુણવત્તા, અને પેઢી દીઠ ખર્ચની સરખામણી કરો.

4

ઉત્પાદનમાં મોકલો

તમે-જ્યારે-જાઓ ત્યારે-પૈસા-આપવા-અક્ષરો સાથે માપન કરો. ચૂકવણી કરેલ યોજનાઓ પર કોઈ દર મર્યાદા નથી. તમારા ડેશબોર્ડમાં વપરાશનું નિરીક્ષણ કરો.

ઝડપી શરૂઆત કોડ ઉદાહરણો

અમારી REST API સાથે કોઈપણ ભાષામાં TTS.ai ને એકીકૃત કરો

Python લોકપ્રિય
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL વૈશ્વિક
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-સુસંગત બંધારણ ડ્રોપ-ઇન
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

ડેવલોપર્સ TTS.ai સાથે શું બનાવે છે

સામાન્ય એકીકરણ ભાતો અને કાર્યક્રમો

AI ચેટબોટ્સ અને સહાયકો

તમારા ચેટબોટ અથવા AI સહાયકને અવાજ આઉટપુટ ઉમેરો. અવાજ સક્રિય ઇન્ટરફેસો માટે TTS મારફતે LLM પ્રત્યુત્તરોને પાઇપ કરો. કોકોરો વાસ્તવિક સમય વાર્તાલાપો માટે ઉપ-સેકન્ડ લેટેન્સી પૂરી પાડે છે. સેસામ CSM કુદરતી સમય સાથે વાર્તાલાપ ભાષા પેદા કરે છે.

  • ભાષણ પાઇપલાઇન માટે LLM જવાબ
  • કોકોરો સાથે ઉપ-સેકન્ડ લૅટેન્સી
  • Sesame CSM સાથે સંવાદાત્મક ભાષણ
  • સ્ટ્રીમિંગ ઓડિયો આઉટપુટ

મોબાઇલ અને અવાજ કાર્યક્રમોName

અવાજ-સક્રિય મોબાઇલ એપ્લિકેશનો, સુલભતા સાધનો, વાંચન એપ્લિકેશનો, અને ભાષા શીખવાની પ્લેટફોર્મ્સ બનાવો. અમારું REST API કોઈપણ મોબાઇલ ફ્રેમવર્ક સાથે કામ કરે છે. ઓડિયો ફાઇલો ડાઉનલોડ કરો અથવા ક્લાયન્ટને સીધી સ્ટ્રીમ કરો.

  • React Native, Flutter, Swift, Kotlin
  • સુલભતા અને વાંચન કાર્યક્રમો
  • ભાષા શીખવાની પ્લેટફોર્મ
  • ઓડિયો સમાવિષ્ટો ઉત્પન્ન કરો

SaaS ઉત્પાદનો

તમારા SaaS ઉત્પાદનમાં વ્હાઇટ-લેબલ અવાજ ક્ષમતા. TTS, STT, અવાજ ક્લોનિંગ, અને ઓડિયો પ્રક્રિયા તમારા પ્લેટફોર્મમાં લાક્ષણિકતાઓ તરીકે ઉમેરો. GPU માળખાગત વ્યવસ્થાપન વગર તમારા અવાજ બેકએન્ડ તરીકે અમારા API નો ઉપયોગ કરો.

  • સફેદ-લેબલ અવાજ લાક્ષણિકતાઓ
  • GPU ઇન્ફ્રાસ્ટ્રક્ચરની જરૂર નથી
  • ઉપયોગ-પર-વપરાશ કિંમત
  • તમારા વપરાશકર્તાઓને ઓફર કરવા માટે 20+ મોડેલો

સ્વચાલિત પાઇપલાઇન

CI/CD પાઇપલાઇન, સમાવિષ્ટો સ્વચાલિત, અને બેચ પ્રક્રિયા કાર્યપ્રવાહોમાં અવાજ ઉત્પન્નને એકીકૃત કરો. સ્પ્રેડશીટ માહિતીમાંથી હજારો ઓડિયો ફાઇલોને ઉત્પન્ન કરો, પોડકાસ્ટ ઉત્પાદનને સ્વચાલિત કરો, અથવા સમાવિષ્ટો સ્થાનિકીકરણ પાઇપલાઇનને બનાવો.

  • API મારફતે બેચ પ્રક્રિયા
  • સમાવિષ્ટ સ્થાનિકીકરણ પાઇપલાઇન
  • CI/CD એકીકરણ
  • ઓડિયો સ્વયંચલિત કરવા માટે સ્પ્રેડશીટ

API સ્પષ્ટીકરણો

ઉત્પાદન કાર્યક્રમો માટે બનાવેલ

20+

TTS મોડેલો

100+

અવાજ

30+

ભાષાઓ

<1s

વિલંબ (કોકોરો)

વારંવાર પૂછાતા પ્રશ્નો

TTS.ai ડેવલોપર API વિશે સામાન્ય પ્રશ્નો

હા. અમારું API OpenAI ઓડિયો સ્પીકરના બંધારણને અનુસરે છે. જો તમે OpenAI Python અથવા JavaScript ક્લાયન્ટ લાઇબ્રેરી વાપરી રહ્યા હોય, તો તમે base_url અને api_key પરિમાણોને બદલીને TTS.ai પર બદલી શકો છો. તમારો વર્તમાન કોડ સુધાર્યા વિના કામ કરે છે.

Kokoro સામાન્ય વાક્યો માટે ૧ સેકન્ડ ની અંદર ઓડિયો પેદા કરે છે. CosyVoice ૨ એ સ્ટ્રીમિંગ આઉટપુટને પણ ઓછા અનુભવેલ લૅટેન્સી માટે આધાર આપે છે. ચેટબોટ્સ અને અવાજ સહાયકો માટે, કુલ રાઉન્ડ-ટ્રિપ સમય સામાન્ય રીતે લખાણ લંબાઈ અને મોડેલ પસંદગી પર આધારિત ૧-૩ સેકન્ડ છે.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) શૂન્ય ક્રેડિટ્સનો ખર્ચ કરે છે. પ્રમાણભૂત મોડેલો 1,000 અક્ષરો માટે2ક્રેડિટ્સનો ખર્ચ કરે છે. પ્રીમિયમ મોડેલો 1,000 અક્ષરો માટે4ક્રેડિટ્સનો ખર્ચ કરે છે. 15 ક્રેડિટ્સ સાથે મફત નોંધણી કરો. 500 ક્રેડિટ્સ માટે યોજનાઓ $9/મહિનાથી શરૂ થાય છે.

હા. સંદર્ભ ઓડિયો નમૂનો (૫-૩૦ સેકન્ડો) ને અવાજ ક્લોનિંગ અંતિમબિંદુમાં અપલોડ કરો, પછી ક્લોન થયેલ અવાજ ID ને આગળની TTS વિનંતીઓમાં વાપરો. મોડેલો કે જે ક્લોનિંગને આધાર આપે છે તેમાં CosyVoice ૨, Chatterbox, Fish Speech, અને GPT-SoVITS સામેલ છે.

મુક્ત સ્તર પાસે મૂળભૂત દર મર્યાદા છે (ખાતા વગર દર કલાકે3અરજીઓ). ચૂકવેલ યોજનાઓ પાસે ઉત્પાદન કાર્યક્રમો માટે યોગ્ય ઉદાર દર મર્યાદા છે. એન્ટરપ્રાઇઝ-સ્તર થ્રુપુટ જરૂરિયાતો માટે અમારો સંપર્ક કરો.

WAV (અસંકોચિત, ઊંચી ગુણવત્તા), MP3 (સંકોચિત, નાની ફાઇલો), OGG (ખોલો બંધારણ), અને FLAC (નુકસાન વિના સંકોચન). તમારી વિનંતી માં બંધારણ સ્પષ્ટ કરો. મૂળભૂત મોડેલના મૂળભૂત નમૂના દર પર WAV છે.

હા. સંપૂર્ણ અવાજ સહાયક પાઇપલાઇન બનાવવા માટે બોલવા-થી-લખાણ મોડેલ અને LLM સાથે અમારી TTS API ને જોડો. કોકોરો સબ-સેકન્ડ લેટેન્સી પૂરી પાડે છે જે વાસ્તવિક સમયના સંવાદ માટે આદર્શ છે. કોસીવોઇસ ૨ એ પણ ઓછા અનુભવાયેલ પ્રત્યુત્તર સમય માટે સ્ટ્રીમિંગ આઉટપુટને આધાર આપે છે.

CosyVoice ૨ અને Kokoro સ્ટ્રીમિંગ ઓડિયો આઉટપુટને આધાર આપે છે જ્યાં ઓડિયો ચુકડાઓ તેઓ ઉત્પન્ન થાય છે તેમ પૂરા પાડવામાં આવે છે. આ વાક્ય સહાયક અને ઇન્ટરેક્ટિવ અનુભવો જેવા વાસ્તવિક સમય કાર્યક્રમો માટે સમય-થી-પહેલા-બાઇટને ઘટાડે છે.

API પ્રમાણભૂત HTTP સ્થિતિ કોડ પાછા આપે છે. 5xx ભૂલો અને દર મર્યાદા પ્રત્યુત્તરો માટે વ્યાપક પાછા ફરવાનું અમલમાં મૂકો. મિશન-જટિલ કાર્યક્રમો માટે, ફરીથી પ્રયત્ન લોજીક સાથે કતાર ઉમેરો. અમારી API માં ઉચ્ચ અપટાઇમ છે પરંતુ મજબૂત ભૂલ સંભાળવાની હંમેશા ભલામણ કરવામાં આવે છે.

હા. /v1/voices અને /v1/models અંતબિંદુઓ તેમના મેટાડેટા સાથે (ભાષા આધાર, ગુણવત્તા રેટિંગ્સ, ઝડપ રેટિંગ્સ, અને કિંમત સ્તરો) બધા ઉપલબ્ધ અવાજો અને મોડેલોની JSON યાદીઓ પાછી આપે છે. તમારા કાર્યક્રમમાં ગતિશીલ મોડેલ પસંદ કરનારાઓ બનાવવા માટે આનો ઉપયોગ કરો.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) અસરકારક સેન્ડબોક્સ તરીકે સેવા આપે છે કારણ કે તેઓ શૂન્ય ક્રેડિટ્સનો ખર્ચ કરે છે. મુક્ત મોડેલો સાથે તમારું એકીકરણ ચકાસો, પછી મોડેલ પરિમાણને બદલીને ઉત્પાદનમાં પ્રીમિયમ મોડેલોમાં બદલો. કોઈ અલગ ચકાસણી પર્યાવરણની જરૂર નથી.

અમારા મોટાભાગના મોડેલો ઓપન-સોર્સ છે અને સ્વયં-હોસ્ટ કરી શકાય છે. જોકે, સ્વયં-હોસ્ટિંગને નોંધપાત્ર GPU સંસાધનોની જરૂર છે (અમે 4x NVIDIA Tesla P40 ને 96GB VRAM સાથે કુલ વાપરીએ છીએ). API ઇન્ફ્રાસ્ટ્રક્ચર વ્યવસ્થાપન વિના ખર્ચ-કાર્યક્ષમ વૈકલ્પિક પૂરું પાડે છે.
5.0/5 (1)

અમે શું સુધારી શકીએ? તમારો પ્રતિભાવ અમને સમસ્યાઓ ઉકેલવામાં મદદ કરે છે.

વોઇસ એઆઈ સાથે બિલ્ડ કરવા માટે તૈયાર છો?

તમારી મુક્ત API કી મેળવો અને નિર્માણ શરૂ કરો. નોંધણી પર 50 ક્રેડિટ્સ, મુક્ત મોડેલો ઉપલબ્ધ, વિસ્તૃત દસ્તાવેજ.