ક્ષતિનો અહેવાલ આપો / લક્ષણ વિનંતી

ડેવલોપર્સ માટે લખાણને બોલવામાં APIName

અમારા REST API સાથે અવાજ સક્રિય કાર્યક્રમો બનાવો. તમારા એપ્લિકેશનો, ચેટબોટ્સ, અવાજ સહાયકો, અને SaaS ઉત્પાદનો માટે કુદરતી લખાણ-થી-ભાષણ, અવાજ ક્લોનિંગ, અવાજ-થી-લેખન, અને ઓડિયો પ્રક્રિયાને ઉમેરો. OpenAI-સુસંગત બંધારણ, ૨૦+ મોડેલો, સરળ એકીકરણ.

REST API ચેટબોટ્સ અવાજ કાર્યક્રમો SaaS ઉત્પાદનો આપોઆપ

સંપૂર્ણ TTS સંપાદક API દસ્તાવેજો

હવે પ્રયત્ન કરો

0/500

કોકોરો, પાઇપર, VITS, MeloTTS સાથે મુક્ત

તમારું ઉત્પન્ન થયેલ ઓડિયો અહીં દેખાશે

સંપૂર્ણ TTS સંપાદક ખોલો

ડેવલોપર્સ માટે API લાક્ષણિકતાઓ

વૉઇસ સક્રિય કાર્યક્રમો બનાવવા માટે તમારે જરૂરી બધુંName

સરળ REST API

બોલવાનું ઉત્પન્ન કરવા માટે એક POST વિનંતી. JSON વિનંતી, ઓડિયો જવાબ. કોઇપણ પ્રોગ્રામિંગ ભાષા સાથે કામ કરે છે કે જે HTTP ને આધાર આપે છે.

OpenAI- સુસંગત

OpenAI TTS API માટે ડ્રોપ-ઇન બદલો. તમારી base_url અને API કી બદલો - વર્તમાન કોડ તરત જ કામ કરે છે.

24+ મોડેલો ઉપલબ્ધ છે

એક API દ્દારા દરેક મોડેલને વાપરો. એક પરિમાણ બદલીને મોડેલો બદલો. ગુણવત્તા, ઝડપ અને ખર્ચની સરખામણી કરો.

ઉપ-સેકન્ડ લેટેન્સી

કોકોરો ૧ સેકન્ડ ની અંદર ઓડિયો પેદા કરે છે. વાસ્તવિક સમયના ચેટબોટ્સ, અવાજ સહાયકો, અને ઇન્ટરેક્ટિવ કાર્યક્રમો માટે સંપૂર્ણ છે.

અવાજ ક્લોનીંગ API

API મારફતે ટૂંકા ઓડિયો નમૂનામાંથી કોઇપણ અવાજનો ક્લોન કરો. બધા પછીના પેઢીઓ માટે ક્લોન થયેલ અવાજોને વાપરો.

ઘણાબધા બંધારણો

WAV, MP3, OGG, અથવા FLAC તરીકે આઉટપુટ. નમૂના દર અને બીટ ઊંડાઈ પસંદ કરો. વાસ્તવિક સમય કાર્યક્રમો માટે સ્ટ્રીમિંગ ઓડિયો આધાર.

ડેવલોપર સંકલન માટે શ્રેષ્ઠ મોડેલો

તમારા કાર્યક્રમની ઝડપ, ગુણવત્તા, અને ખર્ચની જરૂરિયાતો માટે યોગ્ય મોડેલ પસંદ કરો

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

માટે શ્રેષ્ઠ: ઝડપી મોડેલ - ઉપ-સેકન્ડ લેટેન્સી, વાસ્તવિક સમય કાર્યક્રમો અને ચેટબોટ્સ માટે આદર્શ

પ્રયત્ન કરો Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 અવાજ ક્લોનિંગ

માટે શ્રેષ્ઠ: અવાજ સહાયક કાર્યક્રમો માટે અવાજ ક્લોનીંગ સાથે TTS સ્ટ્રીમિંગ

પ્રયત્ન કરો CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

માટે શ્રેષ્ઠ: વાતચીતબોટ અને સહાયક અવાજ માટે કુદરતી સમય સાથે સંવાદ AI

પ્રયત્ન કરો Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

માટે શ્રેષ્ઠ: શૂન્ય ક્રેડિટ ખર્ચ સાથે ઉચ્ચ-વોલ્યુમ કાર્યક્રમો માટે મફત, CPU-only મોડેલ

પ્રયત્ન કરો Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

માટે શ્રેષ્ઠ: રચનાત્મક અને મનોરંજન કાર્યક્રમો માટે ધ્વનિ અસરો સાથે ઓડિયો ઉત્પન્ન કરો

પ્રયત્ન કરો Bark

TTS API ને કેવી રીતે એકીકૃત કરવું

નોંધણીથી પ્રથમ API કોલ સુધી5મિનિટ નીચે

તમારી API કી મેળવો

મફત માટે નોંધણી કરો અને તમારા ખાતા ડેશબોર્ડમાંથી API કી ઉત્પન્ન કરો. 50 ક્રેડિટ્સ સમાવેશ થાય છે.

તમારો પહેલો કોલ કરો

/v1/tts ને લખાણ, મોડેલ, અને અવાજ સાથે POST કરો. ઓડિયો બાઇટો પાછા મેળવો. કોડની ૫ લીટીઓ નીચે.

તમારું મોડેલ પસંદ કરો

તમારા વપરાશ કેસ માટે વિવિધ મોડેલો ચકાસો. ઝડપ, ગુણવત્તા, અને પેઢી દીઠ ખર્ચની સરખામણી કરો.

ઉત્પાદનમાં મોકલો

તમે-જ્યારે-જાઓ ત્યારે-પૈસા-આપવા-અક્ષરો સાથે માપન કરો. ચૂકવણી કરેલ યોજનાઓ પર કોઈ દર મર્યાદા નથી. તમારા ડેશબોર્ડમાં વપરાશનું નિરીક્ષણ કરો.

ઝડપી શરૂઆત કોડ ઉદાહરણો

અમારી REST API સાથે કોઈપણ ભાષામાં TTS.ai ને એકીકૃત કરો

Python લોકપ્રિય

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL વૈશ્વિક

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-સુસંગત બંધારણ ડ્રોપ-ઇન

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

તમારી મુક્ત API કી મેળવો

ડેવલોપર્સ TTS.ai સાથે શું બનાવે છે

સામાન્ય એકીકરણ ભાતો અને કાર્યક્રમો

AI ચેટબોટ્સ અને સહાયકો

તમારા ચેટબોટ અથવા AI સહાયકને અવાજ આઉટપુટ ઉમેરો. અવાજ સક્રિય ઇન્ટરફેસો માટે TTS મારફતે LLM પ્રત્યુત્તરોને પાઇપ કરો. કોકોરો વાસ્તવિક સમય વાર્તાલાપો માટે ઉપ-સેકન્ડ લેટેન્સી પૂરી પાડે છે. સેસામ CSM કુદરતી સમય સાથે વાર્તાલાપ ભાષા પેદા કરે છે.

ભાષણ પાઇપલાઇન માટે LLM જવાબ
કોકોરો સાથે ઉપ-સેકન્ડ લૅટેન્સી
Sesame CSM સાથે સંવાદાત્મક ભાષણ
સ્ટ્રીમિંગ ઓડિયો આઉટપુટ

મોબાઇલ અને અવાજ કાર્યક્રમોName

અવાજ-સક્રિય મોબાઇલ એપ્લિકેશનો, સુલભતા સાધનો, વાંચન એપ્લિકેશનો, અને ભાષા શીખવાની પ્લેટફોર્મ્સ બનાવો. અમારું REST API કોઈપણ મોબાઇલ ફ્રેમવર્ક સાથે કામ કરે છે. ઓડિયો ફાઇલો ડાઉનલોડ કરો અથવા ક્લાયન્ટને સીધી સ્ટ્રીમ કરો.

React Native, Flutter, Swift, Kotlin
સુલભતા અને વાંચન કાર્યક્રમો
ભાષા શીખવાની પ્લેટફોર્મ
ઓડિયો સમાવિષ્ટો ઉત્પન્ન કરો

SaaS ઉત્પાદનો

તમારા SaaS ઉત્પાદનમાં વ્હાઇટ-લેબલ અવાજ ક્ષમતા. TTS, STT, અવાજ ક્લોનિંગ, અને ઓડિયો પ્રક્રિયા તમારા પ્લેટફોર્મમાં લાક્ષણિકતાઓ તરીકે ઉમેરો. GPU માળખાગત વ્યવસ્થાપન વગર તમારા અવાજ બેકએન્ડ તરીકે અમારા API નો ઉપયોગ કરો.

સફેદ-લેબલ અવાજ લાક્ષણિકતાઓ
GPU ઇન્ફ્રાસ્ટ્રક્ચરની જરૂર નથી
ઉપયોગ-પર-વપરાશ કિંમત
તમારા વપરાશકર્તાઓને ઓફર કરવા માટે 20+ મોડેલો

સ્વચાલિત પાઇપલાઇન

CI/CD પાઇપલાઇન, સમાવિષ્ટો સ્વચાલિત, અને બેચ પ્રક્રિયા કાર્યપ્રવાહોમાં અવાજ ઉત્પન્નને એકીકૃત કરો. સ્પ્રેડશીટ માહિતીમાંથી હજારો ઓડિયો ફાઇલોને ઉત્પન્ન કરો, પોડકાસ્ટ ઉત્પાદનને સ્વચાલિત કરો, અથવા સમાવિષ્ટો સ્થાનિકીકરણ પાઇપલાઇનને બનાવો.

API મારફતે બેચ પ્રક્રિયા
સમાવિષ્ટ સ્થાનિકીકરણ પાઇપલાઇન
CI/CD એકીકરણ
ઓડિયો સ્વયંચલિત કરવા માટે સ્પ્રેડશીટ

સંપૂર્ણ API દસ્તાવેજ જુઓ

API સ્પષ્ટીકરણો

ઉત્પાદન કાર્યક્રમો માટે બનાવેલ

20+

TTS મોડેલો

100+

અવાજ

30+

ભાષાઓ

<1s

વિલંબ (કોકોરો)

મફત નોંધણી — ૧૫,૦૦૦ અક્ષરો

વારંવાર પૂછાતા પ્રશ્નો

TTS.ai ડેવલોપર API વિશે સામાન્ય પ્રશ્નો

હા. અમારું API OpenAI ઓડિયો સ્પીકરના બંધારણને અનુસરે છે. જો તમે OpenAI Python અથવા JavaScript ક્લાયન્ટ લાઇબ્રેરી વાપરી રહ્યા હોય, તો તમે base_url અને api_key પરિમાણોને બદલીને TTS.ai પર બદલી શકો છો. તમારો વર્તમાન કોડ સુધાર્યા વિના કામ કરે છે.

Kokoro સામાન્ય વાક્યો માટે ૧ સેકન્ડ ની અંદર ઓડિયો પેદા કરે છે. CosyVoice ૨ એ સ્ટ્રીમિંગ આઉટપુટને પણ ઓછા અનુભવેલ લૅટેન્સી માટે આધાર આપે છે. ચેટબોટ્સ અને અવાજ સહાયકો માટે, કુલ રાઉન્ડ-ટ્રિપ સમય સામાન્ય રીતે લખાણ લંબાઈ અને મોડેલ પસંદગી પર આધારિત ૧-૩ સેકન્ડ છે.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) શૂન્ય ક્રેડિટ્સનો ખર્ચ કરે છે. પ્રમાણભૂત મોડેલો 1,000 અક્ષરો માટે2ક્રેડિટ્સનો ખર્ચ કરે છે. પ્રીમિયમ મોડેલો 1,000 અક્ષરો માટે4ક્રેડિટ્સનો ખર્ચ કરે છે. 15 ક્રેડિટ્સ સાથે મફત નોંધણી કરો. 500 ક્રેડિટ્સ માટે યોજનાઓ $9/મહિનાથી શરૂ થાય છે.

હા. સંદર્ભ ઓડિયો નમૂનો (૫-૩૦ સેકન્ડો) ને અવાજ ક્લોનિંગ અંતિમબિંદુમાં અપલોડ કરો, પછી ક્લોન થયેલ અવાજ ID ને આગળની TTS વિનંતીઓમાં વાપરો. મોડેલો કે જે ક્લોનિંગને આધાર આપે છે તેમાં CosyVoice ૨, Chatterbox, Fish Speech, અને GPT-SoVITS સામેલ છે.

મુક્ત સ્તર પાસે મૂળભૂત દર મર્યાદા છે (ખાતા વગર દર કલાકે3અરજીઓ). ચૂકવેલ યોજનાઓ પાસે ઉત્પાદન કાર્યક્રમો માટે યોગ્ય ઉદાર દર મર્યાદા છે. એન્ટરપ્રાઇઝ-સ્તર થ્રુપુટ જરૂરિયાતો માટે અમારો સંપર્ક કરો.

WAV (અસંકોચિત, ઊંચી ગુણવત્તા), MP3 (સંકોચિત, નાની ફાઇલો), OGG (ખોલો બંધારણ), અને FLAC (નુકસાન વિના સંકોચન). તમારી વિનંતી માં બંધારણ સ્પષ્ટ કરો. મૂળભૂત મોડેલના મૂળભૂત નમૂના દર પર WAV છે.

હા. સંપૂર્ણ અવાજ સહાયક પાઇપલાઇન બનાવવા માટે બોલવા-થી-લખાણ મોડેલ અને LLM સાથે અમારી TTS API ને જોડો. કોકોરો સબ-સેકન્ડ લેટેન્સી પૂરી પાડે છે જે વાસ્તવિક સમયના સંવાદ માટે આદર્શ છે. કોસીવોઇસ ૨ એ પણ ઓછા અનુભવાયેલ પ્રત્યુત્તર સમય માટે સ્ટ્રીમિંગ આઉટપુટને આધાર આપે છે.

CosyVoice ૨ અને Kokoro સ્ટ્રીમિંગ ઓડિયો આઉટપુટને આધાર આપે છે જ્યાં ઓડિયો ચુકડાઓ તેઓ ઉત્પન્ન થાય છે તેમ પૂરા પાડવામાં આવે છે. આ વાક્ય સહાયક અને ઇન્ટરેક્ટિવ અનુભવો જેવા વાસ્તવિક સમય કાર્યક્રમો માટે સમય-થી-પહેલા-બાઇટને ઘટાડે છે.

API પ્રમાણભૂત HTTP સ્થિતિ કોડ પાછા આપે છે. 5xx ભૂલો અને દર મર્યાદા પ્રત્યુત્તરો માટે વ્યાપક પાછા ફરવાનું અમલમાં મૂકો. મિશન-જટિલ કાર્યક્રમો માટે, ફરીથી પ્રયત્ન લોજીક સાથે કતાર ઉમેરો. અમારી API માં ઉચ્ચ અપટાઇમ છે પરંતુ મજબૂત ભૂલ સંભાળવાની હંમેશા ભલામણ કરવામાં આવે છે.

હા. /v1/voices અને /v1/models અંતબિંદુઓ તેમના મેટાડેટા સાથે (ભાષા આધાર, ગુણવત્તા રેટિંગ્સ, ઝડપ રેટિંગ્સ, અને કિંમત સ્તરો) બધા ઉપલબ્ધ અવાજો અને મોડેલોની JSON યાદીઓ પાછી આપે છે. તમારા કાર્યક્રમમાં ગતિશીલ મોડેલ પસંદ કરનારાઓ બનાવવા માટે આનો ઉપયોગ કરો.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) અસરકારક સેન્ડબોક્સ તરીકે સેવા આપે છે કારણ કે તેઓ શૂન્ય ક્રેડિટ્સનો ખર્ચ કરે છે. મુક્ત મોડેલો સાથે તમારું એકીકરણ ચકાસો, પછી મોડેલ પરિમાણને બદલીને ઉત્પાદનમાં પ્રીમિયમ મોડેલોમાં બદલો. કોઈ અલગ ચકાસણી પર્યાવરણની જરૂર નથી.

અમારા મોટાભાગના મોડેલો ઓપન-સોર્સ છે અને સ્વયં-હોસ્ટ કરી શકાય છે. જોકે, સ્વયં-હોસ્ટિંગને નોંધપાત્ર GPU સંસાધનોની જરૂર છે (અમે 4x NVIDIA Tesla P40 ને 96GB VRAM સાથે કુલ વાપરીએ છીએ). API ઇન્ફ્રાસ્ટ્રક્ચર વ્યવસ્થાપન વિના ખર્ચ-કાર્યક્ષમ વૈકલ્પિક પૂરું પાડે છે.

5.0/5 (1)

વોઇસ એઆઈ સાથે બિલ્ડ કરવા માટે તૈયાર છો?

તમારી મુક્ત API કી મેળવો અને નિર્માણ શરૂ કરો. નોંધણી પર 50 ક્રેડિટ્સ, મુક્ત મોડેલો ઉપલબ્ધ, વિસ્તૃત દસ્તાવેજ.

મફત નોંધણી કરો કિંમત જુઓ

ડેવલોપર્સ માટે લખાણને બોલવામાં APIName

હવે પ્રયત્ન કરો

TTS.ai ને પ્રેમ કરો છો? તમારા મિત્રોને કહી દો!

ડેવલોપર્સ માટે API લાક્ષણિકતાઓ

સરળ REST API

OpenAI- સુસંગત

24+ મોડેલો ઉપલબ્ધ છે

ઉપ-સેકન્ડ લેટેન્સી

અવાજ ક્લોનીંગ API

ઘણાબધા બંધારણો

ડેવલોપર સંકલન માટે શ્રેષ્ઠ મોડેલો

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API ને કેવી રીતે એકીકૃત કરવું

તમારી API કી મેળવો

તમારો પહેલો કોલ કરો

તમારું મોડેલ પસંદ કરો

ઉત્પાદનમાં મોકલો

ઝડપી શરૂઆત કોડ ઉદાહરણો

ડેવલોપર્સ TTS.ai સાથે શું બનાવે છે

AI ચેટબોટ્સ અને સહાયકો

મોબાઇલ અને અવાજ કાર્યક્રમોName

SaaS ઉત્પાદનો

સ્વચાલિત પાઇપલાઇન

API સ્પષ્ટીકરણો

વારંવાર પૂછાતા પ્રશ્નો

શું API OpenAI TTS બંધારણ સાથે સુસંગત છે?

રિયલ-ટાઇમ કાર્યક્રમો માટે લેટેન્સી શું છે?

API વપરાશ માટે કિંમત કેવી રીતે કામ કરે છે?

શું હું API મારફતે વોઇસ ક્લોનિંગ વાપરી શકું?

શું દરની મર્યાદા છે?

કયા ઓડિયો બંધારણો API પાછા આપે છે?

શું હું અવાજ સહાયક અથવા ચેટબોટને બનાવવા માટે API વાપરી શકું?

શું ત્યાં WebSocket અથવા સ્ટ્રીમિંગ API છે?

હું ઉત્પાદનમાં ભૂલો અને પુનરાવર્તનો કેવી રીતે સંભાળી શકું?

શું હું પ્રાપ્ત અવાજો અને મોડેલોની યાદી પ્રોગ્રામિક રીતે કરી શકું?

શું ત્યાં સેન્ડબોક્સ અથવા ચકાસણી વાતાવરણ છે?

શું હું API વાપરવાને બદલે મોડેલોને સ્વયં-હોસ્ટ કરી શકું?

વોઇસ એઆઈ સાથે બિલ્ડ કરવા માટે તૈયાર છો?