ডেভেলপৰ বাবে টেক্সট-টু-স্পিচ API

আমাৰ REST API ৰ সৈতে শব্দ সমৰ্থিত এপ্লিকেচন নিৰ্মাণ কৰক। আপোনাৰ এপ্লিকেচন, চেটবট, শব্দ সহায়ক আৰু SaaS উৎপাদনত স্বাভাৱিক টেক্সট-টু-স্পীচ, শব্দ ক্লোনিং, শব্দ-টু-টেক্সট আৰু অডিঅ' প্ৰক্ৰিয়াকৰণ যোগ কৰক। OpenAI-সংগতিপূৰ্ণ বিন্যাস, 24+ মডেল, সৰল একত্ৰীকৰণ।

REST API চেটবটসমূহ শব্দ অনুপ্ৰয়োগ SaaS উৎপাদন স্বচালিত

এতিয়া চেষ্টা কৰক

0/500
Kokoro, Piper, VITS, MeloTTS ৰ সৈতে মুক্ত
Your generated audio will appear here
সৃষ্টি কৰা হৈছে
0:00 0:00
ডাউনলোড কৰক
TTS.ai পছন্দ হৈছে? আপোনাৰ বন্ধুসকলক কওক!

উন্নয়নকাৰীৰ বাবে API বৈশিষ্ট্যসমূহ

শব্দ সমৰ্থিত এপ্লিকেচন নিৰ্মাণৰ বাবে আপোনাৰ প্ৰয়োজনীয় সকলো

সহজ REST API

কথা সৃষ্টি কৰিবলৈ এটা POST অনুৰোধ। JSON অনুৰোধ, অডিঅ' প্ৰতিক্ৰিয়া। HTTP সমৰ্থন কৰা যিকোনো প্ৰগ্ৰামিং ভাষাৰ সৈতে কাম কৰে।

OpenAI-সুসংগত

OpenAI TTS API ৰ বাবে ড্ৰপ-ইন প্ৰতিস্থাপন। আপোনাৰ base_url আৰু API চাবি পৰিবৰ্তন কৰক - বৰ্তমান কোড তাৎক্ষণিকভাৱে কাম কৰে।

24+ আৰ্হি উপলব্ধ

এটা APIৰ দ্বাৰা প্ৰতিটো মডেল অভিগম কৰক। এটা প্ৰাচল পৰিবৰ্তন কৰি মডেল পৰিবৰ্তন কৰক। গুণমান, গতি আৰু মূল্যৰ তুলনা কৰক।

উপ-ছেকেণ্ড লেটেন্সি

Kokoro এ ১ ছেকেণ্ডত অডিঅ' সৃষ্টি কৰে। ৰিয়েল-টাইম চেটবট, শব্দ সহায়ক, আৰু প্ৰতিক্ৰিয়াশীল এপ্লিকেচনসমূহৰ বাবে সম্পূৰ্ণ।

শব্দ ক্লোনিং API

APIৰ দ্বাৰা এটা সংক্ষিপ্ত অডিঅ' নমুনাৰ পৰা যিকোনো শব্দ ক্লোন কৰক। সকলো পৰৱৰ্তী প্ৰজন্মৰ বাবে ক্লোন কৰা শব্দ ব্যৱহাৰ কৰক।

একাধিক বিন্যাস

WAV, MP3, OGG, অথবা FLAC হিচাপে আউটপুট। সেম্পল ৰেট আৰু বিট গভীৰতা বাছক। ৰিয়েল-টাইম এপ্লিকেচনৰ বাবে অডিঅ' ষ্ট্ৰীমিং সমৰ্থন।

বিকাশকৰ একত্ৰীকৰণৰ বাবে সেৰা মডেলসমূহ

আপোনাৰ এপ্লিকেচনৰ বাবে সঠিক মডেল বাছক

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

সৰ্বোত্তম: দ্রুততম মডেল - উপ-ছেকেণ্ড লেটেন্সী, ৰিয়েল-টাইম এপ্লিকেচন আৰু চেটবটসমূহৰ বাবে আদর্শ

চেষ্টা কৰক Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ধ্বনি ক্লোনিং

সৰ্বোত্তম: শব্দ সহায়ক এপ্লিকেচনসমূহৰ বাবে শব্দ ক্লোনিং সহ TTS ষ্ট্ৰীমিং

চেষ্টা কৰক CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

সৰ্বোত্তম: চ্যাটবট আৰু সহায়ক শব্দৰ বাবে প্ৰাকৃতিক সময় নিৰ্ধাৰণৰ সৈতে কথোপকথন AI

চেষ্টা কৰক Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

সৰ্বোত্তম: শূণ্য ক্রেডিট ব্যয়ৰ সৈতে উচ্চ-ভলিউম এপ্লিকেচনৰ বাবে বিনামূলীয়া, কেৱল CPU মডেল

চেষ্টা কৰক Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সৰ্বোত্তম: সৃজনশীল আৰু বিনোদনমূলক এপ্লিকেচনসমূহৰ বাবে শব্দ প্ৰভাৱসমূহৰ সৈতে অডিঅ' উৎপাদন কৰক

চেষ্টা কৰক Bark

TTS API কিদৰে একত্ৰিত কৰিব

৫ মিনিটৰ তলত সাবস্ক্ৰাইবৰ পৰা প্ৰথম API কললৈ

1

আপোনাৰ API চাবি প্ৰাপ্ত কৰক

বিনামূলীয়াকৈ নিবন্ধন কৰক আৰু আপোনাৰ একাওন্ট ড্যাশবোর্ডৰ পৰা এটা API চাবি নিৰ্মাণ কৰক। ৫০ ক্রেডিট অন্তৰ্ভুক্ত।

2

আপোনাৰ প্ৰথম কল কৰক

টেক্সট, মডেল আৰু শব্দ সহ /v1/tts লৈ POST কৰক। অডিঅ' বাইটসমূহ পুনঃ প্ৰাপ্ত কৰক। ৫ শাৰী কোডৰ তলত।

3

আপোনাৰ আৰ্হি বাছক

আপোনাৰ use case ৰ বাবে বিভিন্ন মডেল পৰীক্ষা কৰক। প্ৰতি প্ৰজন্মত গতি, গুণমান আৰু মূল্যৰ তুলনা কৰক।

4

প্ৰস্তুতকৰণলৈ পঠাওক

Pay-as-you-go ক্রেডিটসমূহৰ সৈতে স্কেল কৰক। পৰিশোধিত প্ল্যানসমূহত কোনো হাৰ সীমা নাই। আপোনাৰ ড্যাশবোর্ডত ব্যৱহাৰ নিৰীক্ষণ কৰক।

দ্ৰুত আৰম্ভ কোড উদাহৰণসমূহ

আমাৰ REST API ৰ সৈতে যিকোনো ভাষাত TTS.ai একত্ৰিত কৰক

Python জনপ্ৰিয়
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL সাৰ্বজনীন
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-সুসংগত বিন্যাস ড্ৰপ-ইন
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

TTS.ai ৰ সৈতে বিকাশকে কি নিৰ্মাণ কৰে

সাধাৰণ সমন্বয় বিন্যাস আৰু এপ্লিকেচনসমূহ

AI চেটবট আৰু সহায়ক

আপোনাৰ চেটবট অথবা AI সহায়কলৈ ধ্বনি আউটপুট যোগ কৰক। ধ্বনি সমৰ্থিত আন্তঃপৃষ্ঠসমূহৰ বাবে TTSৰ দ্বাৰা LLM প্ৰতিক্ৰিয়াসমূহ পাইপ কৰক। Kokoro ৰ দ্বাৰা ৰিয়েল-টাইম কথোপকথনৰ বাবে সাব-ছেকেণ্ড লেটেন্সি প্ৰদান কৰা হয়। Sesame CSM ৰ দ্বাৰা প্ৰাকৃতিক সময়ৰ সৈতে কথোপকথন কথোপকথন সৃষ্টি কৰা হয়।

  • কথোপকথন পাইপলাইনলৈ LLM প্ৰতিক্ৰিয়া
  • Kokoro ৰ সৈতে উপ-ছেকেণ্ড লেটেন্সী
  • Sesame CSM ৰ সৈতে কথোপকথন
  • স্ট্ৰীমিং অডিঅ' আউটপুট

ম'বাইল আৰু শব্দ অনুপ্ৰয়োগ

শব্দ সমৰ্থিত ম'বাইল এপ্লিকেচন, অভিগম্যতা সৰঞ্জাম, পঢ়া এপ্লিকেচন, আৰু ভাষা শিকোৱা প্লেটফৰ্ম নিৰ্মাণ কৰক। আমাৰ REST API যিকোনো ম'বাইল ফ্ৰেমৱৰ্কৰ সৈতে কাম কৰে। অডিঅ' ফাইল ডাউনলোড কৰক বা সরাসৰি ক্লায়েন্টলৈ স্ট্ৰিম কৰক।

  • React Native, Flutter, Swift, Kotlin
  • অভিগম্যতা আৰু পঢ়া এপ্লিকেচনসমূহ
  • ভাষা শিকিবলৈ প্লেটফৰ্মসমূহ
  • অডিঅ' সমল সৃষ্টি কৰক

SaaS উৎপাদন

আপোনাৰ SaaS উৎপাদনত ৱাইট-লেবেল ধ্বনি ক্ষমতা। আপোনাৰ প্লেটফৰ্মত TTS, STT, ধ্বনি ক্লোনিং, আৰু অডিঅ' প্ৰক্ৰিয়াকৰণৰ বৈশিষ্ট্য যোগ কৰক। GPU আন্তঃগাঁথনি পৰিচালনা নকৰি আপোনাৰ ধ্বনি বেকএণ্ড হিচাপে আমাৰ API ব্যৱহাৰ কৰক।

  • White-label শব্দৰ বৈশিষ্ট্যসমূহ
  • GPU অবকাঠামোৰ প্ৰয়োজন নাই
  • ব্যৱহাৰ অনুযায়ী মূল্য নিৰ্ধাৰণ
  • আপোনাৰ ব্যৱহাৰকাৰীসকলক প্ৰদান কৰিবলৈ 24+ মডেল

স্বচালিত পাইপলাইনসমূহ

CI/CD পাইপলাইন, সামগ্ৰী স্বয়ংক্ৰিয়কৰণ, আৰু ব্যাচ প্ৰক্ৰিয়াকৰণ কাৰ্য্যপ্ৰবাহত ধ্বনি উৎপাদন একত্ৰিত কৰক। স্প্রেডশ্বেট তথ্যৰ পৰা হাজাৰ হাজাৰ অডিঅ' নথিপত্ৰ সৃষ্টি কৰক, স্বয়ংক্ৰিয় পডকাস্ট উৎপাদন কৰক, অথবা সামগ্ৰী স্থানীয়কৰণ পাইপলাইন নিৰ্মাণ কৰক।

  • API দ্বাৰা ব্যাচ প্ৰক্ৰিয়াকৰণ
  • বিষয়বস্তু স্থানীয়কৰণ পাইপলাইনসমূহ
  • CI/CD সমন্বয়
  • অডিঅ' স্বচালিতকৰণলৈ স্প্ৰেডশ্বিট

API বিৱৰণসমূহ

উৎপাদন অনুপ্ৰয়োগৰ বাবে নিৰ্মিত

24+

TTS মডেলসমূহ

100+

ধ্বনি

30+

ভাষাসমূহ

<1s

লেটেন্সি (Kokoro)

সদায় সোধা প্ৰশ্নসমূহ

TTS.ai বিকাশক API ৰ বিষয়ে সাধাৰণ প্ৰশ্নসমূহ

হ'ব। আমাৰ API-এ OpenAI অডিঅ' কথোপকথন বিন্যাস অনুসৰণ কৰে। আপুনি যদি OpenAI Python অথবা JavaScript ক্লাএন্ট লাইব্ৰেৰি ব্যৱহাৰ কৰে, আপুনি base_url আৰু api_key প্ৰাচলসমূহ পৰিবৰ্তন কৰি TTS.ai লৈ পৰিবৰ্তন কৰিব পাৰে। আপোনাৰ বৰ্তমান কোড পৰিবৰ্তন অবিহনে কাম কৰে।

Kokoro এ সাধাৰণ বাক্যসমূহৰ বাবে ১ ছেকেণ্ডত অডিঅ' সৃষ্টি কৰে। CosyVoice2এও কম অনুভূত লেটেন্সিৰ বাবে স্ট্ৰিমিং আউটপুট সমৰ্থন কৰে। চেটবট আৰু শব্দ সহায়কসমূহৰ বাবে, মোট ৰাউন্ড-ট্ৰিপ সময় সাধাৰণতে টেক্সট দৈৰ্ঘ্য আৰু মডেল নিৰ্বাচনৰ ওপৰত নিৰ্ভৰ কৰে ১-৩ ছেকেণ্ড।

মুক্ত মডেল (Kokoro, Piper, VITS, MeloTTS) শূণ্য ক্ৰেডিটৰ মূল্য। প্ৰমিত মডেলৰ মূল্য প্ৰতি ১০০০ আখৰৰ বাবে ২ ক্ৰেডিট। প্ৰিমিয়াম মডেলৰ মূল্য প্ৰতি ১০০০ আখৰৰ বাবে ৪ ক্ৰেডিট। ৫০ ক্ৰেডিটৰ সৈতে বিনামূলীয়াকৈ নিবন্ধন কৰক। ৫০০ ক্ৰেডিটৰ বাবে $৯/মাহত প্ল্যান আৰম্ভ কৰক।

হ'ব। এটা প্ৰতিনিধি অডিঅ' নমুনা (৫-৩০ ছেকেণ্ড) শব্দ ক্লোনিং অন্তবিন্দুলৈ আপলোড কৰক, তাৰ পিছত পৰৱৰ্তী TTS অনুৰোধসমূহত ক্লোন কৰা শব্দ ID ব্যৱহাৰ কৰক। ক্লোনিং সমৰ্থন কৰা মডেলসমূহৰ ভিতৰত CosyVoice2, Chatterbox, Fish Speech, আৰু GPT-SoVITS অন্তৰ্ভুক্ত আছে।

বিনামূলীয়া স্তৰত মৌলিক হাৰ সীমাবদ্ধতা আছে (একাউণ্ট অবিহনে প্ৰতি ঘন্টাত ৩টি অনুৰোধ)। পৰিশোধিত পৰিকল্পনাত উৎপাদন অনুপ্ৰয়োগৰ বাবে উপযুক্ত হাৰ সীমাবদ্ধতা আছে। এন্টারপ্ৰাইজ-লেভেল থ্ৰাউটপুটৰ প্ৰয়োজনৰ বাবে আমাৰ সৈতে যোগাযোগ কৰক।

WAV (অসংকুচিত, সৰ্বোচ্চ গুণমান), MP3 (সংকুচিত, সৰু নথিপত্ৰ), OGG (মুক্ত বিন্যাস), আৰু FLAC (ক্ষতিবিহীন সংকুচিত) । আপোনাৰ অনুৰোধত বিন্যাস ধাৰ্য্য কৰক । অবিকল্পিত হ'ল মডেলৰ নেটিভ সেম্পল ৰেটত WAV ।

হ্যাঁ। এটা সম্পূৰ্ণ কন্ঠ সহায়ক পাইপলাইন নিৰ্মাণ কৰিবলৈ আমাৰ TTS API-ক এটা কথোপকথন-থেকে-লিপি মডেল আৰু এটা LLM-ৰ সৈতে সংযুক্ত কৰক। Kokoro ৰ দ্বাৰা ৰিয়েল-টাইম কথোপকথনৰ বাবে উপ-ছেকেণ্ডৰ লেটেন্সী উপলব্ধ কৰা হয়। CosyVoice 2 ৰ দ্বাৰা আকৌ কম অনুভূত প্ৰতিক্ৰিয়াৰ সময়ৰ বাবে স্ট্ৰিমিং আউটপুট সমৰ্থিত হয়।

CosyVoice 2 আৰু Kokoro এ স্ট্ৰিমিং অডিঅ' আউটপুট সমৰ্থন কৰে য'ত অডিঅ' চুঙ্কসমূহ সৃষ্টি হোৱাৰ লগে লগে উপলব্ধ কৰা হয়। এইটোৱে শব্দ সহায়ক আৰু দ্বিপাক্ষিক অভিজ্ঞতাৰ দৰে ৰিয়েল-টাইম এপ্লিকেচনসমূহৰ বাবে প্ৰথম-বাইটলৈ সময় হ্ৰাস কৰে।

API ৰ দ্বাৰা প্ৰমিত HTTP অৱস্থা কোড প্ৰদান কৰা হয়। 5xx ত্ৰুটি আৰু হাৰ সীমাবদ্ধতা প্ৰতিক্ৰিয়াৰ বাবে এক্সপোনেঞ্চিয়েল ব্যাকঅফ প্ৰয়োগ কৰা হয়। মিছন-ক্ৰিটিকেল এপ্লিকেচনসমূহৰ বাবে, পুনৰ চেষ্টাৰ লজিক সহযোগে এটা লাইন যোগ কৰা হয়। আমাৰ API ৰ উচ্চ আপটাইম আছে কিন্তু স্থিতিশীল ত্ৰুটি ব্যৱস্থাপনা সদায়ে সুপারিশ কৰা হয়।

হ'ব। /v1/voices আৰু /v1/models অন্তবিন্দুসমূহে সকলো উপলব্ধ কন্ঠ আৰু মডেলৰ JSON তালিকাসমূহ তেওঁলোকৰ মেটাডাটা (ভাষা সমৰ্থন, গুণগত মান, গতি মান, আৰু মূল্য স্তৰ) সহ প্ৰদান কৰে। আপোনাৰ এপ্লিকেচনত গতিশীল মডেল নিৰ্বাচকসমূহ নিৰ্মাণ কৰিবলৈ ইয়াক ব্যৱহাৰ কৰক।

মুক্ত মডেলসমূহ (Kokoro, Piper, VITS, MeloTTS) এটা প্ৰভাৱশালী স্যান্ডবক্স হিচাপে কাম কৰে যিহেতু তেওঁলোকে শূণ্য ক্ৰেডিট ব্যয় কৰে। মুক্ত মডেলসমূহৰ সৈতে আপোনাৰ একত্ৰিতকৰণ পৰীক্ষা কৰক, তাৰ পিছত মডেল প্ৰাচল পৰিবৰ্তন কৰি উৎপাদনত প্ৰিমিয়াম মডেলসমূহলৈ পৰিবৰ্তন কৰক। কোনো পৃথক পৰীক্ষা পৰিৱেশৰ প্ৰয়োজন নাই।

আমাৰ অধিকাংশ মডেল উন্মুক্ত উৎস আৰু স্ব-হোস্ট কৰিব পাৰি। তথাপিও, স্ব-হোস্টিংৰ বাবে উল্লেখযোগ্য GPU সম্পদৰ প্ৰয়োজন (আমি 4x NVIDIA Tesla P40 আৰু মোট 96GB VRAM ব্যৱহাৰ কৰোঁ)। API-এ আন্তঃগাঁথনি ব্যৱস্থাপনা অবিহনে ব্যয়বহুল বিকল্প প্ৰদান কৰে।
5.0/5 (1)

Voice AI ৰ সৈতে নিৰ্মাণ কৰিবলৈ প্ৰস্তুত নে?

আপোনাৰ বিনামূলীয়া API কি' প্ৰাপ্ত কৰক আৰু নিৰ্মাণ আৰম্ভ কৰক। ৫০ ক্রেডিট যোগদানত, বিনামূলীয়া মডেল উপলব্ধ, বিস্তৃত দস্তাবেজ।