ডেভেলপৰ বাবে টেক্সট-টু-স্পিচ API
আমাৰ REST API ৰ সৈতে শব্দ সমৰ্থিত এপ্লিকেচন নিৰ্মাণ কৰক। আপোনাৰ এপ্লিকেচন, চেটবট, শব্দ সহায়ক আৰু SaaS উৎপাদনত স্বাভাৱিক টেক্সট-টু-স্পীচ, শব্দ ক্লোনিং, শব্দ-টু-টেক্সট আৰু অডিঅ' প্ৰক্ৰিয়াকৰণ যোগ কৰক। OpenAI-সংগতিপূৰ্ণ বিন্যাস, 24+ মডেল, সৰল একত্ৰীকৰণ।
এতিয়া চেষ্টা কৰক
উন্নয়নকাৰীৰ বাবে API বৈশিষ্ট্যসমূহ
শব্দ সমৰ্থিত এপ্লিকেচন নিৰ্মাণৰ বাবে আপোনাৰ প্ৰয়োজনীয় সকলো
সহজ REST API
কথা সৃষ্টি কৰিবলৈ এটা POST অনুৰোধ। JSON অনুৰোধ, অডিঅ' প্ৰতিক্ৰিয়া। HTTP সমৰ্থন কৰা যিকোনো প্ৰগ্ৰামিং ভাষাৰ সৈতে কাম কৰে।
OpenAI-সুসংগত
OpenAI TTS API ৰ বাবে ড্ৰপ-ইন প্ৰতিস্থাপন। আপোনাৰ base_url আৰু API চাবি পৰিবৰ্তন কৰক - বৰ্তমান কোড তাৎক্ষণিকভাৱে কাম কৰে।
24+ আৰ্হি উপলব্ধ
এটা APIৰ দ্বাৰা প্ৰতিটো মডেল অভিগম কৰক। এটা প্ৰাচল পৰিবৰ্তন কৰি মডেল পৰিবৰ্তন কৰক। গুণমান, গতি আৰু মূল্যৰ তুলনা কৰক।
উপ-ছেকেণ্ড লেটেন্সি
Kokoro এ ১ ছেকেণ্ডত অডিঅ' সৃষ্টি কৰে। ৰিয়েল-টাইম চেটবট, শব্দ সহায়ক, আৰু প্ৰতিক্ৰিয়াশীল এপ্লিকেচনসমূহৰ বাবে সম্পূৰ্ণ।
শব্দ ক্লোনিং API
APIৰ দ্বাৰা এটা সংক্ষিপ্ত অডিঅ' নমুনাৰ পৰা যিকোনো শব্দ ক্লোন কৰক। সকলো পৰৱৰ্তী প্ৰজন্মৰ বাবে ক্লোন কৰা শব্দ ব্যৱহাৰ কৰক।
একাধিক বিন্যাস
WAV, MP3, OGG, অথবা FLAC হিচাপে আউটপুট। সেম্পল ৰেট আৰু বিট গভীৰতা বাছক। ৰিয়েল-টাইম এপ্লিকেচনৰ বাবে অডিঅ' ষ্ট্ৰীমিং সমৰ্থন।
বিকাশকৰ একত্ৰীকৰণৰ বাবে সেৰা মডেলসমূহ
আপোনাৰ এপ্লিকেচনৰ বাবে সঠিক মডেল বাছক
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
সৰ্বোত্তম: দ্রুততম মডেল - উপ-ছেকেণ্ড লেটেন্সী, ৰিয়েল-টাইম এপ্লিকেচন আৰু চেটবটসমূহৰ বাবে আদর্শ
চেষ্টা কৰক Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
সৰ্বোত্তম: শব্দ সহায়ক এপ্লিকেচনসমূহৰ বাবে শব্দ ক্লোনিং সহ TTS ষ্ট্ৰীমিং
চেষ্টা কৰক CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
সৰ্বোত্তম: চ্যাটবট আৰু সহায়ক শব্দৰ বাবে প্ৰাকৃতিক সময় নিৰ্ধাৰণৰ সৈতে কথোপকথন AI
চেষ্টা কৰক Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
সৰ্বোত্তম: শূণ্য ক্রেডিট ব্যয়ৰ সৈতে উচ্চ-ভলিউম এপ্লিকেচনৰ বাবে বিনামূলীয়া, কেৱল CPU মডেল
চেষ্টা কৰক Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
সৰ্বোত্তম: সৃজনশীল আৰু বিনোদনমূলক এপ্লিকেচনসমূহৰ বাবে শব্দ প্ৰভাৱসমূহৰ সৈতে অডিঅ' উৎপাদন কৰক
চেষ্টা কৰক BarkTTS API কিদৰে একত্ৰিত কৰিব
৫ মিনিটৰ তলত সাবস্ক্ৰাইবৰ পৰা প্ৰথম API কললৈ
আপোনাৰ API চাবি প্ৰাপ্ত কৰক
বিনামূলীয়াকৈ নিবন্ধন কৰক আৰু আপোনাৰ একাওন্ট ড্যাশবোর্ডৰ পৰা এটা API চাবি নিৰ্মাণ কৰক। ৫০ ক্রেডিট অন্তৰ্ভুক্ত।
আপোনাৰ প্ৰথম কল কৰক
টেক্সট, মডেল আৰু শব্দ সহ /v1/tts লৈ POST কৰক। অডিঅ' বাইটসমূহ পুনঃ প্ৰাপ্ত কৰক। ৫ শাৰী কোডৰ তলত।
আপোনাৰ আৰ্হি বাছক
আপোনাৰ use case ৰ বাবে বিভিন্ন মডেল পৰীক্ষা কৰক। প্ৰতি প্ৰজন্মত গতি, গুণমান আৰু মূল্যৰ তুলনা কৰক।
প্ৰস্তুতকৰণলৈ পঠাওক
Pay-as-you-go ক্রেডিটসমূহৰ সৈতে স্কেল কৰক। পৰিশোধিত প্ল্যানসমূহত কোনো হাৰ সীমা নাই। আপোনাৰ ড্যাশবোর্ডত ব্যৱহাৰ নিৰীক্ষণ কৰক।
দ্ৰুত আৰম্ভ কোড উদাহৰণসমূহ
আমাৰ REST API ৰ সৈতে যিকোনো ভাষাত TTS.ai একত্ৰিত কৰক
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
TTS.ai ৰ সৈতে বিকাশকে কি নিৰ্মাণ কৰে
সাধাৰণ সমন্বয় বিন্যাস আৰু এপ্লিকেচনসমূহ
AI চেটবট আৰু সহায়ক
আপোনাৰ চেটবট অথবা AI সহায়কলৈ ধ্বনি আউটপুট যোগ কৰক। ধ্বনি সমৰ্থিত আন্তঃপৃষ্ঠসমূহৰ বাবে TTSৰ দ্বাৰা LLM প্ৰতিক্ৰিয়াসমূহ পাইপ কৰক। Kokoro ৰ দ্বাৰা ৰিয়েল-টাইম কথোপকথনৰ বাবে সাব-ছেকেণ্ড লেটেন্সি প্ৰদান কৰা হয়। Sesame CSM ৰ দ্বাৰা প্ৰাকৃতিক সময়ৰ সৈতে কথোপকথন কথোপকথন সৃষ্টি কৰা হয়।
- কথোপকথন পাইপলাইনলৈ LLM প্ৰতিক্ৰিয়া
- Kokoro ৰ সৈতে উপ-ছেকেণ্ড লেটেন্সী
- Sesame CSM ৰ সৈতে কথোপকথন
- স্ট্ৰীমিং অডিঅ' আউটপুট
ম'বাইল আৰু শব্দ অনুপ্ৰয়োগ
শব্দ সমৰ্থিত ম'বাইল এপ্লিকেচন, অভিগম্যতা সৰঞ্জাম, পঢ়া এপ্লিকেচন, আৰু ভাষা শিকোৱা প্লেটফৰ্ম নিৰ্মাণ কৰক। আমাৰ REST API যিকোনো ম'বাইল ফ্ৰেমৱৰ্কৰ সৈতে কাম কৰে। অডিঅ' ফাইল ডাউনলোড কৰক বা সরাসৰি ক্লায়েন্টলৈ স্ট্ৰিম কৰক।
- React Native, Flutter, Swift, Kotlin
- অভিগম্যতা আৰু পঢ়া এপ্লিকেচনসমূহ
- ভাষা শিকিবলৈ প্লেটফৰ্মসমূহ
- অডিঅ' সমল সৃষ্টি কৰক
SaaS উৎপাদন
আপোনাৰ SaaS উৎপাদনত ৱাইট-লেবেল ধ্বনি ক্ষমতা। আপোনাৰ প্লেটফৰ্মত TTS, STT, ধ্বনি ক্লোনিং, আৰু অডিঅ' প্ৰক্ৰিয়াকৰণৰ বৈশিষ্ট্য যোগ কৰক। GPU আন্তঃগাঁথনি পৰিচালনা নকৰি আপোনাৰ ধ্বনি বেকএণ্ড হিচাপে আমাৰ API ব্যৱহাৰ কৰক।
- White-label শব্দৰ বৈশিষ্ট্যসমূহ
- GPU অবকাঠামোৰ প্ৰয়োজন নাই
- ব্যৱহাৰ অনুযায়ী মূল্য নিৰ্ধাৰণ
- আপোনাৰ ব্যৱহাৰকাৰীসকলক প্ৰদান কৰিবলৈ 24+ মডেল
স্বচালিত পাইপলাইনসমূহ
CI/CD পাইপলাইন, সামগ্ৰী স্বয়ংক্ৰিয়কৰণ, আৰু ব্যাচ প্ৰক্ৰিয়াকৰণ কাৰ্য্যপ্ৰবাহত ধ্বনি উৎপাদন একত্ৰিত কৰক। স্প্রেডশ্বেট তথ্যৰ পৰা হাজাৰ হাজাৰ অডিঅ' নথিপত্ৰ সৃষ্টি কৰক, স্বয়ংক্ৰিয় পডকাস্ট উৎপাদন কৰক, অথবা সামগ্ৰী স্থানীয়কৰণ পাইপলাইন নিৰ্মাণ কৰক।
- API দ্বাৰা ব্যাচ প্ৰক্ৰিয়াকৰণ
- বিষয়বস্তু স্থানীয়কৰণ পাইপলাইনসমূহ
- CI/CD সমন্বয়
- অডিঅ' স্বচালিতকৰণলৈ স্প্ৰেডশ্বিট
API বিৱৰণসমূহ
উৎপাদন অনুপ্ৰয়োগৰ বাবে নিৰ্মিত
24+
TTS মডেলসমূহ
100+
ধ্বনি
30+
ভাষাসমূহ
<1s
লেটেন্সি (Kokoro)
সদায় সোধা প্ৰশ্নসমূহ
TTS.ai বিকাশক API ৰ বিষয়ে সাধাৰণ প্ৰশ্নসমূহ
Voice AI ৰ সৈতে নিৰ্মাণ কৰিবলৈ প্ৰস্তুত নে?
আপোনাৰ বিনামূলীয়া API কি' প্ৰাপ্ত কৰক আৰু নিৰ্মাণ আৰম্ভ কৰক। ৫০ ক্রেডিট যোগদানত, বিনামূলীয়া মডেল উপলব্ধ, বিস্তৃত দস্তাবেজ।