ডেভেলপারদের জন্য টেক্সট-টু-স্পিচ API

আমাদের REST API ব্যবহার করে শব্দ সমর্থিত অ্যাপ্লিকেশন তৈরি করুন। আপনার অ্যাপ্লিকেশন, চ্যাটবট, শব্দ সহকারী এবং SaaS পণ্যগুলিতে স্বাভাবিক টেক্সট-টু-স্পিকার, শব্দ ক্লোনিং, শব্দ-টু-স্পিকার এবং অডিও প্রক্রিয়াকরণ যোগ করুন। OpenAI-সমর্থিত ফরম্যাট, ২০+ মডেল, সহজ একীভূতকরণ।

REST API চ্যাটবট ভয়েস অ্যাপলিকেশনName SaaS পণ্য স্বয়ংক্রিয়

সম্পূর্ণ TTS সম্পাদক API ডকুমেন্টেশন

এখন চেষ্টা করুন

0/500

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে

আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে

সম্পূর্ণ TTS সম্পাদক খোলো

ডেভেলপারদের জন্য API বৈশিষ্ট্য

শব্দ সমর্থিত অ্যাপ্লিকেশন নির্মাণের জন্য আপনার যা যা প্রয়োজন

সরল REST API

একটি POST অনুরোধ বাক্যের সৃষ্টির জন্য। JSON অনুরোধ, অডিও প্রতিক্রিয়া। যেকোন প্রোগ্রামিং ভাষার সাথে কাজ করে যা HTTP সমর্থন করে।

OpenAI- সমর্থিত

OpenAI TTS API এর জন্য ড্রপ-ইন প্রতিস্থাপন। আপনার base_url এবং API কী পরিবর্তন করুন - বর্তমান কোড তাৎক্ষণিকভাবে কাজ করে।

24+ মডেল উপলব্ধ

একক API এর মাধ্যমে প্রত্যেক মডেল ব্যবহার করুন। একটি প্যারামিটার পরিবর্তন করে মডেল পরিবর্তন করুন। গুণমান, গতি এবং খরচ তুলনা করুন।

সাব- সেকেন্ড লেটেন্সি

Kokoro ১ সেকেন্ডের মধ্যে অডিও তৈরি করে। বাস্তব-সময়ের চ্যাটবট, ভয়েস সহায়ক এবং মিথস্ক্রিয় অ্যাপ্লিকেশনের জন্য এটি অত্যন্ত উপযোগী।

ভয়েস ক্লোনিং API

API ব্যবহার করে একটি অডিও নমুনা থেকে যেকোন শব্দ ক্লোন করুন। পরবর্তী প্রজন্মের জন্য ক্লোন করা শব্দ ব্যবহার করুন।

একাধিক ফরম্যাট

আউটপুট WAV, MP3, OGG, অথবা FLAC হিসাবে। নমুনা হার এবং বিট গভীরতা বেছে নিন। রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য অডিও স্ট্রিমিং সমর্থন।

ডেভেলপার একীভূতকরণের জন্য সেরা মডেল

আপনার অ্যাপ্লিকেশনের গতি, গুণমান এবং খরচের জন্য সঠিক মডেল নির্বাচন করুন

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

স্থায়ী 5/5

সর্বোত্তম: দ্রুততম মডেল — সাব-সেকেন্ড লেটেন্সি, রিয়েল-টাইম অ্যাপ্লিকেশন এবং চ্যাটবট-এর জন্য আদর্শ

চেষ্টা করো Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

মধ্যম 5/5 ভয়েস ক্লোন

সর্বোত্তম: ভয়েস অ্যাসিস্ট্যান্ট অ্যাপ্লিকেশনের জন্য ভয়েস ক্লোনিং সহ স্ট্রিমিং TTS

চেষ্টা করো CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

ধীর 5/5

সর্বোত্তম: চ্যাটবট এবং সহকারী শব্দের জন্য প্রাকৃতিক টাইমিং সহ কথোপকথন AI

চেষ্টা করো Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

স্থায়ী 3/5

সর্বোত্তম: শূন্য ক্রেডিট খরচ সহ উচ্চ পরিমাণ অ্যাপ্লিকেশনের জন্য বিনামূল্যে, CPU-only মডেল

চেষ্টা করো Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ধীর 4/5

সর্বোত্তম: সৃজনশীল এবং বিনোদনমূলক অ্যাপ্লিকেশনের জন্য শব্দের প্রভাব সহ অডিও উত্পাদন করুন

চেষ্টা করো Bark

কিভাবে TTS API একীভূত করা যায়

সাইন আপ থেকে প্রথম API কল5মিনিট কম

আপনার API কী পান

বিনামূল্যে নিবন্ধন করুন এবং আপনার অ্যাকাউন্টের ড্যাশবোর্ড থেকে একটি API কী তৈরি করুন। ১৫,০০০ অক্ষর অন্তর্ভুক্ত।

আপনার প্রথম কল করুন

টেক্সট, মডেল এবং শব্দ সহ /v1/tts এ পোস্ট করুন। অডিও বাইট ফিরিয়ে নিন। ৫ লাইন কোডের নিচে।

আপনার মডেল বেছে নিন

আপনার ব্যবহারের ক্ষেত্রে বিভিন্ন মডেল পরীক্ষা করুন। প্রতি প্রজন্মে গতি, গুণমান এবং খরচ তুলনা করুন।

উৎপাদনে পাঠাও

Pay-as-you-go অক্ষর ব্যবহার করে স্কেল করুন। পরিশোধিত পরিকল্পনার জন্য কোনো হার সীমা নেই। আপনার ড্যাশবোর্ডে ব্যবহার পর্যবেক্ষণ করুন।

দ্রুত আরম্ভ কোড উদাহরণ

আমাদের REST API এর সাথে যেকোন ভাষায় TTS.ai একীভূত করুন

Python জনপ্রিয়

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL বিশ্বব্যাপী

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-র সাথে সামঞ্জস্যপূর্ণ ফরম্যাট ড্রপ-ইন

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

আপনার বিনামূল্যে API কী পেতে

ডেভেলপাররা TTS.ai দিয়ে কি তৈরি করে

সাধারণ একীভূতকরণ প্যাটার্ন এবং অ্যাপ্লিকেশন

AI চ্যাটবট এবং সহায়ক

আপনার চ্যাটবট বা AI সহকারীর জন্য শব্দ আউটপুট যোগ করুন। শব্দ সক্রিয় ইন্টারফেসের জন্য TTS এর মাধ্যমে LLM প্রতিক্রিয়া পাইপ করুন। Kokoro বাস্তব সময়ের কথোপকথনের জন্য সাব-সেকেন্ডের লেটেন্সী সরবরাহ করে। Sesame CSM প্রাকৃতিক সময়ের সাথে কথোপকথন শব্দ উত্পাদন করে।

ভাষণ পাইপলাইনে LLM প্রতিক্রিয়া
Kokoro এর সাথে সাব-সেকেন্ড লেটেন্সি
সেসাম সিএসএম এর সাথে কথোপকথন
অডিও আউটপুট স্ট্রিমিং

মোবাইল এবং ভয়েস অ্যাপলিকেশনName

শব্দ সমর্থিত মোবাইল অ্যাপ্লিকেশন, প্রবেশাধিকার টুল, পড়াশোনা অ্যাপ্লিকেশন এবং ভাষা শিখতে প্ল্যাটফর্ম তৈরি করুন। আমাদের REST API যেকোনো মোবাইল ফ্রেমওয়ার্কের সাথে কাজ করে। অডিও ফাইল ডাউনলোড করুন অথবা সরাসরি ক্লায়েন্টে স্ট্রিম করুন।

React নেটিভ, ফ্লাটার, সুইফট, Kotlin
প্রবেশযোগ্যতা এবং পড়াশোনা অ্যাপলিকেশন
ভাষা শেখার প্ল্যাটফর্ম
অডিও বিষয়বস্তু উৎপাদন

SaaS পণ্য

আপনার SaaS পণ্যে হোয়াইট-লেবেল ভয়েস ক্ষমতা। আপনার প্ল্যাটফর্মে TTS, STT, ভয়েস ক্লোনিং এবং অডিও প্রসেসিং বৈশিষ্ট্য হিসাবে যোগ করুন। GPU পরিকাঠামো পরিচালনা না করে আপনার ভয়েস ব্যাকএন্ড হিসাবে আমাদের API ব্যবহার করুন।

হোয়াইট-লেবেল ভয়েস বৈশিষ্ট্য
GPU অবকাঠামোর প্রয়োজন নেই
ব্যবহারের জন্য মূল্য নির্ধারণ
আপনার ব্যবহারকারীদের প্রদান করতে ২০+ মডেল

স্বয়ংক্রিয় পাইপলাইন

CI/CD পাইপলাইন, বিষয়বস্তু স্বয়ংক্রিয়করণ এবং ব্যাচ প্রসেসিং ওয়ার্কফ্লোতে শব্দ উৎপাদন একীভূত করুন। স্প্রেডশিট তথ্য থেকে হাজার হাজার অডিও ফাইল তৈরি করুন, স্বয়ংক্রিয় পডকাস্ট উৎপাদন করুন, অথবা বিষয়বস্তু স্থানীয়করণ পাইপলাইন নির্মাণ করুন।

API ব্যবহার করে ব্যাচ প্রসেসিং
বিষয়বস্তু স্থানীয়করণ পাইপলাইন
CI/CD সমন্বয়
অডিও স্বয়ংক্রিয় করতে স্প্রেডশীট

সম্পূর্ণ API নথিপত্র প্রদর্শন করুন

API বৈশিষ্ট্য

উৎপাদন অ্যাপ্লিকেশনের জন্য নির্মিত

20+

TTS মডেল

100+

আওয়াজ

30+

ভাষাName

<1s

লেটেন্সি (Kokoro)

বিনামূল্যে নিবন্ধন করুন — ১৫,০০০ অক্ষর

প্রায়শ জিজ্ঞাসিত প্রশ্ন

TTS.ai ডেভেলপার API সম্পর্কে সাধারণ প্রশ্ন

হ্যাঁ। আমাদের API OpenAI অডিও স্পিকার ফরম্যাট অনুসরণ করে। আপনি যদি OpenAI Python অথবা JavaScript ক্লায়েন্ট লাইব্রেরী ব্যবহার করেন, তাহলে base_url এবং api_key পরামিতি পরিবর্তন করে আপনি TTS.ai-এ পরিবর্তন করতে পারেন। আপনার বর্তমান কোড পরিবর্তন ছাড়াই কাজ করে।

Kokoro সাধারণ বাক্যগুলোর জন্য ১ সেকেন্ডের মধ্যে অডিও তৈরি করে। CosyVoice ২ স্ট্রিমিং আউটপুট সমর্থন করে এমনকি কম অনুভূত লেটেন্সির জন্য। চ্যাটবট এবং ভয়েস অ্যাসিস্ট্যান্টের জন্য, মোট রান-ট্রিপ সময় সাধারণত ১-৩ সেকেন্ড, টেক্সটের দৈর্ঘ্য এবং মডেল নির্বাচনের উপর নির্ভর করে।

ফ্রি মডেল (কোকোরো, পাইপার, ভিটিএস, মেলোটিটিএস) সম্পূর্ণ বিনামূল্যে। স্ট্যান্ডার্ড মডেল প্রতি ১ কেবি টেক্সটে ২x অক্ষর ব্যবহার করে। প্রিমিয়াম মডেল প্রতি ১ কেবি টেক্সটে ৪x অক্ষর ব্যবহার করে। ১৫,০০০ অক্ষরের সাথে বিনামূল্যে নিবন্ধন করুন। ৫০০,০০০ অক্ষরের জন্য প্ল্যান শুরু হয় $৯/মাসে।

হ্যাঁ। একটি রেফারেন্স অডিও নমুনা (৫-৩০ সেকেন্ড) ভয়েস ক্লোনিং এন্ডপয়েন্টে আপলোড করুন, তারপর পরবর্তী TTS অনুরোধে ক্লোন করা ভয়েস ID ব্যবহার করুন। ক্লোনিং সমর্থিত মডেলসমূহের মধ্যে রয়েছে CosyVoice ২, Chatterbox, Fish Speech, এবং GPT-SoVITS।

বিনামূল্যে স্তর মৌলিক হার সীমাবদ্ধ (অ্যাকাউন্ট ছাড়া প্রতি ঘন্টায় ৩টি অনুরোধ)। পরিশোধিত পরিকল্পনার উৎপাদন অ্যাপ্লিকেশনের জন্য উপযুক্ত উদার হার সীমাবদ্ধতা রয়েছে। এন্টারপ্রাইজ-স্তরের গতিবিধি প্রয়োজনের জন্য আমাদের সাথে যোগাযোগ করুন।

WAV (অসংকোচন, সর্বোচ্চ গুণমান), MP3 (সংকোচন, ছোট ফাইল), OGG (মুক্ত ফরম্যাট), এবং FLAC (ক্ষতিমুক্ত সংকোচন)। আপনার অনুরোধের ফরম্যাট উল্লেখ করুন। ডিফল্ট হচ্ছে মডেলের নেটিভ সাম্পল রেট দ্বারা নির্ধারিত WAV।

হ্যাঁ। একটি সম্পূর্ণ ভয়েস অ্যাসিস্ট্যান্ট পাইপলাইন তৈরি করতে আমাদের TTS API-কে একটি বাক্যের জন্য মডেল এবং একটি LLM-এর সাথে সংযুক্ত করুন। Kokoro সাব-সেকেন্ডের লেটেন্সী প্রদান করে যা বাস্তব-সময়ের কথোপকথনের জন্য উপযুক্ত। CosyVoice2আরো কম অনুভূত প্রতিক্রিয়া সময়ের জন্য স্ট্রিমিং আউটপুট সমর্থন করে।

CosyVoice2এবং Kokoro স্ট্রিমিং অডিও আউটপুট সমর্থন করে যেখানে অডিও চ্যাঙ্কস তাদের উত্পাদন করা হয়। এটি বাস্তব-সময়ের অ্যাপ্লিকেশন যেমন ভয়েস সহায়ক এবং মিথস্ক্রিয় অভিজ্ঞতার জন্য প্রথম বাইট পর্যন্ত সময় কমায়।

API-র ফলাফল হল প্রমিত HTTP স্ট্যাটাস কোড। 5xx ত্রুটি এবং সীমিত হারের প্রতিক্রিয়ার জন্য এক্সপোনেনশিয়াল ব্যাকঅফ প্রয়োগ করুন। মিশন-ক্রিটিকাল অ্যাপ্লিকেশনের জন্য, পুনরায় চেষ্টা করার যুক্তি সহ একটি লাইন যোগ করুন। আমাদের API-র উচ্চ আপটাইম আছে কিন্তু স্থিতিশীল ত্রুটি হ্যান্ডলিং সবসময়ই সুপারিশ করা হয়।

হ্যাঁ। /v1/voices এবং /v1/models এন্ডপয়েন্টগুলি তাদের মেটাডাটা (ভাষা সমর্থন, গুণগতমান রেটিং, গতি রেটিং এবং মূল্য স্তর) সহ সমস্ত উপলব্ধ কন্ঠ এবং মডেলের JSON তালিকা ফিরিয়ে দেয়। আপনার অ্যাপ্লিকেশনে ডাইনামিক মডেল নির্বাচনকারী তৈরি করতে এগুলি ব্যবহার করুন।

মুক্ত মডেল (Kokoro, Piper, VITS, MeloTTS) একটি কার্যকরী স্যান্ডবক্স হিসাবে কাজ করে কারণ তারা শূন্য ক্রেডিট খরচ করে। মুক্ত মডেলের সাথে আপনার একীভূতকরণ পরীক্ষা করুন, তারপর মডেল পরামিতি পরিবর্তন করে উৎপাদনে প্রিমিয়াম মডেলে পরিবর্তিত করুন। কোন পৃথক পরীক্ষার পরিবেশের প্রয়োজন নেই।

আমাদের অধিকাংশ মডেল উন্মুক্ত উৎস এবং স্ব-হোস্ট করা যেতে পারে। তবে, স্ব-হোস্টিং উল্লেখযোগ্য GPU সম্পদ প্রয়োজন (আমরা 4x NVIDIA Tesla P40 এবং মোট 96GB VRAM ব্যবহার করি)। API অবকাঠামো ব্যবস্থাপনা ছাড়াই একটি ব্যয়-প্রতিফল বিকল্প প্রদান করে।

5.0/5 (1)

ভয়েস এআই ব্যবহার করে তৈরি করতে প্রস্তুত?

আপনার বিনামূল্যে API কী পেতে এবং নির্মাণ শুরু করুন। ৫০ ক্রেডিট নিবন্ধন, বিনামূল্যে মডেল উপলব্ধ, বিস্তারিত নথিপত্র।

নিবন্ধন করুন মূল্য প্রদর্শন

ডেভেলপারদের জন্য টেক্সট-টু-স্পিচ API

এখন চেষ্টা করুন

TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

ডেভেলপারদের জন্য API বৈশিষ্ট্য

সরল REST API

OpenAI- সমর্থিত

24+ মডেল উপলব্ধ

সাব- সেকেন্ড লেটেন্সি

ভয়েস ক্লোনিং API

একাধিক ফরম্যাট

ডেভেলপার একীভূতকরণের জন্য সেরা মডেল

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

কিভাবে TTS API একীভূত করা যায়

আপনার API কী পান

আপনার প্রথম কল করুন

আপনার মডেল বেছে নিন

উৎপাদনে পাঠাও

দ্রুত আরম্ভ কোড উদাহরণ

ডেভেলপাররা TTS.ai দিয়ে কি তৈরি করে

AI চ্যাটবট এবং সহায়ক

মোবাইল এবং ভয়েস অ্যাপলিকেশনName

SaaS পণ্য

স্বয়ংক্রিয় পাইপলাইন

API বৈশিষ্ট্য

প্রায়শ জিজ্ঞাসিত প্রশ্ন

API কি OpenAI TTS ফরম্যাটের সাথে সামঞ্জস্যপূর্ণ?

রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য লেটেন্সি কত?

API ব্যবহারের জন্য মূল্য নির্ধারণ কিভাবে কাজ করে?

আমি কি API-র মাধ্যমে ভয়েস ক্লোনিং ব্যবহার করতে পারি?

কোন সীমা আছে কি?

API কোন অডিও ফরম্যাট ফিরিয়ে দেবে?

আমি কি এই অ্যাপলিকেশন প্রযুক্তির সাহায্যে একটি ভয়েস অ্যাসিস্ট্যান্ট বা চ্যাটবট তৈরি করতে পারি?

WebSocket অথবা স্ট্রিমিং API কি আছে?

আমি কিভাবে সমস্যা এবং পুনরাবৃত্তি প্রক্রিয়াজাতকরণ ব্যবস্থাপনা করব?

আমি কি প্রোগ্রামের মাধ্যমে উপলব্ধ কণ্ঠ এবং মডেল তালিকাভুক্ত করতে পারি?

কোন স্যান্ডবক্স বা টেস্টিং এনভায়রনমেন্ট আছে কি?

আমি কি এপিআই ব্যবহার না করে মডেলগুলো স্বয়ংক্রিয়ভাবে হোস্ট করতে পারি?

ভয়েস এআই ব্যবহার করে তৈরি করতে প্রস্তুত?