ওপেন সোর্স টেক্সট-টু-স্পিচ মডেল
আমাদের প্ল্যাটফর্মের প্রতিটি টিটিএস মডেল বাণিজ্যিকভাবে বন্ধুত্বপূর্ণ লাইসেন্সের সাথে উন্মুক্ত উৎস। এমআইটি, অ্যাপাচি ২. ০ - কোন মালিকানাধীন লক-ইন, কোন ব্যবহারের সীমাবদ্ধতা, কোন অপ্রত্যাশিত লাইসেন্সিং ফি। আমাদের হোস্ট করা এপিআই-এর মাধ্যমে তাদের ব্যবহার করুন, অথবা আপনার নিজস্ব অবকাঠামোতে সম্পূর্ণ নিয়ন্ত্রণের সাথে তাদের স্ব-হোস্ট করুন।
এখন চেষ্টা করুন
ওপেন সোর্স TTS সুবিধা
কেন উন্মুক্ত উৎস মডেল আপনার প্রকল্পের জন্য গুরুত্বপূর্ণ
সব উন্মুক্ত-সোর্স লাইসেন্সকৃত
TTS.ai-এর প্রত্যেকটি মডেল একটি অনুমোদিত উন্মুক্ত সোর্স লাইসেন্স ব্যবহার করে। কোন মালিকানাধীন ব্ল্যাকবক্স নেই, কোন বিক্রেতা লক-ইন নেই, কোন অপ্রত্যাশিত লাইসেন্সিং ফি নেই।
এম- আই- টি / অ্যাপাচি ২. ০
মডেলগুলো এমআইটি অথবা অ্যাপাচি ২.০ এর অধীনে লাইসেন্স করা হয়েছে, যা সবচেয়ে বেশি অনুমোদিত মুক্ত উৎস লাইসেন্স। বাণিজ্যিকভাবে ব্যবহার করুন, পরিবর্তন করুন, পুনরায় বিতরণ করুন - কোন নিষেধাজ্ঞা নেই।
স্বয়ংক্রিয়
যেকোন মডেল ডাউনলোড করুন এবং আপনার নিজের হার্ডওয়্যারে চালানোর জন্য এটি ব্যবহার করুন। আপনার ডাটা, লেটেন্সি এবং পরিকাঠামোর উপর সম্পূর্ণ নিয়ন্ত্রণ রাখুন। কোন ক্লাউড নির্ভরতা প্রয়োজন নেই।
GPU অপটিমাইজড
মডেলগুলো CUDA সমর্থন সহ NVIDIA GPUs এর জন্য অপটিমাইজ করা হয়েছে। পাইপার শুধুমাত্র CPU-এ চলবে। অধিকাংশ মডেলের জন্য দক্ষ অনুমানের জন্য ২-৮GB VRAM প্রয়োজন।
সম্প্রদায় রক্ষণাবেক্ষণ করা হচ্ছে
সক্রিয় উন্মুক্ত উৎস সম্প্রদায় এই মডেলগুলি রক্ষণাবেক্ষণ এবং উন্নত করে। অবদান স্বাগতম - বাগ, উন্নতি এবং নতুন কণ্ঠস্বর গিটহাবে জমা দিন।
বাণিজ্যিক ব্যবহার ঠিক আছে
সকল মডেল তাদের লাইসেন্সের অধীনে বাণিজ্যিক ব্যবহারের অনুমতি প্রদান করে। কোন রয়্যালটি বা ব্যবহার ফি ছাড়াই পণ্য তৈরি, পরিষেবা বিক্রি এবং বাণিজ্যিক বিষয়বস্তু তৈরি করুন।
আমাদের মুক্ত উৎস মডেল ক্যাটালগ
প্রত্যেক মডেল, তার লাইসেন্স, এবং সে সবচেয়ে ভাল কি করে
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
সর্বোত্তম: আপাচি ২. ০ — সর্বোচ্চ গুণমানের বিনামূল্যে মডেল, ৮২M পরামিতি, সহজ স্ব-হোস্ট
চেষ্টা করো Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
সর্বোত্তম: MIT — কেবল সিপিইউ, প্রান্তের ডিভাইস এবং অন্তর্ভুক্ত স্বয়ংক্রিয় হোস্টিং-এর জন্য উপযুক্ত
চেষ্টা করো Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
সর্বোত্তম: এমআইটি — অনেক ডাউনস্ট্রিম মডেল দ্বারা ব্যবহৃত ভিত্তি স্থাপত্য
চেষ্টা করো VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
সর্বোত্তম: এমআইটি — আদর্শ TTS এর বাইরে অনন্য অডিও উৎপাদন ক্ষমতা
চেষ্টা করো Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
সর্বোত্তম: আপাচি ২. ০ — সর্বোচ্চ গুণমান, ব্যাপকভাবে অধ্যয়ন রেফারেন্স বাস্তবায়ন
চেষ্টা করো Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
সর্বোত্তম: MIT — মুক্ত উৎস কণিকা স্টাইল নিয়ন্ত্রণ সঙ্গে ভয়েস ক্লোনিং
চেষ্টা করো OpenVoiceকিভাবে ওপেন সোর্স TTS ব্যবহার করবেন
আমাদের হোস্ট করা API ব্যবহার করুন অথবা নিজেই মডেল চালান
উন্মুক্ত উৎস মডেল অনুসন্ধান করুন
২০+ উন্মুক্ত উৎস TTS মডেলের আমাদের ক্যাটালগ ব্রাউজ করুন। প্রতিটি মডেল পৃষ্ঠা লাইসেন্স, স্থাপত্য, ক্ষমতা এবং স্ব-হোস্টিং প্রয়োজনীয়তা প্রদর্শন করে।
আপনার ব্রাউজার- এ চেষ্টা করুন
কোন কিছু ইনস্টল না করে TTS.ai-এ যে কোন মডেল সরাসরি পরীক্ষা করুন। আমাদের GPU সার্ভার প্রক্রিয়াকরণ পরিচালনা করে যাতে আপনি স্ব-হোস্টিং করার আগে গুণমান মূল্যায়ন করতে পারেন।
স্ব-হোস্ট অথবা আমাদের API ব্যবহার করুন
GitHub থেকে ক্লোন মডেল রেপো এবং স্থানীয়ভাবে চালানো, অথবা উৎপাদনের জন্য আমাদের হোস্ট করা API ব্যবহার করুন। স্ব-হোস্টিং সম্পূর্ণ নিয়ন্ত্রণ প্রদান করে; আমাদের API পরিচালিত অবকাঠামো প্রদান করে।
আপনার অ্যাপ্লিকেশন তৈরি করুন
আপনার পণ্যটিতে TTS একীভূত করুন স্ব-হোস্ট মডেল বা আমাদের REST API ব্যবহার করে। সব মডেল বাণিজ্যিকভাবে ব্যবহারযোগ্য কোন লাইসেন্স ফি বা রাইটস ছাড়াই।
লাইসেন্সের তুলনা
TTS.ai এর সব মডেল বাণিজ্যিকভাবে বন্ধুত্বপূর্ণ উন্মুক্ত উৎস লাইসেন্স ব্যবহার করে
| মডেল | লাইসেন্স | বাণিজ্যিক ব্যবহার | পরিবর্তন | স্ব- হোস্ট | বরাদ্দ |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | আবশ্যক | |||
| Piper | MIT | বৈকল্পিক | |||
| VITS | MIT | বৈকল্পিক | |||
| MeloTTS | MIT | বৈকল্পিক | |||
| Chatterbox | MIT | বৈকল্পিক | |||
| Tortoise TTS | Apache 2.0 | আবশ্যক | |||
| StyleTTS 2 | MIT | বৈকল্পিক | |||
| OpenVoice | MIT | বৈকল্পিক | |||
| Sesame CSM | Apache 2.0 | আবশ্যক | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
স্ব-হোস্টিং বনাম হোস্ট করা API
মডেল নিজেই চালাও অথবা আমাদেরকে পরিকাঠামোর ব্যবস্থাপনা করতে দিন
আপনার হার্ডওয়্যারে স্বয়ংক্রিয় হোস্ট
TTS.ai এর প্রত্যেকটি মডেল গিথহাব অথবা হ্যাগিং ফেস এর ওপেন সোর্স প্রকল্প হিসেবে উপলব্ধ। ওজন ডাউনলোড করুন, নির্ভরশীলতা ইনস্টল করুন, এবং আপনার নিজস্ব GPUs এর উপর অনুমান চালান। আপনি latency, গোপনীয়তা এবং স্কেলিং এর উপর সম্পূর্ণ নিয়ন্ত্রণ রাখেন।
- সম্পূর্ণ ডাটা গোপনীয়তা — অডিও কখনোই আপনার সার্ভার ত্যাগ করে না
- প্রাথমিক সেটআপের পরে প্রতি-আবেদন খরচ নেই
- আপনার নিজের তথ্যের উপর স্বনির্ধারিত ফিন-টুইন
- GPU হার্ডওয়্যার প্রয়োজন (NVIDIA সুপারিশ করা হয়)
- আপনি আপডেট, স্কেলিং এবং নির্ভরশীলতা পরিচালনা করেন
TTS.ai হোস্ট করা API ব্যবহার করো
একক REST API এর মাধ্যমে ২০+ মডেলের জন্য তাৎক্ষণিক প্রবেশাধিকার পাবেন। আমরা GPU প্রদান, মডেল আপডেট, লাইন ব্যবস্থাপনা এবং স্কেলিং পরিচালনা করি। একটি API কী আপনাকে প্রতিটি মডেলে প্রবেশাধিকার প্রদান করে - পৃথকভাবে বিনিয়োগের ব্যবস্থাপনা করার প্রয়োজন নেই।
- GPU হার্ডওয়্যারের প্রয়োজন নেই
- একটি API দ্বারা সব 20+ মডেল
- স্বয়ংক্রিয় মডেল আপডেট এবং উন্নতি
- অতিরিক্ত অবকাঠামোর সাথে ৯৯.৯% আপটাইম
- শুধুমাত্র আপনি যা ব্যবহার করেন তার জন্যই টাকা প্রদান করুন
জলদি শুরু: API অথবা Self- Host
আমাদের হোস্ট করা API ব্যবহার করুন, অথবা মিনিটগুলোতে Kokoro স্থানীয়ভাবে ইনস্টল করুন
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
মুক্ত উৎস, সস্তা মূল্য
আমাদের হোস্ট করা এপিআই মুক্ত উৎস টিটিএস ব্যবহারযোগ্য করে তোলে জিপিইউ পরিচালনা না করেই।
মুক্ত স্তর
$0
সাইন আপ ৫০ ক্রেডিট
- 4 উন্মুক্ত উৎস মডেল বিনামূল্যে
- মৌলিক ব্যবহারের জন্য কোন নিবন্ধন নেই
- বাণিজ্যিক ব্যবহার অনুমোদিত
আরম্ভকারী
$9
মাসে ৫০০ ক্রেডিট
- সকল ২০+ উন্মুক্ত-সোর্স মডেল
- শব্দের ক্লোন
- API ব্যবহার
প্রফেসর
$29
২,০০০,০০০ অক্ষর/মাস
- GPU প্রসেসিং- এর অগ্রাধিকার
- সব প্রিমিয়াম মডেল
- এন্টারপ্রাইজ সমর্থন
প্রায়শ জিজ্ঞাসিত প্রশ্ন
মুক্ত উৎস টেক্সট-টু-স্পিকার সম্পর্কে সাধারণ প্রশ্ন
আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।
আজ মুক্ত উৎস TTS চেষ্টা করুন
২০+ উন্মুক্ত উৎস মডেল, সবগুলোই বাণিজ্যিকভাবে লাইসেন্সপ্রাপ্ত। আমাদের অ্যাপআই ব্যবহার করুন অথবা স্বয়ংক্রিয়ভাবে হোস্ট করুন - পছন্দ আপনার।