মুক্ত উৎস টেক্সট-টু-স্পিচ মডেলName
আমাৰ প্লেটফৰ্মৰ প্ৰতিটো TTS মডেল বাণিজ্যিক-প্ৰিয় লাইচেঞ্চৰ সৈতে ওপেন সোর্স। MIT, Apache 2.0 — কোনো স্বত্বাধিকাৰী লক-ইন, কোনো ব্যৱহাৰৰ সীমাবদ্ধতা, কোনো অপ্ৰত্যাশিত লাইচেঞ্চিং ফি। আমাৰ হোস্ট কৰা APIৰ দ্বাৰা ইয়াক ব্যৱহাৰ কৰক, অথবা সম্পূৰ্ণ নিয়ন্ত্ৰণৰ সৈতে নিজস্ব আন্তঃগাঁথনিত ইয়াক স্ব-হোস্ট কৰক।
এতিয়া চেষ্টা কৰক
মুক্ত উৎস TTS সুবিধাসমূহ
আপোনাৰ প্ৰকল্পৰ বাবে উন্মুক্ত উৎসৰ মডেলসমূহ কিয় গুৰুত্বপূৰ্ণ
সকলো মুক্ত উৎস লাইচেঞ্চিত
TTS.ai ৰ প্ৰতিটো মডেলে এটা অনুমতিমূলক উন্মুক্ত উৎসৰ লাইচেঞ্চ ব্যৱহাৰ কৰে। কোনো স্বত্বাধিকাৰী ব্লেক বক্স নাই, কোনো ভেণ্ডাৰ লক-ইন নাই, কোনো অপ্ৰত্যাশিত লাইচেঞ্চিং ফি নাই।
MIT / Apache ২.০
মডেলসমূহ MIT অথবা Apache 2.0 ৰ অধীনত লাইসেন্স কৰা হৈছে, যিটো সৰ্বাধিক অনুমোদিত উন্মুক্ত উৎসৰ লাইসেন্স। বাণিজ্যিকভাৱে ব্যৱহাৰ কৰক, পৰিবৰ্তন কৰক, পুনৰ বিতৰন কৰক — কোনো প্ৰতিবন্ধকতা নাই।
স্ব-হোস্টযোগ্য
যিকোনো মডেল ডাউনল'ড কৰক আৰু ইয়াক আপোনাৰ নিজস্ব হাৰ্ডৱেৰত চলাওক। আপোনাৰ তথ্য, লেটেন্সী আৰু আন্তঃগাঁথনিৰ ওপৰত সম্পূৰ্ণ নিয়ন্ত্ৰণ। কোনো ক্লাউড নিৰ্ভৰতাৰ প্ৰয়োজন নাই।
GPU অনুকূলিত
CUDA সমৰ্থনৰ সৈতে NVIDIA GPUs ৰ বাবে মডেলসমূহ অনুকূলিত কৰা হৈছে। Piper কেৱল CPU ত চলায়। অধিকাংশ মডেলৰ সক্ষম অনুমানৰ বাবে ২-৮GB VRAMৰ প্ৰয়োজন হয়।
সম্প্রদায়ৰ দ্বাৰা পৰিচালিত
সক্ৰিয় উন্মুক্ত উৎসৰ সম্প্রদায়সমূহে এই মডেলসমূহ ৰক্ষা আৰু উন্নত কৰে। সহায়কসকলক স্বাগতম - বাগসমূহ, উন্নতিসমূহ, আৰু GitHub ত নতুন কণ্ঠসমূহ জমা কৰক।
বাণিজ্যিক ব্যৱহাৰ ঠিক আছে
সকলো মডেলে তেওঁলোকৰ লাইচেঞ্চৰ অধীনত বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। ৰয়েলটি বা ব্যৱহাৰৰ ফিৰ নোহোৱাকৈ সামগ্ৰী নিৰ্মাণ কৰক, সেৱা বিক্ৰী কৰক, আৰু বাণিজ্যিক সামগ্ৰী সৃষ্টি কৰক।
আমাৰ মুক্ত উৎস মডেল তালিকা
প্ৰতিটো মডেল, তাৰ লাইচেঞ্চ, আৰু ই কি ভাল কৰে
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
সৰ্বোত্তম: Apache 2.0 — সৰ্বোত্তম গুণমানৰ বিনামূলীয়া মডেল, 82M পৰামিটাৰ, স্ব-হোস্ট কৰিবলে সহজ
চেষ্টা কৰক Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
সৰ্বোত্তম: MIT — কেৱল CPU, প্ৰান্তীয় ডিভাইচ আৰু অন্তৰ্ভুক্ত স্ব-হোস্টিংৰ বাবে সম্পূৰ্ণ
চেষ্টা কৰক Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
সৰ্বোত্তম: MIT — বহু ডাউনস্ট্ৰীম মডেল দ্বাৰা ব্যৱহৃত মৌলিক স্থাপত্য
চেষ্টা কৰক VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
সৰ্বোত্তম: MIT — প্ৰমিত TTS ৰ বাহিৰ অনন্য অডিঅ' উৎপাদন ক্ষমতা
চেষ্টা কৰক Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
সৰ্বোত্তম: Apache 2.0 — সৰ্বোচ্চ গুণমান, ব্যাপকভাৱে অধ্যয়ন কৰা প্ৰতিনিধিত্ব প্ৰণয়ন
চেষ্টা কৰক Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
সৰ্বোত্তম: MIT — মুক্ত উৎসৰ কন্ঠ ক্লোনিং আৰু পাতল বিন্যাস নিয়ন্ত্ৰণ
চেষ্টা কৰক OpenVoiceকিদৰে মুক্ত উৎস TTS ব্যৱহাৰ কৰিব
আমাৰ হোস্ট কৰা API ব্যৱহাৰ কৰক অথবা মডেল নিজে চলাওক
মুক্ত উৎসৰ মডেল অনুসন্ধান কৰক
২০+ উন্মুক্ত উৎসৰ TTS মডেলৰ আমাৰ বৰ্ষপঞ্জি ব্ৰাউছ কৰক। প্ৰত্যেক মডেল পৃষ্ঠাত লাইচেঞ্চ, গঠন, ক্ষমতা আৰু স্ব-হোস্টিংৰ প্ৰয়োজনীয়তা প্ৰদৰ্শিত হয়।
আপোনাৰ ব্ৰাউছাৰত চেষ্টা কৰক
কোনো কিছু ইনস্টল নকৰি TTS.ai ত প্ৰত্যক্ষভাৱে যিকোনো মডেল পৰীক্ষা কৰক। আমাৰ GPU চাৰ্ভাৰে প্ৰক্ৰিয়াকৰণ ব্যৱস্থাপনা কৰে যাতে আপুনি স্ব-হোস্টিং কৰিবলৈ প্ৰতিশ্ৰুতি দিয়াৰ পূৰ্বে গুণমানৰ মূল্যায়ন কৰিব পাৰে।
স্ব-হোস্ট অথবা আমাৰ API ব্যৱহাৰ কৰক
GitHub ৰ পৰা মডেল repo ক্লোন কৰক আৰু স্থানীয়ভাৱে চলাওক, অথবা উৎপাদনৰ বাবে আমাৰ হোস্ট কৰা API ব্যৱহাৰ কৰক। স্ব-হোস্টিংয়ে সম্পূৰ্ণ নিয়ন্ত্ৰণ দিয়ে; আমাৰ API দ্বাৰা পৰিচালিত আন্তঃগাঁথনি প্ৰদান কৰা হয়।
আপোনাৰ অনুপ্ৰয়োগ নিৰ্মাণ কৰক
স্ব-হোস্ট কৰা মডেল অথবা আমাৰ REST API ব্যৱহাৰ কৰি আপোনাৰ উৎপাদনত TTS অন্তৰ্ভুক্ত কৰক। সকলো মডেল লাইচেঞ্চিং ফি বা ৰয়েলটি নোহোৱাকৈ বাণিজ্যিকভাৱে ব্যৱহাৰযোগ্য।
লাইচেঞ্চৰ তুলনা
TTS.ai ৰ সকলো মডেল বাণিজ্যিকভাৱে বন্ধুত্বপূৰ্ণ উন্মুক্ত উৎসৰ লাইচেঞ্চ ব্যৱহাৰ কৰে
| আৰ্হি | প্ৰমাণপত্ৰ | বাণিজ্যিক ব্যৱহাৰ | পৰিবৰ্তন | স্ব-গৃহস্থ | স্বীকৃতি |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | প্ৰয়োজনীয় | |||
| Piper | MIT | বৈকল্পিক | |||
| VITS | MIT | বৈকল্পিক | |||
| MeloTTS | MIT | বৈকল্পিক | |||
| Chatterbox | MIT | বৈকল্পিক | |||
| Tortoise TTS | Apache 2.0 | প্ৰয়োজনীয় | |||
| StyleTTS 2 | MIT | বৈকল্পিক | |||
| OpenVoice | MIT | বৈকল্পিক | |||
| Sesame CSM | Apache 2.0 | প্ৰয়োজনীয় | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
স্ব-হোস্টিং vs হোস্ট কৰা API
মডেল নিজেই চলাওক অথবা আন্তঃগাঁথনি ব্যৱস্থাপনা কৰিবলৈ আমাক দিয়ক
আপোনাৰ হাৰ্ডৱেৰত Self-Host
TTS.ai ৰ প্ৰতিটো মডেল GitHub অথবা Hugging Face ত এটা ওপেন-সোর্স প্ৰকল্প হিচাপে উপলব্ধ। ওজন ডাউনলোড কৰক, নিৰ্ভৰতাসমূহ ইনস্টল কৰক, আৰু আপোনাৰ নিজস্ব GPUs ত অনুমান চলাওক। আপোনাৰ লেটেন্সী, গোপনীয়তা, আৰু স্কেলিঙৰ ওপৰত সম্পূৰ্ণ নিয়ন্ত্ৰণ আছে।
- সম্পূৰ্ণ তথ্য গোপনীয়তা — অডিঅ' কখনোই আপোনাৰ চাৰ্ভাৰ ত্যাগ নকৰে
- প্ৰাৰম্ভিক স্থাপনাৰ পিছত প্ৰতি-আবেদনৰ কোনো ব্যয় নাই
- আপোনাৰ নিজস্ব তথ্যত স্বনিৰ্বাচিত ফাইন-টুইনিং
- GPU হাৰ্ডৱেৰৰ প্ৰয়োজন (NVIDIA ৰ পৰামৰ্শ কৰা হয়)
- আপডেইট, স্কেলিং আৰু নিৰ্ভৰতাসমূহ পৰিচালনা কৰক
TTS.ai হোস্ট কৰা API ব্যৱহাৰ কৰক
একক REST APIৰ জৰিয়তে সকলো 24+ মডেললৈ তাৎক্ষণিকভাৱে প্ৰৱেশ কৰক। আমি GPU প্ৰদান, মডেল আপডেট, লাইন ব্যৱস্থাপনা আৰু স্কেলিং ব্যৱস্থাপনা কৰোঁ। এটা API চাবি আপুনি প্ৰতিটো মডেললৈ প্ৰৱেশ কৰিব পাৰে - পৃথক বিকাশ ব্যৱস্থাপনা কৰাৰ প্ৰয়োজন নাই।
- GPU হাৰ্ডৱেৰৰ প্ৰয়োজন নাই
- এটা APIৰ দ্বাৰা সকলো 24+ মডেল
- স্বয়ংক্ৰিয় মডেল আপডেইট আৰু উন্নয়ন
- অতিৰিক্ত আন্তঃগাঁথনিৰ সৈতে ৯৯.৯% আপটাইম
- আপুনি যি ব্যৱহাৰ কৰে তাৰ বাবেহে পৰিশোধ কৰক
দ্ৰুত আৰম্ভ: API অথবা Self-Host
আমাৰ হোস্ট কৰা API ব্যৱহাৰ কৰক, অথবা মিনিটসমূহত Kokoro স্থানীয়ভাৱে ইন্সটল কৰক
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
মুক্ত উৎস, সস্তা মূল্য
আমাৰ হোস্ট কৰা API-এ GPUs পৰিচালনা নকৰাকৈ মুক্ত উৎসৰ TTS উপলব্ধ কৰে।
মুক্ত স্তৰ
$0
৫০ ক্রেডিট
- 4 মুক্ত উৎসৰ মডেল বিনামূল্যে
- মৌলিক ব্যৱহাৰৰ বাবে কোনো নিবন্ধন নাই
- বাণিজ্যিক ব্যৱহাৰ অনুমোদিত
আৰম্ভ কৰক
$9
৫০০ ক্রেডিট/মাহ
- সকলো 24+ মুক্ত উৎস মডেল
- শব্দ ক্লোনিং
- API অভিগম
প্ৰো
$29
২০০০ ক্রেডিট/মাহ
- GPU প্ৰক্ৰিয়াকৰণৰ অগ্ৰাধিকাৰ
- সকলো প্ৰিমিয়াম মডেল
- এন্টারপ্ৰাইজ সমৰ্থন
সদায় সোধা প্ৰশ্নসমূহ
মুক্ত উৎস টেক্সট-টু-স্পিচ সম্বন্ধে সাধাৰণ প্ৰশ্নসমূহ
আজি মুক্ত উৎসৰ TTS চেষ্টা কৰক
24+ উন্মুক্ত উৎসৰ মডেল, সকলো বাণিজ্যিক-লাইচেঞ্চিত। আমাৰ API বা স্ব-হোস্ট ব্যৱহাৰ কৰক - পছন্দ আপোনাৰ।