AI শব্দ নিৰ্মাতা - ২৪+ মডেল, ১০০+ শব্দ
আধুনিক AI ব্যৱহাৰ কৰি টেক্সটৰ পৰা প্ৰকৃত মানৱ কথন নিৰ্মাণ কৰক। ২৪+ নিউৰাল TTS মডেল, ১০০+ পূৰ্ব নিৰ্মিত কথন আৰু কথন ক্লোনিংৰ পৰা নিৰ্বাচন কৰক - সকলো এটা প্লেটফৰ্মৰ পৰা। Kokoro ৰ সৈতে দ্ৰুত ড্ৰাফ্টৰ পৰা Tortoise TTS ৰ সৈতে স্টুডিঅ'-গুণমানৰ অডিঅ'লৈ, যিকোনো প্ৰকল্পৰ বাবে সম্পূৰ্ণ কথন বিচাৰি লওক।
এতিয়া চেষ্টা কৰক
AI শব্দ উৎপাদনৰ বৈশিষ্ট্যসমূহ
সৃষ্টিকৰ্তা, উন্নয়নকাৰী আৰু ব্যৱসায়ৰ বাবে এটা সম্পূৰ্ণ শব্দ উৎপাদন প্লেটফৰ্ম
২০+ AI মডেল
২০ ৰো অধিক AI শব্দ মডেল ব্যৱহাৰ কৰক, প্ৰত্যেকটো অসাধাৰণ শক্তিৰ সৈতে। দ্ৰুত হালধীয়া মডেলসমূহৰ পৰা প্ৰিমিয়াম স্টুডিঅ'-গুণমানৰ ইঞ্জিনসমূহলৈ।
১০০+ ধ্বনি
বিভিন্ন লিঙ্গ, বয়স, উচ্চাৰণ আৰু ভাষাৰ ১০০ ৰো অধিক শব্দৰ এক বিচিত্র বৰ্ষপঞ্জি ব্ৰাউছ কৰক। সৃষ্টি কৰাৰ পূৰ্বে যিকোনো শব্দৰ পূৰ্বপ্ৰদৰ্শন কৰক।
ধ্বনি ক্লোনিং
৫-৩০ ছেকেণ্ডৰ অডিঅ' নমুনাৰ পৰা যিকোনো শব্দ ক্লোন কৰক। আখৰ, ব্ৰেন্ডিং, অথবা অন্তৰ্ভুক্তিৰ বাবে স্বনিৰ্বাচিত শব্দ নিৰ্মাণ কৰক যি পূৰ্ণৰূপে মূলৰ দৰে শব্দ কৰে।
ইমোচন নিয়ন্ত্ৰণ
সুখী, দুখী, ক্ষুব্ধ, উত্তেজিত, উচুপি উচুপি কথা ক'ব পৰা বিশেষ অনুভূতিৰে কথা ক'ব পৰা শব্দ নিৰ্মাণ কৰক। সুষম, অভিব্যক্তিমূলক শব্দৰ বাবে শব্দৰ গভীৰতা নিয়ন্ত্ৰণ কৰক।
ভাষাসমূহ
৩০ ৰো অধিক ভাষাত স্বকীয় উচ্চাৰণৰ সৈতে শব্দ নিৰ্মাণ কৰক। হিন্দী, জাপানি, স্পেনিশ, চীনা, আৰবি, কোৰীয়, আৰু আকৌ বহুতো।
API অভিগম
আমাৰ REST API ৰ সৈতে আপোনাৰ এপ্লিকেচনসমূহত AI শব্দ নিৰ্মাণ একত্ৰিত কৰক। সম্পূৰ্ণ মডেল আৰু শব্দ নিয়ন্ত্ৰণৰ সৈতে প্ৰগ্ৰামিকভাৱে শব্দ নিৰ্মাণ কৰক।
আমাৰ AI শব্দ মডেলসমূহ
দ্ৰুত আৰু বিনামূলীয়াৰ পৰা প্ৰিমিয়াম স্টুডিঅ'-গুণমান
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
সৰ্বোত্তম: সৰ্বোত্তম সামগ্ৰিক — অতি-দ্ৰুত, স্টুডিঅ' গুণমান, অধিকাংশ শব্দ সৃষ্টিৰ প্ৰয়োজনৰ বাবে আদর্শ
চেষ্টা কৰক Kokoro
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
সৰ্বোত্তম: Resemble AI ৰ পৰা অনুভূতি নিয়ন্ত্ৰণৰ সৈতে state-of-the-art শব্দ ক্লোনিং
চেষ্টা কৰক Chatterbox
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
সৰ্বোত্তম: স্ট্ৰিমিং, শূণ্য-শ্বট ক্লোনিং আৰু ৮টা ভাষাৰ সৈতে মানৱ-পৰিমাণৰ গুণমান
চেষ্টা কৰক CosyVoice 2
Orpheus
Standard
Human-level emotional TTS model trained on 100K hours of speech data.
সৰ্বোত্তম: ১০০K ঘণ্টাৰ কথাৰ তথ্যত প্ৰশিক্ষিত মানৱ স্তৰৰ আবেগিক অভিব্যক্তি
চেষ্টা কৰক Orpheus
StyleTTS 2
Premium
Human-level text-to-speech through style diffusion and adversarial training.
সৰ্বোত্তম: প্ৰিমিয়াম নাৰ্টিঙৰ বাবে শৈলী বিকিৰণৰ দ্বাৰা মানৱ-স্তরৰ গুণমান
চেষ্টা কৰক StyleTTS 2
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
সৰ্বোত্তম: শব্দৰ প্ৰভাৱ, হাসি আৰু ১৩+ ভাষাৰ সৈতে সৃষ্টিশীল অডিঅ'
চেষ্টা কৰক BarkAI Voice Generation কিদৰে কাম কৰে
সেকেণ্ডত টেক্সট ইনপুটৰ পৰা স্বাভাৱিক কথোপকথনলৈ
আপোনাৰ টেক্সট লিখক
আপুনি যি লিখনীক কথোপকথনে ৰূপান্তৰ কৰিব বিচাৰে তাক টাইপ কৰক অথবা পেইস্ট কৰক । প্ৰতিটো অনুৰোধত ৫০০ আখৰলৈকে সমৰ্থন কৰা হয় আৰু লং-টেক্সট বিভাজন উপলব্ধ ।
আৰ্হি আৰু শব্দ নিৰ্বাচন কৰক
20+ AI মডেল আৰু 100+ শব্দৰ পৰা বাছক। আপোনাৰ বিষয়বস্তু আৰু দর্শকৰ বাবে সঠিক মিল পোৱাৰ বাবে শব্দসমূহ পূৰ্বদৰ্শন কৰক।
কথোপকথন সৃষ্টি কৰক
ক্লিক কৰি ছেকেণ্ডত উচ্চমানৰ অডিঅ' সৃষ্টি আৰু গ্ৰহণ কৰক। Kokoro ৰ দৰে দ্ৰুত মডেলে ২ ছেকেণ্ডত ফলাফল প্ৰদান কৰে।
ডাউনল'ড কৰক অথবা একত্ৰিত কৰক
MP3 অথবা WAV ৰূপে অডিঅ' ডাউনল'ড কৰক, অথবা API ব্যৱহাৰ কৰি আপোনাৰ এপ্লিকেচন আৰু কাৰ্য্যক্ৰমত সরাসৰি শব্দ নিৰ্মাণ একত্ৰিত কৰক।
AI শব্দ উৎপাদন কাৰ্য্যক্ৰম
TTS.ai এ কিদৰে টেক্সটক প্ৰাকৃতিক-স্বৰযুক্ত কথোপকথনত পৰিবৰ্তন কৰে
আপোনাৰ লিখনী লিখক অথবা পেইস্ট কৰক
এটা একক বাক্যৰ পৰা এটা সম্পূৰ্ণ প্ৰবন্ধলৈ যিকোনো বস্তু সুমুৱাওক । AI এ বিৰাম-চিহ্ন, সংখ্যা, সংক্ষিপ্তকৰণ, আৰু SSML মাৰ্কআপও স্বাভাৱিকভাৱে পৰিচালনা কৰে । দীঘল টেক্সট স্বয়ংক্ৰিয়ভাৱে চুঙ্ক কৰা হয় আৰু নিখুঁতভাৱে একত্ৰিত কৰা হয় ।
- প্ৰবন্ধ, স্ক্ৰিপ্ট অথবা কিতাপ অধ্যায় পেইস্ট কৰক
- স্মাৰ্ট নম্বৰ আৰু সংক্ষিপ্তকৰণ ব্যৱস্থাপনা
- দীঘল টেক্সটৰ বাবে স্বয়ংক্ৰিয় বাক্য বিভাজন
- SSML স্থগিত আৰু গুৰুত্বৰ বাবে সমৰ্থন
আৰ্হি আৰু শব্দ নিৰ্বাচন কৰক
24+ মডেলসমূহৰ পৰা নিৰ্বাচন কৰক বিভিন্ন ব্যৱহাৰৰ ক্ষেত্ৰত অনুকূলিত - দ্ৰুত, উচ্চ-মানৰ আউটপুটৰ বাবে Kokoro, শব্দৰ প্ৰভাৱৰ সৈতে অভিব্যক্তিমূলক কথোপকথনৰ বাবে Bark, স্টুডিঅ' বৰ্ণনাৰ মানৰ বাবে Tortoise, অথবা টেক্সট-বিৱৰণ কৰা স্বনিৰ্বাচিত কথোপকথনৰ বাবে Parler। প্ৰত্যেক মডেলে একাধিক অভ্যন্তৰীণ কথোপকথন প্ৰদান কৰে।
- সৃষ্টি কৰাৰ পূৰ্বে শব্দসমূহ পূৰ্বদৰ্শন কৰক
- ভাষা, লিঙ্গ আৰু বিন্যাস অনুযায়ী ফিল্টাৰ কৰক
- ১০ ছেকেণ্ডৰ নমুনাৰ সৈতে আপোনাৰ নিজস্ব কন্ঠ ক্লোন কৰক
- টেক্সটত এটা শব্দ বৰ্ণনা কৰক (Parler TTS)
4x Tesla P40 ত AI প্ৰক্ৰিয়াকৰণ
আপোনাৰ টেক্সটক VRAM ৰ ৯৬GB ৰ সৈতে আমাৰ নিবেদিত GPU ক্লাস্টাৰত প্ৰক্ৰিয়া কৰা হয়। নিউৰাল নেটৱৰ্কে আপোনাৰ টেক্সটক পৰিপ্ৰেক্ষিত, প্ৰোসোডি, আৰু অনুভূতিৰ বাবে বিশ্লেষণ কৰে, তাৰ পিছত এটা উচ্চ-সত্যতা অডিঅ' ৱেবফৰ্ম উৎপন্ন কৰে। অধিকাংশ অনুৰোধসমূহ দৈৰ্ঘ্য আৰু মডেলৰ ওপৰত নিৰ্ভৰ কৰি ২-১০ ছেকেণ্ডত সম্পূৰ্ণ হয়।
- 4x NVIDIA Tesla P40 GPUs (96GB VRAM)
- পৰিশোধ কৰা ব্যৱহাৰকাৰীৰ বাবে অগ্ৰাধিকাৰ তালিকা
- দীঘল টেক্সটৰ বাবে Async প্ৰক্ৰিয়াকৰণ
- ২৪/৭ উপলব্ধতা
ডাউনল'ড কৰক আৰু ব্যৱহাৰ কৰক
আপোনাৰ ব্ৰাউছাৰত ফলাফলৰ লগে লগে শুনিব, তাৰ পিছত আপোনাৰ পছন্দৰ বিন্যাসত ডাউনল'ড কৰক। সকলো উত্পন্ন অডিঅ' বাণিজ্যিকভাৱে ব্যৱহাৰ কৰিবলৈ আপোনাৰ - TTS.ai ৰ প্ৰতিটো মডেলে উন্মুক্ত উৎসৰ লাইচেঞ্চ (MIT, Apache 2.0) ব্যৱহাৰ কৰে যাৰ দ্বাৰা বাণিজ্যিক ব্যৱহাৰৰ অনুমতি প্ৰদান কৰা হয়।
- WAV, MP3 অথবা FLAC ৰূপে ডাউনল'ড কৰক
- সকলো মডেলত বাণিজ্যিক ব্যৱহাৰ অনুমোদিত
- সাৰ্বজনীন লিঙ্কৰ দ্বাৰা অংশীদাৰী কৰক
- অভিগম উৎপাদন ইতিহাস
TTS.ai বনাম অন্য AI শব্দ উৎপাদকসমূহ
ElevenLabs, Play.ht, আৰু অন্যান্য সেৱাসমূহৰ সৈতে আমি কেনেদৰে তুলনা কৰোঁ
| বৈশিষ্ট্য | TTS.ai | ElevenLabs | Play.ht | Murf AI |
|---|---|---|---|---|
| AI মডেলসমূহ | মুক্ত উৎস | ১ স্বত্বাধিকাৰী | ২ স্বত্বাধিকাৰ | ১ স্বত্বাধিকাৰী |
| মুক্ত স্তৰ | কোনো নিবন্ধন নাই | ১০k আখৰ | সীমাবদ্ধ | ১০ মিনিট |
| ধ্বনি ক্লোনিং | ||||
| মুক্ত উৎস মডেলসমূহ | ||||
| স্ব-হোস্টযোগ্য | ||||
| আৰম্ভণিৰ মূল্য | $9/mo | $5/mo | $31/mo | $23/mo |
API ব্যৱহাৰ কৰি শব্দ নিৰ্মাণ কৰক
যিকোনো এপ্লিকেচনত AI শব্দ নিৰ্মাণ একত্ৰিত কৰক
import requests
# Generate with any of 24+ models
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Welcome to the future of AI voice generation.",
"model": "kokoro", # or bark, tortoise, styletts2, etc.
"voice": "af_heart",
"format": "mp3",
"speed": 1.0
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("generated_voice.mp3", "wb") as f:
f.write(response.content)
print(f"Audio generated: {len(response.content)} bytes")
প্ৰত্যেক স্কেলৰ বাবে পৰিকল্পনা
শখৰ পৰা উদ্যোগলৈ – বিনামূলীয়াকৈ আৰম্ভ কৰক, বিকাশৰ লগে লগে বৃদ্ধি কৰক।
মুক্ত স্তৰ
$0
৫০ ক্রেডিট
- ৪ মুক্ত মডেল
- মৌলিক ব্যৱহাৰৰ বাবে কোনো নিবন্ধন নাই
- বাণিজ্যিক ব্যৱহাৰ অনুমোদিত
আৰম্ভ কৰক
$9
৫০০ ক্রেডিট/মাহ
- সকলো 24+ আৰ্হি
- শব্দ ক্লোনিং
- API অভিগম
প্ৰো
$29
২০০০ ক্রেডিট/মাহ
- প্ৰিমিয়াম মডেল + অগ্ৰাধিকাৰ
- API অভিগম
- ব্যাচ নিৰ্মাণ
সদায় সোধা প্ৰশ্নসমূহ
AI শব্দ উৎপাদনৰ বিষয়ে সাধাৰণ প্ৰশ্নসমূহ
AI ধ্বনি আজি নিৰ্মাণ আৰম্ভ কৰক
24+ মডেল, 100+ ধ্বনি, ধ্বনি ক্লোনিং, আৰু এটা শক্তিশালী API। ইয়াক বিনামূলীয়াকৈ চেষ্টা কৰক - কোনো সাবস্ক্ৰাইব প্ৰয়োজন নহয়।