AI ভয়েস জেনারেটর - ২০+ মডেল, ১০০+ ভয়েস
অত্যাধুনিক AI ব্যবহার করে টেক্সট থেকে বাস্তব মানবভাষা তৈরি করুন। ২০+ নিউরাল TTS মডেল, ১০০+ পূর্বনির্ধারিত কণ্ঠস্বর এবং কণ্ঠস্বর ক্লোনিং থেকে বেছে নিন - সবই একই প্ল্যাটফর্ম থেকে। Kokoro এর সাথে দ্রুত খসড়া থেকে Tortoise TTS এর সাথে স্টুডিও-গুণমানের অডিও, যেকোন প্রকল্পের জন্য চমৎকার কণ্ঠস্বর খুঁজুন।
এখন চেষ্টা করুন
AI শব্দ উৎপাদন বৈশিষ্ট্য
সৃষ্টিকর্তা, ডেভেলপার এবং ব্যবসার জন্য একটি সম্পূর্ণ শব্দ উৎপাদন প্ল্যাটফর্ম
২০+ AI মডেল
২০টিরও বেশি আলাদা AI ভয়েস মডেল ব্যবহার করুন, প্রত্যেকটিই অনন্য শক্তির সাথে। দ্রুত হালকা মডেল থেকে প্রাইম স্টুডিও-গুণমানের ইঞ্জিন পর্যন্ত।
১০০+ শব্দ
বিভিন্ন লিঙ্গ, বয়স, উচ্চারণ এবং ভাষার ১০০ এরও বেশি কণ্ঠের একটি বিচিত্র ক্যাটালগ ব্রাউজ করুন। যেকোন কণ্ঠ তৈরি করার আগে প্রাকদর্শন করুন।
শব্দ ক্লোনিং
৫-৩০ সেকেন্ডের অডিও নমুনা থেকে যেকোন শব্দ ক্লোন করুন। চরিত্র, ব্র্যান্ডিং, অথবা উপাদানগুলির জন্য স্বনির্বাচিত শব্দ তৈরি করুন যা মূলের মতোই শোনাবে।
আবেগ নিয়ন্ত্রণ
বিশেষ আবেগ সহ কথাবার্তা তৈরি করুন - খুশি, দুঃখিত, রেগে, উত্তেজিত, চুপচাপ। নিখুঁত, অভিব্যক্তিমূলক প্রদান করার জন্য ঘনত্ব নিয়ন্ত্রণ করুন।
৩০+ ভাষা
৩০টিরও বেশি ভাষায় স্বতন্ত্র উচ্চারণ সহ কথা তৈরি করুন। হিন্দি, জাপানি, স্প্যানিশ, চীনা, আরবি, কোরীয়, এবং আরও অনেক।
API ব্যবহার
আমাদের REST API এর সাথে আপনার অ্যাপ্লিকেশনে AI শব্দ উৎপাদন একীভূত করুন। পূর্ণ মডেল এবং শব্দ নিয়ন্ত্রণের সাথে প্রোগ্রামিং দ্বারা শব্দ উত্পাদন করুন।
আমাদের AI ভয়েস মডেল
দ্রুত এবং বিনামূল্যে থেকে প্রিমিয়াম স্টুডিও-গুণমান
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
সর্বোত্তম: সর্বোচ্চ — অতি দ্রুত, স্টুডিও গুণমান, অধিকাংশ শব্দ উৎপাদন প্রয়োজনের জন্য আদর্শ
চেষ্টা করো Kokoro
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
সর্বোত্তম: Resemble AI থেকে আবেগ নিয়ন্ত্রণের সাথে state-of-the-art ভয়েস ক্লোনিং
চেষ্টা করো Chatterbox
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
সর্বোত্তম: স্ট্রিমিং, জিরো-শট ক্লোনিং এবং ৮টি ভাষার সাথে মানব-সমান গুণমান
চেষ্টা করো CosyVoice 2
Orpheus
Standard
Human-level emotional TTS model trained on 100K hours of speech data.
সর্বোত্তম: ১০০K ঘণ্টার কথা বলার তথ্যের উপর মানব-স্তরের আবেগ প্রকাশ প্রশিক্ষণ
চেষ্টা করো Orpheus
StyleTTS 2
Premium
Human-level text-to-speech through style diffusion and adversarial training.
সর্বোত্তম: প্রাইম নাটক করার জন্য স্টাইল ডিফ্যুশনের মাধ্যমে মানব-স্তরের গুণমান
চেষ্টা করো StyleTTS 2
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
সর্বোত্তম: শব্দ প্রভাব, হাসি এবং ১৩+ ভাষার সাথে সৃজনশীল অডিও
চেষ্টা করো Barkকীভাবে কাজ করে AI ভয়েস জেনারেশন
সেকেন্ডের মধ্যে টেক্সট ইনপুট থেকে স্বাভাবিক বক্তৃতা
আপনার লেখা লিখুন
আপনি যে লেখাটিকে কথায় রূপান্তরিত করতে চান তা টাইপ অথবা সাঁটো । প্রতিটি অনুরোধের জন্য সর্বোচ্চ ৫০০ অক্ষর সমর্থিত এবং দীর্ঘ লেখা বিভক্ত করা সম্ভব ।
মডেল এবং শব্দ নির্বাচন করুন
২০+ AI মডেল এবং ১০০+ কণ্ঠ থেকে নির্বাচন করুন। আপনার বিষয়বস্তু এবং দর্শকদের জন্য উপযুক্ত কণ্ঠ খুঁজে বের করতে কণ্ঠের প্রাকদর্শন করুন।
বক্তৃতা তৈরি করো
ক্লিক করুন সেকেন্ডে উচ্চমানের অডিও তৈরি এবং গ্রহণ করুন। Kokoro এর মত দ্রুত মডেল ২ সেকেন্ডের মধ্যে ফলাফল প্রদান করে।
ডাউনলোড অথবা একীভূত করুন
MP3 অথবা WAV হিসাবে অডিও ডাউনলোড করুন, অথবা আপনার অ্যাপ্লিকেশন এবং কর্মপ্রবাহের মধ্যে সরাসরি শব্দ উৎপাদন একীভূত করতে API ব্যবহার করুন।
AI শব্দ উৎপাদন ওয়ার্কফ্লো
TTS.ai কিভাবে টেক্সটকে স্বাভাবিক শব্দের কথায় রূপান্তর করে
আপনার লেখা লিখুন অথবা সাঁটো
একটি একক বাক্য থেকে একটি সম্পূর্ণ বার্তা পর্যন্ত যেকোন কিছু লিখুন । AI বিরামচিহ্ন, সংখ্যা, সংক্ষিপ্তকরণ এবং এমনকি SSML মার্কআপ স্বাভাবিকভাবেই পরিচালনা করে । দীর্ঘ টেক্সট স্বয়ংক্রিয়ভাবে টুকরো টুকরো করা হয় এবং একে অপরের সাথে একত্রিত করা হয় ।
- বার্তা, স্ক্রিপ্ট অথবা বইয়ের অধ্যায় সাঁটো
- স্মার্ট নম্বর এবং সংক্ষিপ্তকরণ ব্যবস্থাপনা
- দীর্ঘ টেক্সটের জন্য স্বয়ংক্রিয়ভাবে বাক্য বিভাজন
- SSML বিরতি এবং গুরুত্বের জন্য সমর্থন
মডেল এবং শব্দ বেছে নিন
২০+ মডেল থেকে বিভিন্ন ব্যবহারের ক্ষেত্রে অনুকূলিত মডেল বেছে নিন - দ্রুত, উচ্চমানের আউটপুট জন্য Kokoro, শব্দের প্রভাব সহ অভিব্যক্তিমূলক কথা বলার জন্য Bark, স্টুডিও বর্ণনা গুণমানের জন্য Tortoise, অথবা টেক্সট-বর্ণিত স্বনির্ধারিত কন্ঠের জন্য Parler। প্রত্যেক মডেল একাধিক অভ্যন্তরীণ কন্ঠ প্রদান করে।
- তৈরি করার পূর্বে শব্দের প্রাকদর্শন
- ভাষা, লিঙ্গ এবং শৈলী অনুসারে পরিশোধক
- ১০ সেকেন্ডের নমুনার সাথে আপনার নিজের কণ্ঠ ক্লোন করুন
- টেক্সটে একটি শব্দ বর্ণনা করুন (Parler TTS)
4x টেসলা P40 এ AI প্রসেসিং
আপনার লেখা প্রসেস করা হয় আমাদের বিশেষ GPU ক্লাস্টারে ৯৬GB VRAM এর সাথে। নিউরাল নেটওয়ার্ক আপনার লেখার প্রসঙ্গ, প্রসডি এবং আবেগ বিশ্লেষণ করে, তারপর একটি উচ্চ-সত্য অডিও তরঙ্গ আকৃতি তৈরি করে। বেশিরভাগ অনুরোধ ২-১০ সেকেন্ডের মধ্যে সম্পন্ন হয়, দৈর্ঘ্য এবং মডেলের উপর নির্ভর করে।
- ৪x এনভিডিএ টেসলা পি৪০ জিপিইউ (৯৬ জিবি ভি- রম)
- প্রিমিয়াম ব্যবহারকারীদের জন্য অগ্রাধিকার লাইন
- দীর্ঘ টেক্সটের জন্য অসঙ্গত প্রসেসিং
- ২৪/৭ উপলব্ধতা
ডাউনলোড & ব্যবহার করো
আপনার ব্রাউজার থেকে ফলাফলটি শুনুন, তারপর আপনার পছন্দের ফরম্যাটে ডাউনলোড করুন। সব অডিও বাণিজ্যিকভাবে ব্যবহারের জন্য আপনার জন্য তৈরি করা হয়েছে - TTS.ai এর প্রতিটি মডেল উন্মুক্ত-সোর্স লাইসেন্স (MIT, Apache 2.0) ব্যবহার করে যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়।
- WAV, MP3 অথবা FLAC হিসাবে ডাউনলোড করুন
- সব মডেলে বাণিজ্যিক ব্যবহার অনুমোদিত
- পাবলিক লিঙ্কের মাধ্যমে শেয়ার করুন
- প্রবেশাধিকার উৎপাদন ইতিহাস
TTS.ai অন্যান্য AI ভয়েস জেনারেটরের তুলনায়
ইলেভেনল্যাবস, প্লে. এইচটি এবং অন্যান্য পরিষেবার সাথে আমাদের তুলনা কিভাবে করা যায়
| বৈশিষ্ট্য | TTS.ai | ElevenLabs | Play.ht | Murf AI |
|---|---|---|---|---|
| AI মডেল | ২০+ উন্মুক্ত উৎস | ১ স্বত্বাধিকারী | ২ নিজস্ব | ১ স্বাধীন |
| মুক্ত স্তর | কোন নিবন্ধন নেই | ১০ হাজার অক্ষর | সীমাবদ্ধ | ১০ মিনিট |
| শব্দ ক্লোনিং | ||||
| ওপেন সোর্স মডেল | ||||
| স্বয়ংক্রিয় | ||||
| প্রারম্ভিক মূল্য | $9/mo | $5/mo | $31/mo | $23/mo |
API ব্যবহার করে শব্দ তৈরি করুন
যেকোন অ্যাপ্লিকেশনে AI শব্দ উৎপাদন একীভূত করুন
import requests
# Generate with any of 20+ models
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Welcome to the future of AI voice generation.",
"model": "kokoro", # or bark, tortoise, styletts2, etc.
"voice": "af_heart",
"format": "mp3",
"speed": 1.0
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("generated_voice.mp3", "wb") as f:
f.write(response.content)
print(f"Audio generated: {len(response.content)} bytes")
প্রত্যেক স্তরের জন্য পরিকল্পনা
শখের কাজ থেকে শুরু করে ব্যবসায়িক প্রতিষ্ঠান পর্যন্ত - বিনামূল্যে শুরু করুন, আপনার বৃদ্ধির সাথে সাথে পরিমাপ করুন।
মুক্ত স্তর
$0
সাইন আপ করার জন্য ১৫ ক্রেডিট
- ৪টি বিনামূল্যে মডেল
- মৌলিক ব্যবহারের জন্য কোন নিবন্ধন নেই
- বাণিজ্যিক ব্যবহার অনুমোদিত
আরম্ভকারী
$9
৫০০,০০০ অক্ষর/মাস
- সব ২০+ মডেল
- শব্দের ক্লোন
- API ব্যবহার
প্রফেসর
$29
২০০০ ক্রেডিট/মাস
- প্রাইম মডেল + অগ্রাধিকার
- API প্রবেশাধিকার
- ব্যাচ উৎপাদন
প্রায়শ জিজ্ঞাসিত প্রশ্ন
AI শব্দ উৎপাদন সম্পর্কে সাধারণ প্রশ্ন
আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।
আজই AI শব্দ তৈরি শুরু করুন
২০+ মডেল, ১০০+ কণ্ঠ, কণ্ঠ ক্লোনিং, এবং একটি শক্তিশালী API। এটি বিনামূল্যে চেষ্টা করুন - কোন নিবন্ধন প্রয়োজন নেই।