AI ভয়েস জেনারেটর - ২০+ মডেল, ১০০+ ভয়েস

অত্যাধুনিক AI ব্যবহার করে টেক্সট থেকে বাস্তব মানবভাষা তৈরি করুন। ২০+ নিউরাল TTS মডেল, ১০০+ পূর্বনির্ধারিত কণ্ঠস্বর এবং কণ্ঠস্বর ক্লোনিং থেকে বেছে নিন - সবই একই প্ল্যাটফর্ম থেকে। Kokoro এর সাথে দ্রুত খসড়া থেকে Tortoise TTS এর সাথে স্টুডিও-গুণমানের অডিও, যেকোন প্রকল্পের জন্য চমৎকার কণ্ঠস্বর খুঁজুন।

AI চালিত ২০+ মডেল ১০০+ শব্দ শব্দ ক্লোনিং ৩০+ ভাষা

সম্পূর্ণ TTS সম্পাদক API ডকুমেন্টেশন

এখন চেষ্টা করুন

0/500

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে

আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে

সম্পূর্ণ TTS সম্পাদক খোলো

AI শব্দ উৎপাদন বৈশিষ্ট্য

সৃষ্টিকর্তা, ডেভেলপার এবং ব্যবসার জন্য একটি সম্পূর্ণ শব্দ উৎপাদন প্ল্যাটফর্ম

২০+ AI মডেল

২০টিরও বেশি আলাদা AI ভয়েস মডেল ব্যবহার করুন, প্রত্যেকটিই অনন্য শক্তির সাথে। দ্রুত হালকা মডেল থেকে প্রাইম স্টুডিও-গুণমানের ইঞ্জিন পর্যন্ত।

১০০+ শব্দ

বিভিন্ন লিঙ্গ, বয়স, উচ্চারণ এবং ভাষার ১০০ এরও বেশি কণ্ঠের একটি বিচিত্র ক্যাটালগ ব্রাউজ করুন। যেকোন কণ্ঠ তৈরি করার আগে প্রাকদর্শন করুন।

শব্দ ক্লোনিং

৫-৩০ সেকেন্ডের অডিও নমুনা থেকে যেকোন শব্দ ক্লোন করুন। চরিত্র, ব্র্যান্ডিং, অথবা উপাদানগুলির জন্য স্বনির্বাচিত শব্দ তৈরি করুন যা মূলের মতোই শোনাবে।

আবেগ নিয়ন্ত্রণ

বিশেষ আবেগ সহ কথাবার্তা তৈরি করুন - খুশি, দুঃখিত, রেগে, উত্তেজিত, চুপচাপ। নিখুঁত, অভিব্যক্তিমূলক প্রদান করার জন্য ঘনত্ব নিয়ন্ত্রণ করুন।

৩০+ ভাষা

৩০টিরও বেশি ভাষায় স্বতন্ত্র উচ্চারণ সহ কথা তৈরি করুন। হিন্দি, জাপানি, স্প্যানিশ, চীনা, আরবি, কোরীয়, এবং আরও অনেক।

API ব্যবহার

আমাদের REST API এর সাথে আপনার অ্যাপ্লিকেশনে AI শব্দ উৎপাদন একীভূত করুন। পূর্ণ মডেল এবং শব্দ নিয়ন্ত্রণের সাথে প্রোগ্রামিং দ্বারা শব্দ উত্পাদন করুন।

আমাদের AI ভয়েস মডেল

দ্রুত এবং বিনামূল্যে থেকে প্রিমিয়াম স্টুডিও-গুণমান

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

স্থায়ী 5/5

সর্বোত্তম: সর্বোচ্চ — অতি দ্রুত, স্টুডিও গুণমান, অধিকাংশ শব্দ উৎপাদন প্রয়োজনের জন্য আদর্শ

চেষ্টা করো Kokoro

Chatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

মধ্যম 5/5 ভয়েস ক্লোন

সর্বোত্তম: Resemble AI থেকে আবেগ নিয়ন্ত্রণের সাথে state-of-the-art ভয়েস ক্লোনিং

চেষ্টা করো Chatterbox

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

মধ্যম 5/5 ভয়েস ক্লোন

সর্বোত্তম: স্ট্রিমিং, জিরো-শট ক্লোনিং এবং ৮টি ভাষার সাথে মানব-সমান গুণমান

চেষ্টা করো CosyVoice 2

Orpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

মধ্যম 5/5

সর্বোত্তম: ১০০K ঘণ্টার কথা বলার তথ্যের উপর মানব-স্তরের আবেগ প্রকাশ প্রশিক্ষণ

চেষ্টা করো Orpheus

StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

মধ্যম 5/5

সর্বোত্তম: প্রাইম নাটক করার জন্য স্টাইল ডিফ্যুশনের মাধ্যমে মানব-স্তরের গুণমান

চেষ্টা করো StyleTTS 2

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ধীর 4/5

সর্বোত্তম: শব্দ প্রভাব, হাসি এবং ১৩+ ভাষার সাথে সৃজনশীল অডিও

চেষ্টা করো Bark

কীভাবে কাজ করে AI ভয়েস জেনারেশন

সেকেন্ডের মধ্যে টেক্সট ইনপুট থেকে স্বাভাবিক বক্তৃতা

আপনার লেখা লিখুন

আপনি যে লেখাটিকে কথায় রূপান্তরিত করতে চান তা টাইপ অথবা সাঁটো । প্রতিটি অনুরোধের জন্য সর্বোচ্চ ৫০০ অক্ষর সমর্থিত এবং দীর্ঘ লেখা বিভক্ত করা সম্ভব ।

মডেল এবং শব্দ নির্বাচন করুন

২০+ AI মডেল এবং ১০০+ কণ্ঠ থেকে নির্বাচন করুন। আপনার বিষয়বস্তু এবং দর্শকদের জন্য উপযুক্ত কণ্ঠ খুঁজে বের করতে কণ্ঠের প্রাকদর্শন করুন।

বক্তৃতা তৈরি করো

ক্লিক করুন সেকেন্ডে উচ্চমানের অডিও তৈরি এবং গ্রহণ করুন। Kokoro এর মত দ্রুত মডেল ২ সেকেন্ডের মধ্যে ফলাফল প্রদান করে।

ডাউনলোড অথবা একীভূত করুন

MP3 অথবা WAV হিসাবে অডিও ডাউনলোড করুন, অথবা আপনার অ্যাপ্লিকেশন এবং কর্মপ্রবাহের মধ্যে সরাসরি শব্দ উৎপাদন একীভূত করতে API ব্যবহার করুন।

AI শব্দ উৎপাদন ওয়ার্কফ্লো

TTS.ai কিভাবে টেক্সটকে স্বাভাবিক শব্দের কথায় রূপান্তর করে

আপনার লেখা লিখুন অথবা সাঁটো

একটি একক বাক্য থেকে একটি সম্পূর্ণ বার্তা পর্যন্ত যেকোন কিছু লিখুন । AI বিরামচিহ্ন, সংখ্যা, সংক্ষিপ্তকরণ এবং এমনকি SSML মার্কআপ স্বাভাবিকভাবেই পরিচালনা করে । দীর্ঘ টেক্সট স্বয়ংক্রিয়ভাবে টুকরো টুকরো করা হয় এবং একে অপরের সাথে একত্রিত করা হয় ।

বার্তা, স্ক্রিপ্ট অথবা বইয়ের অধ্যায় সাঁটো
স্মার্ট নম্বর এবং সংক্ষিপ্তকরণ ব্যবস্থাপনা
দীর্ঘ টেক্সটের জন্য স্বয়ংক্রিয়ভাবে বাক্য বিভাজন
SSML বিরতি এবং গুরুত্বের জন্য সমর্থন

মডেল এবং শব্দ বেছে নিন

২০+ মডেল থেকে বিভিন্ন ব্যবহারের ক্ষেত্রে অনুকূলিত মডেল বেছে নিন - দ্রুত, উচ্চমানের আউটপুট জন্য Kokoro, শব্দের প্রভাব সহ অভিব্যক্তিমূলক কথা বলার জন্য Bark, স্টুডিও বর্ণনা গুণমানের জন্য Tortoise, অথবা টেক্সট-বর্ণিত স্বনির্ধারিত কন্ঠের জন্য Parler। প্রত্যেক মডেল একাধিক অভ্যন্তরীণ কন্ঠ প্রদান করে।

তৈরি করার পূর্বে শব্দের প্রাকদর্শন
ভাষা, লিঙ্গ এবং শৈলী অনুসারে পরিশোধক
১০ সেকেন্ডের নমুনার সাথে আপনার নিজের কণ্ঠ ক্লোন করুন
টেক্সটে একটি শব্দ বর্ণনা করুন (Parler TTS)

4x টেসলা P40 এ AI প্রসেসিং

আপনার লেখা প্রসেস করা হয় আমাদের বিশেষ GPU ক্লাস্টারে ৯৬GB VRAM এর সাথে। নিউরাল নেটওয়ার্ক আপনার লেখার প্রসঙ্গ, প্রসডি এবং আবেগ বিশ্লেষণ করে, তারপর একটি উচ্চ-সত্য অডিও তরঙ্গ আকৃতি তৈরি করে। বেশিরভাগ অনুরোধ ২-১০ সেকেন্ডের মধ্যে সম্পন্ন হয়, দৈর্ঘ্য এবং মডেলের উপর নির্ভর করে।

৪x এনভিডিএ টেসলা পি৪০ জিপিইউ (৯৬ জিবি ভি- রম)
প্রিমিয়াম ব্যবহারকারীদের জন্য অগ্রাধিকার লাইন
দীর্ঘ টেক্সটের জন্য অসঙ্গত প্রসেসিং
২৪/৭ উপলব্ধতা

ডাউনলোড & ব্যবহার করো

আপনার ব্রাউজার থেকে ফলাফলটি শুনুন, তারপর আপনার পছন্দের ফরম্যাটে ডাউনলোড করুন। সব অডিও বাণিজ্যিকভাবে ব্যবহারের জন্য আপনার জন্য তৈরি করা হয়েছে - TTS.ai এর প্রতিটি মডেল উন্মুক্ত-সোর্স লাইসেন্স (MIT, Apache 2.0) ব্যবহার করে যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়।

WAV, MP3 অথবা FLAC হিসাবে ডাউনলোড করুন
সব মডেলে বাণিজ্যিক ব্যবহার অনুমোদিত
পাবলিক লিঙ্কের মাধ্যমে শেয়ার করুন
প্রবেশাধিকার উৎপাদন ইতিহাস

AI শব্দ তৈরি করুন

TTS.ai অন্যান্য AI ভয়েস জেনারেটরের তুলনায়

ইলেভেনল্যাবস, প্লে. এইচটি এবং অন্যান্য পরিষেবার সাথে আমাদের তুলনা কিভাবে করা যায়

বৈশিষ্ট্য	TTS.ai	ElevenLabs	Play.ht	Murf AI
AI মডেল	২০+ উন্মুক্ত উৎস	১ স্বত্বাধিকারী	২ নিজস্ব	১ স্বাধীন
মুক্ত স্তর	কোন নিবন্ধন নেই	১০ হাজার অক্ষর	সীমাবদ্ধ	১০ মিনিট
শব্দ ক্লোনিং
ওপেন সোর্স মডেল
স্বয়ংক্রিয়
প্রারম্ভিক মূল্য	$9/mo	$5/mo	$31/mo	$23/mo

TTS.ai বিনামূল্যে চেষ্টা করুন

API ব্যবহার করে শব্দ তৈরি করুন

যেকোন অ্যাপ্লিকেশনে AI শব্দ উৎপাদন একীভূত করুন

পাইথন - AI শব্দ উৎপাদন REST API

import requests

# Generate with any of 20+ models
response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Welcome to the future of AI voice generation.",
    "model": "kokoro",        # or bark, tortoise, styletts2, etc.
    "voice": "af_heart",
    "format": "mp3",
    "speed": 1.0
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("generated_voice.mp3", "wb") as f:
    f.write(response.content)

print(f"Audio generated: {len(response.content)} bytes")

API নথিপত্র প্রদর্শন

প্রত্যেক স্তরের জন্য পরিকল্পনা

শখের কাজ থেকে শুরু করে ব্যবসায়িক প্রতিষ্ঠান পর্যন্ত - বিনামূল্যে শুরু করুন, আপনার বৃদ্ধির সাথে সাথে পরিমাপ করুন।

মুক্ত স্তর

সাইন আপ করার জন্য ১৫ ক্রেডিট

৪টি বিনামূল্যে মডেল
মৌলিক ব্যবহারের জন্য কোন নিবন্ধন নেই
বাণিজ্যিক ব্যবহার অনুমোদিত

আরম্ভকারী

৫০০,০০০ অক্ষর/মাস

সব ২০+ মডেল
শব্দের ক্লোন
API ব্যবহার

প্রফেসর

$29

২০০০ ক্রেডিট/মাস

প্রাইম মডেল + অগ্রাধিকার
API প্রবেশাধিকার
ব্যাচ উৎপাদন

সম্পূর্ণ মূল্য দেখুন

প্রায়শ জিজ্ঞাসিত প্রশ্ন

AI শব্দ উৎপাদন সম্পর্কে সাধারণ প্রশ্ন

কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে একটি AI ভয়েস জেনারেটর লিখিত টেক্সটকে প্রাকৃতিক শব্দের কথা বলা অডিওতে রূপান্তর করে। পুরনো রোবটিক TTS সিস্টেমের বিপরীতে, আধুনিক AI ভয়েস জেনারেটর মানুষের কথার উপর প্রশিক্ষিত গভীর নিউরাল নেটওয়ার্ক ব্যবহার করে এমন শব্দ তৈরি করে যা অসাধারণভাবে বাস্তবসম্মত শোনায়।

কোকোরো, অরফেয়াস এবং স্টাইলটিটিএস ২ এর মতো শীর্ষ মডেলগুলো অন্ধ শ্রবণ পরীক্ষায় মানুষের রেকর্ডকৃত কথা থেকে প্রায় আলাদা করে না দেখানোর মত কথা তৈরি করে।

হ্যাঁ। আপনার কণ্ঠের ৫-৩০ সেকেন্ডের অডিও নমুনা আপলোড করুন, এবং Chatterbox বা GPT-SoVITS এর মত মডেল একটি ক্লোন কণ্ঠ তৈরি করবে যা আপনার টাইমব্রে, উচ্চারণ এবং কথা বলার ধরন ধরে রাখবে। এরপর আপনি যেকোনো টেক্সট থেকে আপনার কণ্ঠে অসীমিত বক্তৃতা তৈরি করতে পারবেন।

হ্যাঁ, চারটি মডেল (কোকোরো, পাইপার, ভিটিএস, মেলোটিটিএস) সম্পূর্ণ বিনামূল্যে, কোন ব্যবহারের সীমা বা নিবন্ধনের প্রয়োজন নেই। উচ্চমানের বৈশিষ্ট্য যেমন ভয়েস ক্লোনিং এবং আবেগ নিয়ন্ত্রণের জন্য প্রিমিয়াম মডেলের জন্য ক্রেডিট প্রয়োজন, ৫০০ ক্রেডিটের জন্য ৫ ডলার থেকে শুরু।

আমাদের মডেলগুলো একত্রে ৩০+ ভাষা সমর্থন করে, যার মধ্যে রয়েছে ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, চীনা, জাপানি, কোরীয়, হিন্দি, আরবি, পর্তুগিজ, রুশ, ইতালীয়, আর আরো অনেক ভাষা।

হ্যাঁ। আমাদের সকল মডেল ব্যবহার করে অনুমতিমূলক উন্মুক্ত উৎস লাইসেন্স (এমআইটি, অ্যাপাচি ২. ০) যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। আপনি ইউটিউব ভিডিও, পডকাস্ট, অ্যাপ্লিকেশন, খেলা, বিজ্ঞাপন এবং পণ্যগুলিতে লাইসেন্স ফি ছাড়াই তৈরি অডিও ব্যবহার করতে পারেন।

মডেলের উপর নির্ভর করে গতি পরিবর্তিত হয়। কোকোরো বাস্তব সময়ের চেয়ে প্রায় ১০০ গুণ দ্রুত অডিও উৎপাদন করে - ১০ সেকেন্ডের একটি ক্লিপ তৈরি করতে প্রায় ০.১ সেকেন্ড সময় লাগে। এমনকি ধীর গতির প্রাইম মডেলগুলো সাধারণত ৫-১৫ সেকেন্ডের মধ্যে প্রমিত দৈর্ঘ্যের টেক্সটের জন্য ফলাফল প্রদান করে।

মডেলগুলোর স্থাপত্য, গতি, গুণমান, বৈশিষ্ট্য এবং ভাষা সমর্থন ভিন্ন। কিছু কিছুতে গতি অগ্রাধিকারপ্রাপ্ত (Kokoro, Piper), অন্যরা সর্বোচ্চ গুণমান (StyleTTS2, Tortoise), এবং অন্যরা অনন্য বৈশিষ্ট্য যেমন ভয়েস ক্লোনিং (Chatterbox), আবেগ নিয়ন্ত্রণ (Orpheus), বা ডায়ালগ উৎপাদন (Dia) প্রদান করে।

হ্যাঁ । Orpheus, Chatterbox এবং Bark-এর মত মডেলগুলি আবেগপূর্ণ কথা বলার উৎপাদন সমর্থন করে । আপনি একই টেক্সটটি আনন্দিত, দুঃখিত, রেগে, উত্তেজিত বা চুপচাপ প্রদান করে তৈরি করতে পারেন । কিছু মডেল আবেগপূর্ণ অভিব্যক্তির উপর সুনির্দিষ্ট ঘনত্ব নিয়ন্ত্রণের অনুমতি দেয় ।

TTS.ai ব্যবহার করার সময় নয় — আমাদের GPU সার্ভার সব প্রসেসিং ব্যবস্থাপনা করে। যদি স্ব-হোস্টিং হয়, কিছু মডেল (Piper) সিপিইউ-তে চলতে পারে, অন্যদের জন্য ২-৮GB VRAM সহ এনভিডিআইএ GPU প্রয়োজন। আমাদের প্ল্যাটফর্ম আপনার নিজের হার্ডওয়্যারের প্রয়োজনীয়তা দূর করে দেয়।

আমাদের REST API ব্যবহার করুন। আপনার লেখা, নির্বাচিত মডেল এবং শব্দ সহ একটি POST অনুরোধ পাঠান। API WAV অথবা MP3 ফরম্যাটে অডিও ফিরিয়ে দেয়। আমরা পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এ কোডের উদাহরণ প্রদান করি। আপনার ড্যাশবোর্ড থেকে API কী মুক্তভাবে তৈরি করা যায়।

মডেল ২২-৪৮kHz সাম্পল রেট অডিও উত্‍পাদন করে। আউটপুট ফরম্যাটের মধ্যে রয়েছে WAV (অসংকুচিত, সর্বোচ্চ গুণমান), MP3 (সংকুচিত, ছোট ফাইল), এবং OGG। WAV পেশাদার ব্যবহারের জন্য সুপারিশ করা হয়, কিন্তু MP3 ওয়েব এবং মোবাইল অ্যাপ্লিকেশনের জন্য ভাল কাজ করে।

5.0/5 (1)

আজই AI শব্দ তৈরি শুরু করুন

২০+ মডেল, ১০০+ কণ্ঠ, কণ্ঠ ক্লোনিং, এবং একটি শক্তিশালী API। এটি বিনামূল্যে চেষ্টা করুন - কোন নিবন্ধন প্রয়োজন নেই।

নিবন্ধন করুন মূল্য প্রদর্শন

AI ভয়েস জেনারেটর - ২০+ মডেল, ১০০+ ভয়েস

এখন চেষ্টা করুন

TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

AI শব্দ উৎপাদন বৈশিষ্ট্য

২০+ AI মডেল

১০০+ শব্দ

শব্দ ক্লোনিং

আবেগ নিয়ন্ত্রণ

৩০+ ভাষা

API ব্যবহার

আমাদের AI ভয়েস মডেল

Kokoro

Chatterbox

CosyVoice 2

Orpheus

StyleTTS 2

Bark

কীভাবে কাজ করে AI ভয়েস জেনারেশন

আপনার লেখা লিখুন

মডেল এবং শব্দ নির্বাচন করুন

বক্তৃতা তৈরি করো

ডাউনলোড অথবা একীভূত করুন

AI শব্দ উৎপাদন ওয়ার্কফ্লো

আপনার লেখা লিখুন অথবা সাঁটো

মডেল এবং শব্দ বেছে নিন

4x টেসলা P40 এ AI প্রসেসিং

ডাউনলোড & ব্যবহার করো

TTS.ai অন্যান্য AI ভয়েস জেনারেটরের তুলনায়

API ব্যবহার করে শব্দ তৈরি করুন

প্রত্যেক স্তরের জন্য পরিকল্পনা

মুক্ত স্তর

আরম্ভকারী

প্রফেসর

প্রায়শ জিজ্ঞাসিত প্রশ্ন

এআই ভয়েস জেনারেটর কি?

কৃত্রিম বুদ্ধিমত্তার মাধ্যমে তৈরি কণ্ঠস্বর কতটা বাস্তবসম্মত?

আমি কি আমার নিজের কণ্ঠকে কৃত্রিম বুদ্ধিমত্তার সাহায্যে ক্লোন করতে পারি?

এআই শব্দ উৎপাদন কি বিনামূল্যে?

কোন ভাষা সমর্থিত?

আমি কি বাণিজ্যিক উদ্দেশ্যে এআই কণ্ঠ ব্যবহার করতে পারি?

এআই কণ্ঠ উৎপাদন কত দ্রুত?

টিটিএস মডেলের মধ্যে পার্থক্য কি?

এআই কি বিভিন্ন অনুভূতির সাথে কণ্ঠ তৈরি করতে পারে?

AI শব্দ তৈরি করতে কি আমার GPU প্রয়োজন?

আমি কিভাবে আমার অ্যাপস-এ AI শব্দ উৎপাদন একীভূত করব?

অডিও ধারণ করার জন্য কোন ধরনের ফরম্যাট এবং গুণমানের অডিও উপলব্ধ?

আজই AI শব্দ তৈরি শুরু করুন