AI ভয়েস জেনারেটর - ২০+ মডেল, ১০০+ ভয়েস

অত্যাধুনিক AI ব্যবহার করে টেক্সট থেকে বাস্তব মানবভাষা তৈরি করুন। ২০+ নিউরাল TTS মডেল, ১০০+ পূর্বনির্ধারিত কণ্ঠস্বর এবং কণ্ঠস্বর ক্লোনিং থেকে বেছে নিন - সবই একই প্ল্যাটফর্ম থেকে। Kokoro এর সাথে দ্রুত খসড়া থেকে Tortoise TTS এর সাথে স্টুডিও-গুণমানের অডিও, যেকোন প্রকল্পের জন্য চমৎকার কণ্ঠস্বর খুঁজুন।

AI চালিত ২০+ মডেল ১০০+ শব্দ শব্দ ক্লোনিং ৩০+ ভাষা

এখন চেষ্টা করুন

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে
আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে
তৈরি করা হয়েছে
ডাউনলোড
TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

AI শব্দ উৎপাদন বৈশিষ্ট্য

সৃষ্টিকর্তা, ডেভেলপার এবং ব্যবসার জন্য একটি সম্পূর্ণ শব্দ উৎপাদন প্ল্যাটফর্ম

২০+ AI মডেল

২০টিরও বেশি আলাদা AI ভয়েস মডেল ব্যবহার করুন, প্রত্যেকটিই অনন্য শক্তির সাথে। দ্রুত হালকা মডেল থেকে প্রাইম স্টুডিও-গুণমানের ইঞ্জিন পর্যন্ত।

১০০+ শব্দ

বিভিন্ন লিঙ্গ, বয়স, উচ্চারণ এবং ভাষার ১০০ এরও বেশি কণ্ঠের একটি বিচিত্র ক্যাটালগ ব্রাউজ করুন। যেকোন কণ্ঠ তৈরি করার আগে প্রাকদর্শন করুন।

শব্দ ক্লোনিং

৫-৩০ সেকেন্ডের অডিও নমুনা থেকে যেকোন শব্দ ক্লোন করুন। চরিত্র, ব্র্যান্ডিং, অথবা উপাদানগুলির জন্য স্বনির্বাচিত শব্দ তৈরি করুন যা মূলের মতোই শোনাবে।

আবেগ নিয়ন্ত্রণ

বিশেষ আবেগ সহ কথাবার্তা তৈরি করুন - খুশি, দুঃখিত, রেগে, উত্তেজিত, চুপচাপ। নিখুঁত, অভিব্যক্তিমূলক প্রদান করার জন্য ঘনত্ব নিয়ন্ত্রণ করুন।

৩০+ ভাষা

৩০টিরও বেশি ভাষায় স্বতন্ত্র উচ্চারণ সহ কথা তৈরি করুন। হিন্দি, জাপানি, স্প্যানিশ, চীনা, আরবি, কোরীয়, এবং আরও অনেক।

API ব্যবহার

আমাদের REST API এর সাথে আপনার অ্যাপ্লিকেশনে AI শব্দ উৎপাদন একীভূত করুন। পূর্ণ মডেল এবং শব্দ নিয়ন্ত্রণের সাথে প্রোগ্রামিং দ্বারা শব্দ উত্পাদন করুন।

আমাদের AI ভয়েস মডেল

দ্রুত এবং বিনামূল্যে থেকে প্রিমিয়াম স্টুডিও-গুণমান

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

সর্বোত্তম: সর্বোচ্চ — অতি দ্রুত, স্টুডিও গুণমান, অধিকাংশ শব্দ উৎপাদন প্রয়োজনের জন্য আদর্শ

চেষ্টা করো Kokoro

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 ভয়েস ক্লোন

সর্বোত্তম: Resemble AI থেকে আবেগ নিয়ন্ত্রণের সাথে state-of-the-art ভয়েস ক্লোনিং

চেষ্টা করো Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ভয়েস ক্লোন

সর্বোত্তম: স্ট্রিমিং, জিরো-শট ক্লোনিং এবং ৮টি ভাষার সাথে মানব-সমান গুণমান

চেষ্টা করো CosyVoice 2

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

সর্বোত্তম: ১০০K ঘণ্টার কথা বলার তথ্যের উপর মানব-স্তরের আবেগ প্রকাশ প্রশিক্ষণ

চেষ্টা করো Orpheus

StyleTTS 2StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

Medium 5/5

সর্বোত্তম: প্রাইম নাটক করার জন্য স্টাইল ডিফ্যুশনের মাধ্যমে মানব-স্তরের গুণমান

চেষ্টা করো StyleTTS 2

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সর্বোত্তম: শব্দ প্রভাব, হাসি এবং ১৩+ ভাষার সাথে সৃজনশীল অডিও

চেষ্টা করো Bark

কীভাবে কাজ করে AI ভয়েস জেনারেশন

সেকেন্ডের মধ্যে টেক্সট ইনপুট থেকে স্বাভাবিক বক্তৃতা

1

আপনার লেখা লিখুন

আপনি যে লেখাটিকে কথায় রূপান্তরিত করতে চান তা টাইপ অথবা সাঁটো । প্রতিটি অনুরোধের জন্য সর্বোচ্চ ৫০০ অক্ষর সমর্থিত এবং দীর্ঘ লেখা বিভক্ত করা সম্ভব ।

2

মডেল এবং শব্দ নির্বাচন করুন

২০+ AI মডেল এবং ১০০+ কণ্ঠ থেকে নির্বাচন করুন। আপনার বিষয়বস্তু এবং দর্শকদের জন্য উপযুক্ত কণ্ঠ খুঁজে বের করতে কণ্ঠের প্রাকদর্শন করুন।

3

বক্তৃতা তৈরি করো

ক্লিক করুন সেকেন্ডে উচ্চমানের অডিও তৈরি এবং গ্রহণ করুন। Kokoro এর মত দ্রুত মডেল ২ সেকেন্ডের মধ্যে ফলাফল প্রদান করে।

4

ডাউনলোড অথবা একীভূত করুন

MP3 অথবা WAV হিসাবে অডিও ডাউনলোড করুন, অথবা আপনার অ্যাপ্লিকেশন এবং কর্মপ্রবাহের মধ্যে সরাসরি শব্দ উৎপাদন একীভূত করতে API ব্যবহার করুন।

AI শব্দ উৎপাদন ওয়ার্কফ্লো

TTS.ai কিভাবে টেক্সটকে স্বাভাবিক শব্দের কথায় রূপান্তর করে

আপনার লেখা লিখুন অথবা সাঁটো

একটি একক বাক্য থেকে একটি সম্পূর্ণ বার্তা পর্যন্ত যেকোন কিছু লিখুন । AI বিরামচিহ্ন, সংখ্যা, সংক্ষিপ্তকরণ এবং এমনকি SSML মার্কআপ স্বাভাবিকভাবেই পরিচালনা করে । দীর্ঘ টেক্সট স্বয়ংক্রিয়ভাবে টুকরো টুকরো করা হয় এবং একে অপরের সাথে একত্রিত করা হয় ।

  • বার্তা, স্ক্রিপ্ট অথবা বইয়ের অধ্যায় সাঁটো
  • স্মার্ট নম্বর এবং সংক্ষিপ্তকরণ ব্যবস্থাপনা
  • দীর্ঘ টেক্সটের জন্য স্বয়ংক্রিয়ভাবে বাক্য বিভাজন
  • SSML বিরতি এবং গুরুত্বের জন্য সমর্থন

মডেল এবং শব্দ বেছে নিন

২০+ মডেল থেকে বিভিন্ন ব্যবহারের ক্ষেত্রে অনুকূলিত মডেল বেছে নিন - দ্রুত, উচ্চমানের আউটপুট জন্য Kokoro, শব্দের প্রভাব সহ অভিব্যক্তিমূলক কথা বলার জন্য Bark, স্টুডিও বর্ণনা গুণমানের জন্য Tortoise, অথবা টেক্সট-বর্ণিত স্বনির্ধারিত কন্ঠের জন্য Parler। প্রত্যেক মডেল একাধিক অভ্যন্তরীণ কন্ঠ প্রদান করে।

  • তৈরি করার পূর্বে শব্দের প্রাকদর্শন
  • ভাষা, লিঙ্গ এবং শৈলী অনুসারে পরিশোধক
  • ১০ সেকেন্ডের নমুনার সাথে আপনার নিজের কণ্ঠ ক্লোন করুন
  • টেক্সটে একটি শব্দ বর্ণনা করুন (Parler TTS)

4x টেসলা P40 এ AI প্রসেসিং

আপনার লেখা প্রসেস করা হয় আমাদের বিশেষ GPU ক্লাস্টারে ৯৬GB VRAM এর সাথে। নিউরাল নেটওয়ার্ক আপনার লেখার প্রসঙ্গ, প্রসডি এবং আবেগ বিশ্লেষণ করে, তারপর একটি উচ্চ-সত্য অডিও তরঙ্গ আকৃতি তৈরি করে। বেশিরভাগ অনুরোধ ২-১০ সেকেন্ডের মধ্যে সম্পন্ন হয়, দৈর্ঘ্য এবং মডেলের উপর নির্ভর করে।

  • ৪x এনভিডিএ টেসলা পি৪০ জিপিইউ (৯৬ জিবি ভি- রম)
  • প্রিমিয়াম ব্যবহারকারীদের জন্য অগ্রাধিকার লাইন
  • দীর্ঘ টেক্সটের জন্য অসঙ্গত প্রসেসিং
  • ২৪/৭ উপলব্ধতা

ডাউনলোড & ব্যবহার করো

আপনার ব্রাউজার থেকে ফলাফলটি শুনুন, তারপর আপনার পছন্দের ফরম্যাটে ডাউনলোড করুন। সব অডিও বাণিজ্যিকভাবে ব্যবহারের জন্য আপনার জন্য তৈরি করা হয়েছে - TTS.ai এর প্রতিটি মডেল উন্মুক্ত-সোর্স লাইসেন্স (MIT, Apache 2.0) ব্যবহার করে যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়।

  • WAV, MP3 অথবা FLAC হিসাবে ডাউনলোড করুন
  • সব মডেলে বাণিজ্যিক ব্যবহার অনুমোদিত
  • পাবলিক লিঙ্কের মাধ্যমে শেয়ার করুন
  • প্রবেশাধিকার উৎপাদন ইতিহাস

TTS.ai অন্যান্য AI ভয়েস জেনারেটরের তুলনায়

ইলেভেনল্যাবস, প্লে. এইচটি এবং অন্যান্য পরিষেবার সাথে আমাদের তুলনা কিভাবে করা যায়

বৈশিষ্ট্য TTS.ai ElevenLabs Play.ht Murf AI
AI মডেল ২০+ উন্মুক্ত উৎস ১ স্বত্বাধিকারী ২ নিজস্ব ১ স্বাধীন
মুক্ত স্তর কোন নিবন্ধন নেই ১০ হাজার অক্ষর সীমাবদ্ধ ১০ মিনিট
শব্দ ক্লোনিং
ওপেন সোর্স মডেল
স্বয়ংক্রিয়
প্রারম্ভিক মূল্য $9/mo $5/mo $31/mo $23/mo

API ব্যবহার করে শব্দ তৈরি করুন

যেকোন অ্যাপ্লিকেশনে AI শব্দ উৎপাদন একীভূত করুন

পাইথন - AI শব্দ উৎপাদন REST API
import requests

# Generate with any of 20+ models
response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Welcome to the future of AI voice generation.",
    "model": "kokoro",        # or bark, tortoise, styletts2, etc.
    "voice": "af_heart",
    "format": "mp3",
    "speed": 1.0
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("generated_voice.mp3", "wb") as f:
    f.write(response.content)

print(f"Audio generated: {len(response.content)} bytes")

প্রত্যেক স্তরের জন্য পরিকল্পনা

শখের কাজ থেকে শুরু করে ব্যবসায়িক প্রতিষ্ঠান পর্যন্ত - বিনামূল্যে শুরু করুন, আপনার বৃদ্ধির সাথে সাথে পরিমাপ করুন।

মুক্ত স্তর

$0

সাইন আপ করার জন্য ১৫ ক্রেডিট

  • ৪টি বিনামূল্যে মডেল
  • মৌলিক ব্যবহারের জন্য কোন নিবন্ধন নেই
  • বাণিজ্যিক ব্যবহার অনুমোদিত

আরম্ভকারী

$9

৫০০,০০০ অক্ষর/মাস

  • সব ২০+ মডেল
  • শব্দের ক্লোন
  • API ব্যবহার

প্রফেসর

$29

২০০০ ক্রেডিট/মাস

  • প্রাইম মডেল + অগ্রাধিকার
  • API প্রবেশাধিকার
  • ব্যাচ উৎপাদন
সম্পূর্ণ মূল্য দেখুন

প্রায়শ জিজ্ঞাসিত প্রশ্ন

AI শব্দ উৎপাদন সম্পর্কে সাধারণ প্রশ্ন

কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে একটি AI ভয়েস জেনারেটর লিখিত টেক্সটকে প্রাকৃতিক শব্দের কথা বলা অডিওতে রূপান্তর করে। পুরনো রোবটিক TTS সিস্টেমের বিপরীতে, আধুনিক AI ভয়েস জেনারেটর মানুষের কথার উপর প্রশিক্ষিত গভীর নিউরাল নেটওয়ার্ক ব্যবহার করে এমন শব্দ তৈরি করে যা অসাধারণভাবে বাস্তবসম্মত শোনায়।

কোকোরো, অরফেয়াস এবং স্টাইলটিটিএস ২ এর মতো শীর্ষ মডেলগুলো অন্ধ শ্রবণ পরীক্ষায় মানুষের রেকর্ডকৃত কথা থেকে প্রায় আলাদা করে না দেখানোর মত কথা তৈরি করে।

হ্যাঁ। আপনার কণ্ঠের ৫-৩০ সেকেন্ডের অডিও নমুনা আপলোড করুন, এবং Chatterbox বা GPT-SoVITS এর মত মডেল একটি ক্লোন কণ্ঠ তৈরি করবে যা আপনার টাইমব্রে, উচ্চারণ এবং কথা বলার ধরন ধরে রাখবে। এরপর আপনি যেকোনো টেক্সট থেকে আপনার কণ্ঠে অসীমিত বক্তৃতা তৈরি করতে পারবেন।

হ্যাঁ, চারটি মডেল (কোকোরো, পাইপার, ভিটিএস, মেলোটিটিএস) সম্পূর্ণ বিনামূল্যে, কোন ব্যবহারের সীমা বা নিবন্ধনের প্রয়োজন নেই। উচ্চমানের বৈশিষ্ট্য যেমন ভয়েস ক্লোনিং এবং আবেগ নিয়ন্ত্রণের জন্য প্রিমিয়াম মডেলের জন্য ক্রেডিট প্রয়োজন, ৫০০ ক্রেডিটের জন্য ৫ ডলার থেকে শুরু।

আমাদের মডেলগুলো একত্রে ৩০+ ভাষা সমর্থন করে, যার মধ্যে রয়েছে ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, চীনা, জাপানি, কোরীয়, হিন্দি, আরবি, পর্তুগিজ, রুশ, ইতালীয়, আর আরো অনেক ভাষা।

হ্যাঁ। আমাদের সকল মডেল ব্যবহার করে অনুমতিমূলক উন্মুক্ত উৎস লাইসেন্স (এমআইটি, অ্যাপাচি ২. ০) যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। আপনি ইউটিউব ভিডিও, পডকাস্ট, অ্যাপ্লিকেশন, খেলা, বিজ্ঞাপন এবং পণ্যগুলিতে লাইসেন্স ফি ছাড়াই তৈরি অডিও ব্যবহার করতে পারেন।

মডেলের উপর নির্ভর করে গতি পরিবর্তিত হয়। কোকোরো বাস্তব সময়ের চেয়ে প্রায় ১০০ গুণ দ্রুত অডিও উৎপাদন করে - ১০ সেকেন্ডের একটি ক্লিপ তৈরি করতে প্রায় ০.১ সেকেন্ড সময় লাগে। এমনকি ধীর গতির প্রাইম মডেলগুলো সাধারণত ৫-১৫ সেকেন্ডের মধ্যে প্রমিত দৈর্ঘ্যের টেক্সটের জন্য ফলাফল প্রদান করে।

মডেলগুলোর স্থাপত্য, গতি, গুণমান, বৈশিষ্ট্য এবং ভাষা সমর্থন ভিন্ন। কিছু কিছুতে গতি অগ্রাধিকারপ্রাপ্ত (Kokoro, Piper), অন্যরা সর্বোচ্চ গুণমান (StyleTTS2, Tortoise), এবং অন্যরা অনন্য বৈশিষ্ট্য যেমন ভয়েস ক্লোনিং (Chatterbox), আবেগ নিয়ন্ত্রণ (Orpheus), বা ডায়ালগ উৎপাদন (Dia) প্রদান করে।

হ্যাঁ । Orpheus, Chatterbox এবং Bark-এর মত মডেলগুলি আবেগপূর্ণ কথা বলার উৎপাদন সমর্থন করে । আপনি একই টেক্সটটি আনন্দিত, দুঃখিত, রেগে, উত্তেজিত বা চুপচাপ প্রদান করে তৈরি করতে পারেন । কিছু মডেল আবেগপূর্ণ অভিব্যক্তির উপর সুনির্দিষ্ট ঘনত্ব নিয়ন্ত্রণের অনুমতি দেয় ।

TTS.ai ব্যবহার করার সময় নয় — আমাদের GPU সার্ভার সব প্রসেসিং ব্যবস্থাপনা করে। যদি স্ব-হোস্টিং হয়, কিছু মডেল (Piper) সিপিইউ-তে চলতে পারে, অন্যদের জন্য ২-৮GB VRAM সহ এনভিডিআইএ GPU প্রয়োজন। আমাদের প্ল্যাটফর্ম আপনার নিজের হার্ডওয়্যারের প্রয়োজনীয়তা দূর করে দেয়।

আমাদের REST API ব্যবহার করুন। আপনার লেখা, নির্বাচিত মডেল এবং শব্দ সহ একটি POST অনুরোধ পাঠান। API WAV অথবা MP3 ফরম্যাটে অডিও ফিরিয়ে দেয়। আমরা পাইথন, জাভাস্ক্রিপ্ট, Go এবং cURL-এ কোডের উদাহরণ প্রদান করি। আপনার ড্যাশবোর্ড থেকে API কী মুক্তভাবে তৈরি করা যায়।

মডেল ২২-৪৮kHz সাম্পল রেট অডিও উত্‍পাদন করে। আউটপুট ফরম্যাটের মধ্যে রয়েছে WAV (অসংকুচিত, সর্বোচ্চ গুণমান), MP3 (সংকুচিত, ছোট ফাইল), এবং OGG। WAV পেশাদার ব্যবহারের জন্য সুপারিশ করা হয়, কিন্তু MP3 ওয়েব এবং মোবাইল অ্যাপ্লিকেশনের জন্য ভাল কাজ করে।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

আজই AI শব্দ তৈরি শুরু করুন

২০+ মডেল, ১০০+ কণ্ঠ, কণ্ঠ ক্লোনিং, এবং একটি শক্তিশালী API। এটি বিনামূল্যে চেষ্টা করুন - কোন নিবন্ধন প্রয়োজন নেই।