AI শব্দ নিৰ্মাতা - ২৪+ মডেল, ১০০+ শব্দ

আধুনিক AI ব্যৱহাৰ কৰি টেক্সটৰ পৰা প্ৰকৃত মানৱ কথন নিৰ্মাণ কৰক। ২৪+ নিউৰাল TTS মডেল, ১০০+ পূৰ্ব নিৰ্মিত কথন আৰু কথন ক্লোনিংৰ পৰা নিৰ্বাচন কৰক - সকলো এটা প্লেটফৰ্মৰ পৰা। Kokoro ৰ সৈতে দ্ৰুত ড্ৰাফ্টৰ পৰা Tortoise TTS ৰ সৈতে স্টুডিঅ'-গুণমানৰ অডিঅ'লৈ, যিকোনো প্ৰকল্পৰ বাবে সম্পূৰ্ণ কথন বিচাৰি লওক।

AI শক্তিশালী ২৪+ মডেল ১০০+ ধ্বনি ধ্বনি ক্লোনিং ভাষাসমূহ

এতিয়া চেষ্টা কৰক

0/500
Kokoro, Piper, VITS, MeloTTS ৰ সৈতে মুক্ত
Your generated audio will appear here
সৃষ্টি কৰা হৈছে
0:00 0:00
ডাউনলোড কৰক
TTS.ai পছন্দ হৈছে? আপোনাৰ বন্ধুসকলক কওক!

AI শব্দ উৎপাদনৰ বৈশিষ্ট্যসমূহ

সৃষ্টিকৰ্তা, উন্নয়নকাৰী আৰু ব্যৱসায়ৰ বাবে এটা সম্পূৰ্ণ শব্দ উৎপাদন প্লেটফৰ্ম

২০+ AI মডেল

২০ ৰো অধিক AI শব্দ মডেল ব্যৱহাৰ কৰক, প্ৰত্যেকটো অসাধাৰণ শক্তিৰ সৈতে। দ্ৰুত হালধীয়া মডেলসমূহৰ পৰা প্ৰিমিয়াম স্টুডিঅ'-গুণমানৰ ইঞ্জিনসমূহলৈ।

১০০+ ধ্বনি

বিভিন্ন লিঙ্গ, বয়স, উচ্চাৰণ আৰু ভাষাৰ ১০০ ৰো অধিক শব্দৰ এক বিচিত্র বৰ্ষপঞ্জি ব্ৰাউছ কৰক। সৃষ্টি কৰাৰ পূৰ্বে যিকোনো শব্দৰ পূৰ্বপ্ৰদৰ্শন কৰক।

ধ্বনি ক্লোনিং

৫-৩০ ছেকেণ্ডৰ অডিঅ' নমুনাৰ পৰা যিকোনো শব্দ ক্লোন কৰক। আখৰ, ব্ৰেন্ডিং, অথবা অন্তৰ্ভুক্তিৰ বাবে স্বনিৰ্বাচিত শব্দ নিৰ্মাণ কৰক যি পূৰ্ণৰূপে মূলৰ দৰে শব্দ কৰে।

ইমোচন নিয়ন্ত্ৰণ

সুখী, দুখী, ক্ষুব্ধ, উত্তেজিত, উচুপি উচুপি কথা ক'ব পৰা বিশেষ অনুভূতিৰে কথা ক'ব পৰা শব্দ নিৰ্মাণ কৰক। সুষম, অভিব্যক্তিমূলক শব্দৰ বাবে শব্দৰ গভীৰতা নিয়ন্ত্ৰণ কৰক।

ভাষাসমূহ

৩০ ৰো অধিক ভাষাত স্বকীয় উচ্চাৰণৰ সৈতে শব্দ নিৰ্মাণ কৰক। হিন্দী, জাপানি, স্পেনিশ, চীনা, আৰবি, কোৰীয়, আৰু আকৌ বহুতো।

API অভিগম

আমাৰ REST API ৰ সৈতে আপোনাৰ এপ্লিকেচনসমূহত AI শব্দ নিৰ্মাণ একত্ৰিত কৰক। সম্পূৰ্ণ মডেল আৰু শব্দ নিয়ন্ত্ৰণৰ সৈতে প্ৰগ্ৰামিকভাৱে শব্দ নিৰ্মাণ কৰক।

আমাৰ AI শব্দ মডেলসমূহ

দ্ৰুত আৰু বিনামূলীয়াৰ পৰা প্ৰিমিয়াম স্টুডিঅ'-গুণমান

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

সৰ্বোত্তম: সৰ্বোত্তম সামগ্ৰিক — অতি-দ্ৰুত, স্টুডিঅ' গুণমান, অধিকাংশ শব্দ সৃষ্টিৰ প্ৰয়োজনৰ বাবে আদর্শ

চেষ্টা কৰক Kokoro

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 ধ্বনি ক্লোনিং

সৰ্বোত্তম: Resemble AI ৰ পৰা অনুভূতি নিয়ন্ত্ৰণৰ সৈতে state-of-the-art শব্দ ক্লোনিং

চেষ্টা কৰক Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ধ্বনি ক্লোনিং

সৰ্বোত্তম: স্ট্ৰিমিং, শূণ্য-শ্বট ক্লোনিং আৰু ৮টা ভাষাৰ সৈতে মানৱ-পৰিমাণৰ গুণমান

চেষ্টা কৰক CosyVoice 2

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

সৰ্বোত্তম: ১০০K ঘণ্টাৰ কথাৰ তথ্যত প্ৰশিক্ষিত মানৱ স্তৰৰ আবেগিক অভিব্যক্তি

চেষ্টা কৰক Orpheus

StyleTTS 2StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

Medium 5/5

সৰ্বোত্তম: প্ৰিমিয়াম নাৰ্টিঙৰ বাবে শৈলী বিকিৰণৰ দ্বাৰা মানৱ-স্তরৰ গুণমান

চেষ্টা কৰক StyleTTS 2

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সৰ্বোত্তম: শব্দৰ প্ৰভাৱ, হাসি আৰু ১৩+ ভাষাৰ সৈতে সৃষ্টিশীল অডিঅ'

চেষ্টা কৰক Bark

AI Voice Generation কিদৰে কাম কৰে

সেকেণ্ডত টেক্সট ইনপুটৰ পৰা স্বাভাৱিক কথোপকথনলৈ

1

আপোনাৰ টেক্সট লিখক

আপুনি যি লিখনীক কথোপকথনে ৰূপান্তৰ কৰিব বিচাৰে তাক টাইপ কৰক অথবা পেইস্ট কৰক । প্ৰতিটো অনুৰোধত ৫০০ আখৰলৈকে সমৰ্থন কৰা হয় আৰু লং-টেক্সট বিভাজন উপলব্ধ ।

2

আৰ্হি আৰু শব্দ নিৰ্বাচন কৰক

20+ AI মডেল আৰু 100+ শব্দৰ পৰা বাছক। আপোনাৰ বিষয়বস্তু আৰু দর্শকৰ বাবে সঠিক মিল পোৱাৰ বাবে শব্দসমূহ পূৰ্বদৰ্শন কৰক।

3

কথোপকথন সৃষ্টি কৰক

ক্লিক কৰি ছেকেণ্ডত উচ্চমানৰ অডিঅ' সৃষ্টি আৰু গ্ৰহণ কৰক। Kokoro ৰ দৰে দ্ৰুত মডেলে ২ ছেকেণ্ডত ফলাফল প্ৰদান কৰে।

4

ডাউনল'ড কৰক অথবা একত্ৰিত কৰক

MP3 অথবা WAV ৰূপে অডিঅ' ডাউনল'ড কৰক, অথবা API ব্যৱহাৰ কৰি আপোনাৰ এপ্লিকেচন আৰু কাৰ্য্যক্ৰমত সরাসৰি শব্দ নিৰ্মাণ একত্ৰিত কৰক।

AI শব্দ উৎপাদন কাৰ্য্যক্ৰম

TTS.ai এ কিদৰে টেক্সটক প্ৰাকৃতিক-স্বৰযুক্ত কথোপকথনত পৰিবৰ্তন কৰে

আপোনাৰ লিখনী লিখক অথবা পেইস্ট কৰক

এটা একক বাক্যৰ পৰা এটা সম্পূৰ্ণ প্ৰবন্ধলৈ যিকোনো বস্তু সুমুৱাওক । AI এ বিৰাম-চিহ্ন, সংখ্যা, সংক্ষিপ্তকৰণ, আৰু SSML মাৰ্কআপও স্বাভাৱিকভাৱে পৰিচালনা কৰে । দীঘল টেক্সট স্বয়ংক্ৰিয়ভাৱে চুঙ্ক কৰা হয় আৰু নিখুঁতভাৱে একত্ৰিত কৰা হয় ।

  • প্ৰবন্ধ, স্ক্ৰিপ্ট অথবা কিতাপ অধ্যায় পেইস্ট কৰক
  • স্মাৰ্ট নম্বৰ আৰু সংক্ষিপ্তকৰণ ব্যৱস্থাপনা
  • দীঘল টেক্সটৰ বাবে স্বয়ংক্ৰিয় বাক্য বিভাজন
  • SSML স্থগিত আৰু গুৰুত্বৰ বাবে সমৰ্থন

আৰ্হি আৰু শব্দ নিৰ্বাচন কৰক

24+ মডেলসমূহৰ পৰা নিৰ্বাচন কৰক বিভিন্ন ব্যৱহাৰৰ ক্ষেত্ৰত অনুকূলিত - দ্ৰুত, উচ্চ-মানৰ আউটপুটৰ বাবে Kokoro, শব্দৰ প্ৰভাৱৰ সৈতে অভিব্যক্তিমূলক কথোপকথনৰ বাবে Bark, স্টুডিঅ' বৰ্ণনাৰ মানৰ বাবে Tortoise, অথবা টেক্সট-বিৱৰণ কৰা স্বনিৰ্বাচিত কথোপকথনৰ বাবে Parler। প্ৰত্যেক মডেলে একাধিক অভ্যন্তৰীণ কথোপকথন প্ৰদান কৰে।

  • সৃষ্টি কৰাৰ পূৰ্বে শব্দসমূহ পূৰ্বদৰ্শন কৰক
  • ভাষা, লিঙ্গ আৰু বিন্যাস অনুযায়ী ফিল্টাৰ কৰক
  • ১০ ছেকেণ্ডৰ নমুনাৰ সৈতে আপোনাৰ নিজস্ব কন্ঠ ক্লোন কৰক
  • টেক্সটত এটা শব্দ বৰ্ণনা কৰক (Parler TTS)

4x Tesla P40 ত AI প্ৰক্ৰিয়াকৰণ

আপোনাৰ টেক্সটক VRAM ৰ ৯৬GB ৰ সৈতে আমাৰ নিবেদিত GPU ক্লাস্টাৰত প্ৰক্ৰিয়া কৰা হয়। নিউৰাল নেটৱৰ্কে আপোনাৰ টেক্সটক পৰিপ্ৰেক্ষিত, প্ৰোসোডি, আৰু অনুভূতিৰ বাবে বিশ্লেষণ কৰে, তাৰ পিছত এটা উচ্চ-সত্যতা অডিঅ' ৱেবফৰ্ম উৎপন্ন কৰে। অধিকাংশ অনুৰোধসমূহ দৈৰ্ঘ্য আৰু মডেলৰ ওপৰত নিৰ্ভৰ কৰি ২-১০ ছেকেণ্ডত সম্পূৰ্ণ হয়।

  • 4x NVIDIA Tesla P40 GPUs (96GB VRAM)
  • পৰিশোধ কৰা ব্যৱহাৰকাৰীৰ বাবে অগ্ৰাধিকাৰ তালিকা
  • দীঘল টেক্সটৰ বাবে Async প্ৰক্ৰিয়াকৰণ
  • ২৪/৭ উপলব্ধতা

ডাউনল'ড কৰক আৰু ব্যৱহাৰ কৰক

আপোনাৰ ব্ৰাউছাৰত ফলাফলৰ লগে লগে শুনিব, তাৰ পিছত আপোনাৰ পছন্দৰ বিন্যাসত ডাউনল'ড কৰক। সকলো উত্পন্ন অডিঅ' বাণিজ্যিকভাৱে ব্যৱহাৰ কৰিবলৈ আপোনাৰ - TTS.ai ৰ প্ৰতিটো মডেলে উন্মুক্ত উৎসৰ লাইচেঞ্চ (MIT, Apache 2.0) ব্যৱহাৰ কৰে যাৰ দ্বাৰা বাণিজ্যিক ব্যৱহাৰৰ অনুমতি প্ৰদান কৰা হয়।

  • WAV, MP3 অথবা FLAC ৰূপে ডাউনল'ড কৰক
  • সকলো মডেলত বাণিজ্যিক ব্যৱহাৰ অনুমোদিত
  • সাৰ্বজনীন লিঙ্কৰ দ্বাৰা অংশীদাৰী কৰক
  • অভিগম উৎপাদন ইতিহাস

TTS.ai বনাম অন্য AI শব্দ উৎপাদকসমূহ

ElevenLabs, Play.ht, আৰু অন্যান্য সেৱাসমূহৰ সৈতে আমি কেনেদৰে তুলনা কৰোঁ

বৈশিষ্ট্য TTS.ai ElevenLabs Play.ht Murf AI
AI মডেলসমূহ মুক্ত উৎস ১ স্বত্বাধিকাৰী ২ স্বত্বাধিকাৰ ১ স্বত্বাধিকাৰী
মুক্ত স্তৰ কোনো নিবন্ধন নাই ১০k আখৰ সীমাবদ্ধ ১০ মিনিট
ধ্বনি ক্লোনিং
মুক্ত উৎস মডেলসমূহ
স্ব-হোস্টযোগ্য
আৰম্ভণিৰ মূল্য $9/mo $5/mo $31/mo $23/mo

API ব্যৱহাৰ কৰি শব্দ নিৰ্মাণ কৰক

যিকোনো এপ্লিকেচনত AI শব্দ নিৰ্মাণ একত্ৰিত কৰক

Python - AI শব্দ নিৰ্মাণ REST API
import requests

# Generate with any of 24+ models
response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Welcome to the future of AI voice generation.",
    "model": "kokoro",        # or bark, tortoise, styletts2, etc.
    "voice": "af_heart",
    "format": "mp3",
    "speed": 1.0
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("generated_voice.mp3", "wb") as f:
    f.write(response.content)

print(f"Audio generated: {len(response.content)} bytes")

প্ৰত্যেক স্কেলৰ বাবে পৰিকল্পনা

শখৰ পৰা উদ্যোগলৈ – বিনামূলীয়াকৈ আৰম্ভ কৰক, বিকাশৰ লগে লগে বৃদ্ধি কৰক।

মুক্ত স্তৰ

$0

৫০ ক্রেডিট

  • ৪ মুক্ত মডেল
  • মৌলিক ব্যৱহাৰৰ বাবে কোনো নিবন্ধন নাই
  • বাণিজ্যিক ব্যৱহাৰ অনুমোদিত

আৰম্ভ কৰক

$9

৫০০ ক্রেডিট/মাহ

  • সকলো 24+ আৰ্হি
  • শব্দ ক্লোনিং
  • API অভিগম

প্ৰো

$29

২০০০ ক্রেডিট/মাহ

  • প্ৰিমিয়াম মডেল + অগ্ৰাধিকাৰ
  • API অভিগম
  • ব্যাচ নিৰ্মাণ
সম্পূৰ্ণ মূল্য দেখুৱাওক

সদায় সোধা প্ৰশ্নসমূহ

AI শব্দ উৎপাদনৰ বিষয়ে সাধাৰণ প্ৰশ্নসমূহ

কৃত্ৰিম বুদ্ধিমত্তাৰ সহায়ত এটা AI শব্দ উৎপাদকে লিখিত টেক্সটক স্বাভাৱিক-স্বৰযুক্ত কথোপকথনৰ অডিঅ'লৈ ৰূপান্তৰ কৰে। পুৰণি ৰবট TTS ব্যৱস্থাৰ বিপৰীতে, আধুনিক AI শব্দ উৎপাদকে মানৱ কথোপকথনৰ ওপৰত প্ৰশিক্ষণপ্ৰাপ্ত গভীৰ নিউৰাল নেটৱাৰ্ক ব্যৱহাৰ কৰে যি অসাধাৰণভাৱে বাস্তবসম্মত শব্দ উৎপন্ন কৰে।

Kokoro, Orpheus, আৰু StyleTTS2ৰ দৰে শীৰ্ষ মডেলসমূহে অন্ধ শুনা পৰীক্ষাত মানৱ ৰেকৰ্ডৰ পৰা প্ৰায় অবিচ্ছিন্নভাৱে কথোপকথন প্ৰস্তুত কৰে। গুণমান উল্লেখযোগ্যভাৱে উন্নত হৈছে আৰু প্ৰতিটো নতুন মডেল প্ৰজন্মৰ সৈতে দ্ৰুতগতিত আগবাঢ়ি গৈ আছে।

হ্যাঁ। আপোনাৰ কন্ঠৰ ৫-৩০ ছেকেণ্ডৰ অডিঅ' নমুনা আপলোড কৰক, আৰু Chatterbox অথবা GPT-SoVITS ৰ দৰে মডেলে এটা ক্লোন কৰা কন্ঠ সৃষ্টি কৰিব যি আপোনাৰ টিমব্ৰে, উচ্চাৰণ, আৰু কথোপকথনৰ শৈলী গ্ৰহণ কৰে। তাৰ পিছত আপুনি যিকোনো টেক্সটৰ পৰা আপোনাৰ কন্ঠত অসীমিত কথোপকথন সৃষ্টি কৰিব পাৰিব।

হ্যাঁ, চাৰিটা মডেল (Kokoro, Piper, VITS, MeloTTS) সম্পূৰ্ণৰূপে বিনামূলীয়া, ব্যৱহাৰৰ কোনো সীমা নাই বা নিবন্ধনৰ প্ৰয়োজন নাই। উচ্চমানৰ বৈশিষ্ট্যসমূহৰ সৈতে প্ৰিমিয়াম মডেল যেনে শব্দ ক্লোনিং আৰু আবেগ নিয়ন্ত্ৰণৰ বাবে ক্ৰেডিটৰ প্ৰয়োজন, ৫০০ ক্ৰেডিটৰ বাবে আৰম্ভণিত $৫।

আমাৰ মডেলসমূহে ইংৰাজী, স্পেনিশ, ফৰাচী, জাৰ্মানী, চীনা, জাপানি, কোৰীয়, হিন্দী, আৰবী, পৰ্তুগিজ, ৰুচীয়, ইটালীয় আৰু আন বহুতো ভাষাকে ধৰি ৩০+ ভাষা সমৰ্থন কৰে।

হ্যাঁ। আমাৰ সকলো মডেলে বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়া উন্মুক্ত উৎসৰ লাইচেঞ্চ (MIT, Apache 2.0) ব্যৱহাৰ কৰে। আপুনি YouTube ভিডিঅ', পডকাস্ট, এপ্লিকেচন, খেল, বিজ্ঞাপন আৰু পণ্যসমূহত লাইচেঞ্চ ফিৰ নোহোৱাকৈ সৃষ্টি কৰা অডিঅ' ব্যৱহাৰ কৰিব পাৰিব।

আৰ্হি অনুযায়ী গতি সলনি হয়। Kokoro ৰ দ্বাৰা অডিঅ' প্ৰস্তুত কৰা হয় প্ৰায় ১০০x দ্ৰুতগতিত - ১০ ছেকেণ্ডৰ এটা ক্লিপ প্ৰস্তুত কৰিবলৈ প্ৰায় ০.১ ছেকেণ্ডৰ প্ৰয়োজন হয়। আকৌ ধীৰ প্ৰিমিয়াম আৰ্হিসমূহে সাধাৰণতে প্ৰমিত আৰ্হিৰ টেক্সটৰ বাবে ৫-১৫ ছেকেণ্ডৰ ভিতৰত ফলাফল প্ৰদান কৰে।

আৰ্হি, গতি, গুণমান, বৈশিষ্ট্য আৰু ভাষা সমৰ্থনৰ দিশত মডেলসমূহ ভিন্ন। কিছুমানে গতি (Kokoro, Piper) অগ্ৰাধিকাৰ দিয়ে, আন কিছুমানে গুণমান (StyleTTS 2, Tortoise) বৃদ্ধি কৰে, আৰু আন কিছুমানে স্বতন্ত্ৰ বৈশিষ্ট্যসমূহ উপলব্ধ কৰে যেনে শব্দ ক্লোনিং (Chatterbox), আবেগ নিয়ন্ত্ৰণ (Orpheus), অথবা সংলাপ নিৰ্মাণ (Dia)।

হ্যাঁ। Orpheus, Chatterbox, আৰু Bark ৰ দৰে মডেলসমূহে আবেগিক কথোপকথন সৃষ্টিক সমৰ্থন কৰে। আপুনি সুখী, দুখী, ক্ষুব্ধ, উত্তেজিত, অথবা উচুপি উচুপি কথোপকথনৰ সৈতে একেটা টেক্সট সৃষ্টি কৰিব পাৰিব। কিছুমান মডেলে আবেগিক অভিব্যক্তিৰ ওপৰত সৰু-গৰিষ্ঠতা নিয়ন্ত্ৰণ অনুমোদন কৰে।

TTS.ai ব্যৱহাৰ কৰোঁতে নহয় — আমাৰ GPU চাৰ্ভাৰে সকলো প্ৰক্ৰিয়া ব্যৱস্থাপনা কৰে। স্ব-হোস্টিং হ'লে, কিছুমান মডেল (Piper) CPU ত চলোৱা হয় যদিও আন কিছুমানৰ বাবে ২-৮GB VRAM ৰ সৈতে NVIDIA GPU ৰ প্ৰয়োজন হয়। আমাৰ প্লেটফৰ্মে আপোনাৰ নিজস্ব হাৰ্ডৱেৰৰ প্ৰয়োজন দূৰ কৰে।

আমাৰ REST API ব্যৱহাৰ কৰক। আপোনাৰ টেক্সট, নিৰ্বাচিত মডেল, আৰু কন্ঠৰ সৈতে এটা POST অনুৰোধ পঠাওক। API এ WAV অথবা MP3 বিন্যাসত অডিঅ' ঘূৰাই দিয়ে। আমি Python, JavaScript, Go, আৰু cURL ত কোডৰ উদাহৰণসমূহ প্ৰদান কৰোঁ। API কি'সমূহ আপোনাৰ ড্যাশবোর্ডৰ পৰা সৃষ্টি কৰিবলে বিনামূলীয়া।

আৰ্হিসমূহে ২২-৪৮kHz সেম্পল ৰেটত অডিঅ' সৃষ্টি কৰে। আউটপুট বিন্যাসসমূহত WAV (অসংকুচিত, সৰ্বোচ্চ গুণমান), MP3 (সংকুচিত, সৰু নথিপত্ৰ), আৰু OGG অন্তৰ্ভুক্ত আছে। WAV পেছাদাৰী ব্যৱহাৰৰ বাবে পছন্দ কৰা হয় যদিও MP3 ৱেব আৰু ম'বাইল এপ্লিকেচনসমূহৰ বাবে ভালদৰে কাম কৰে।
5.0/5 (1)

AI ধ্বনি আজি নিৰ্মাণ আৰম্ভ কৰক

24+ মডেল, 100+ ধ্বনি, ধ্বনি ক্লোনিং, আৰু এটা শক্তিশালী API। ইয়াক বিনামূলীয়াকৈ চেষ্টা কৰক - কোনো সাবস্ক্ৰাইব প্ৰয়োজন নহয়।