সম্বন্ধে

আটাইতকৈ বিস্তৃত উন্মুক্ত উৎসৰ কন্ঠ AI প্লেটফৰ্ম। ২০+ মডেল, ১০০+ কন্ঠ, সকলো এক স্থানত।

সৃষ্টি কৰা হৈছে

TTS.ai সৃষ্টি কৰিছিল John Nader (nadermx), TTS.ai এক স্বাধীন বিকাশকাৰী যিয়ে মুক্ত উৎসৰ AI টুলসমূহ নিৰ্মাণ কৰে। TTS.ai হৈছে সৰ্বোত্তম AI শব্দ প্ৰযুক্তিক সকলোৰে বাবে উপলব্ধ কৰাৰ এক অভিযানৰ অংশ – কোনো ভেণ্ডাৰ লক-ইন নাই, কোনো তথ্য সংগ্ৰহ নাই, কেৱল শক্তিশালী শব্দ প্ৰযুক্তি সঠিক মূল্যত।

আমাৰ অভিযান

TTS.ai এটা সৰল বিশ্বাসৰ ওপৰত নিৰ্মিত হৈছে: শ্ৰেষ্ঠ এআই শব্দ প্ৰযুক্তি সকলোৰে বাবে উপলব্ধ হ’ব লাগিব।. মৌলিক টেক্সট-টু-স্পীচ সেৱাৰ বাবে স্বত্বাধিকাৰী সেৱাসমূহে প্ৰিমিয়াম মূল্য নিৰ্ধাৰণ কৰাৰ বিপৰীতে উন্মুক্ত উৎসৰ সম্প্রদায়ে বাণিজ্যিক গুণমানৰ সৈতে মিল থকা বা তাৰ অধিক মানৰ মডেলসমূহ সৃষ্টি কৰিছে।

আমি সৰ্বশ্ৰেষ্ঠ মুক্ত উৎসৰ কণ্ঠ AI মডেলসমূহ এক একক, সহজে ব্যৱহাৰযোগ্য প্লেটফৰ্মত একত্ৰিত কৰিছো। কোনো বিক্ৰেতা লক-ইন নাই। কোনো তথ্য সংগ্ৰহ নাই। কেৱল শক্তিশালী কণ্ঠ প্ৰযুক্তি সঠিক মূল্যত।

আমি কি প্ৰদান কৰোঁ

টেক্সট-টু-স্পীচName

Kokoro, Chatterbox, Bark, আৰু অধিক অন্তৰ্ভুক্ত ২০+ মডেল। দ্ৰুত হালধীয়া সংশ্লেষণৰ পৰা স্টুডিঅ'-গুণমানৰ আউটপুটলৈ।

কথাৰ পৰা লিপিলৈName

Whisper, Faster-Whisper, আৰু SenseVoice দ্বাৰা সমৰ্থিত। সময়চিহ্ন আৰু বক্তা চিনাক্তকৰণৰ সৈতে ১০০+ ভাষাত অডিঅ' অনুবাদ কৰক।

ধ্বনি ক্লোনিং

৫ ছেকেণ্ডৰ নমুনাৰ পৰা যিকোনো শব্দ ক্লোন কৰক। Chatterbox, GPT-SoVITS, CosyVoice ২, আৰু অধিক। আপোনাৰ প্ৰকল্পৰ বাবে স্বনিৰ্বাচিত শব্দ সৃষ্টি কৰক।

অডিঅ' প্ৰক্ৰিয়াকৰণ

অডিঅ' উন্নত কৰক, কণ্ঠসমূহ আঁতৰাওক, ষ্টেমসমূহ বিভাজন কৰক, ইকো/ৰিভাৰব আঁতৰাওক, কি/BPM চিনাক্ত কৰক, আৰু বিন্যাসসমূহ পৰিবৰ্তন কৰক। সকলো AI দ্বাৰা শক্তিশালী কৰা হৈছে।

ভয়েস চেট

AI ৰ সৈতে ৰিয়েল-টাইম শব্দ কথোপকথন। এটা প্ৰতিক্ৰিয়াশীল চেট অভিজ্ঞতাৰ বাবে আপোনাৰ মডেল আৰু শব্দ বাছক।

বিকাশক API

OpenAI-সংগতিপূৰ্ণ REST API। Python SDK, কোড উদাহৰণ, আৰু বিস্তৃত দস্তাবেজ। আপোনাৰ এপ্লিকেচনসমূহত ধ্বনি বৈশিষ্ট্যসমূহ নিৰ্মাণ কৰক।

প্ৰথমে খোলা উৎস

TTS.ai ৰ প্ৰতিটো মডেল MIT অথবা Apache 2.0ৰ অধীনত লাইচেঞ্চপ্ৰাপ্ত উন্মুক্ত উৎসৰ। আমি স্বচ্ছতা আৰু সম্প্রদায়ভিত্তিক উদ্ভাৱনত বিশ্বাসী।

আমি কৰোঁ

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
আৰু অধিক...

সকলো আৰ্হিৰ ওজন তেওঁলোকৰ আনুষ্ঠানিক সংগ্ৰহস্থলসমূহৰ পৰা ডাউনল'ড কৰা হয়। আমি কোনো স্বত্বাধিকাৰী পৰিবৰ্তন যোগ কৰা নাই।

অবকাঠামো

TTS.ai NVIDIA Tesla P40 GPUs (মোট 96GB VRAM) ৰ সৈতে সমৰ্পিত GPU সেৱকসমূহত চলে। আমাৰ আন্তঃগাঁথনি কম লেটেন্সী আৰু উচ্চ ট্ৰান্সপাউটৰ বাবে ডিজাইন কৰা হৈছে:

  • অনুমানৰ বাবে সমৰ্পিত GPU ক্লাস্টাৰ - কোনো অংশীদাৰী সম্পদ নাই
  • মডেল VRAM প্ৰয়োজনৰ ভিত্তিত গতিশীল GPU বিতৰণ
  • সৰ্বোত্তম ট্ৰান্সপাউটৰ বাবে ৫-কিউ প্ৰাথমিকতা ব্যৱস্থা
  • তাৎক্ষণিক অনুমানৰ বাবে VRAM ত পূৰ্ব-লোড কৰা মডেলসমূহ
  • দ্ৰুত ডাউনল'ডৰ বাবে CDN-সমৰ্থিত অডিঅ' প্ৰদান

গোপনীয়তা আৰু সুৰক্ষা

  • কোনো তথ্য প্ৰশিক্ষণ নাই: মডেল প্ৰশিক্ষণ দিবলৈ আমি আপোনাৰ অডিঅ' অথবা টেক্সট কেতিয়াও ব্যৱহাৰ নকৰো
  • স্ব-আঁতৰুৱা: ২৪ ঘন্টাৰ পিছত সৃষ্টি কৰা অডিঅ' স্বয়ংক্ৰিয়ভাবে আঁতৰুৱা হয়
  • এনক্ৰিপশন: সকলো তথ্য পৰিবহন (TLS 1.2+) আৰু স্থায়ী অৱস্থাত এনক্ৰিপ্ট কৰা হৈছে
  • অনুসৰণ কৰা নহয়: আমি কৰোঁ
  • GDPR অনুকূলিত: যিকোনো সময়ত আপোনাৰ তথ্য অনুৰোধ কৰক অথবা আঁতৰাওক

TTS.ai ৰ বিষয়ে FAQ

TTS.ai জন নাডাৰ (nadermx) দ্বাৰা সৃষ্টি কৰা হৈছিল, এজন স্বাধীন ডেভেলপৰ যি AI শব্দ প্ৰযুক্তি সকলোৰে বাবে উপলব্ধ কৰাৰ প্ৰতি আগ্ৰহী। আমি কৰ্তৃত্বমূলক সকলৰ প্ৰশিক্ষণৰ পৰিবৰ্তে সম্প্রদায়ৰ পৰা সৰ্বোত্তম মুক্ত উৎসৰ মডেলসমূহ পৰিচালনা আৰু সেৱা কৰিছো।

আমাৰ আন্তঃগাঁথনি ৯৬ গিগাবাইট VRAM প্ৰদান কৰা NVIDIA Tesla P40 GPUs সহ নিৰ্দিষ্ট সেৱকসমূহত চলোৱা হয়। ৱেব ফ্ৰন্টএণ্ড আৰু GPU inference সেৱকসমূহ নিম্ন-লেটেন্সি সংযোগৰ সৈতে সুৰক্ষিত তথ্য কেন্দ্ৰসমূহত হোস্ট কৰা হয়।

আমি তথ্য সংৰক্ষণ কম কৰোঁ। টেক্সট ইনপুটসমূহ প্ৰকৃত সময়ত প্ৰক্ৰিয়া কৰা হয় আৰু স্থায়ীভাৱে সংৰক্ষণ কৰা নহয়। সকলো আপলোড কৰা আৰু সৃষ্টি কৰা অডিঅ' ফাইলসমূহ ২৪ ঘন্টাৰ ভিতৰত স্বয়ংক্ৰিয়ভাৱে আঁতৰুৱা হয়। আমি AI মডেলসমূহ প্ৰশিক্ষণ দিবলৈ আপোনাৰ তথ্য কেতিয়াও ব্যৱহাৰ নকৰোঁ।

TTS.ai এ উন্নয়নকাৰী, বিষয়বস্তু সৃষ্টিকাৰী, আৰু বিশ্বব্যাপী ব্যৱসায়ৰ এটা বৃদ্ধি পাওঁতা সম্প্রদায়ক সেৱা প্ৰদান কৰে। আমাৰ প্লেটফৰ্মে প্ৰতিদিনে ২০+ AI মডেলসমূহত হাজাৰ হাজাৰ শব্দ সৃষ্টিৰ অনুৰোধসমূহ ব্যৱস্থাপনা কৰে।

আমি আমাৰ নিবেদিত GPU আন্তঃগাঁথনি আৰু ৫-কিউ প্ৰাথমিক ব্যৱস্থাৰ সৈতে উচ্চ উপলব্ধতাৰ বাবে চেষ্টা কৰিছো। যদিও আমি ফ্ৰি-টিয়াৰ ব্যৱহাৰকাৰীসকলৰ বাবে এটা আনুষ্ঠানিক SLA প্ৰদান নকৰোঁ, পেইড প্লানসমূহে প্ৰাথমিক প্ৰক্ৰিয়াকৰণ আৰু উচ্চ বিশ্বাসযোগ্যতাৰ পৰা লাভ কৰে।

হ’ব। TTS.ai ৰ প্ৰতিটো মডেল MIT অথবা Apache 2.0 ৰ অধীনত লাইচেঞ্চপ্ৰাপ্ত মুক্ত উৎসৰ। আমি সক্ৰিয়ভাৱে মুক্ত উৎসৰ কণ্ঠ AI সম্প্রদায়ক সমৰ্থন কৰিছো আৰু পৰিৱেশ ব্যৱস্থাত অনুকূলীকৰণ আৰু একত্ৰীকৰণত অৱদান আগবঢ়াইছো।

আমাৰ ৰোডমেপত নতুন আধুনিক মডেল যোগ কৰা, ভাষা সমৰ্থন বৃদ্ধি কৰা, ৰিয়েল-টাইম ভয়েস চেট ক্ষমতা উন্নত কৰা আৰু অধিক অডিঅ’ প্ৰক্ৰিয়াকৰণ সৰঞ্জাম নিৰ্মাণ কৰা অন্তৰ্ভুক্ত।

TTS.ai এটা একক ডেভেলপৰ দ্বাৰা নিৰ্মিত আৰু পৰিচালিত, গতিকে কোনো মুক্ত অৱস্থান নাই। তথাপিও, মুক্ত উৎসৰ অৱদান সদায়ে স্বাগতম — যোগাযোগ পৃষ্ঠা বা GitHubৰ দ্বাৰা পৌঁছাওক।

হ’ব, আমি উন্নয়নকাৰী, ব্যৱসায়ী আৰু সংস্থাসমূহৰ সৈতে সহযোগিতাক স্বাগতম জনাইছো যিসকলে তেওঁলোকৰ উৎপাদনত ভয়েছ এআই একত্ৰিত কৰিব বিচাৰে। API একত্ৰিতকৰণ, ভলিউম প্ৰাইজিং বা কাষ্টম মডেল বিকাশৰ বিষয়ে আলোচনা কৰিবলৈ আমাৰ সৈতে যোগাযোগ কৰক।

আমি আমাৰ আন্তঃগাঁথনিৰ নিয়মিত সুৰক্ষা পৰিদৰ্শন কৰোঁ। সকলো তথ্য TLS 1.2+ ৰ সৈতে পৰিবহনত এনক্ৰিপ্ট কৰা হয়, পাছৱাৰ্ডসমূহ শিল্প-প্ৰমাণিত এলগোৰিদমৰ সৈতে হ্যাশ কৰা হয়, আৰু API কি'সমূহ একমুখী হ্যাশিং ব্যৱহাৰ কৰে। চাৰ্ভাৰৰ অভিগম SSH কি'সমূহৰ দ্বাৰা অনুমোদিত কৰ্মচাৰীসকলৰ বাবে সীমাবদ্ধ কৰা হয়।

TTS.ai GDPR অনুকূল আৰু তথ্য ক্ষুদ্ৰকৰণ নীতি অনুসৰণ কৰে। আমি ২৪ ঘন্টাৰ বাহিৰ ব্যক্তিগত অডিঅ' তথ্য সংৰক্ষণ নকৰো, প্ৰশিক্ষণৰ বাবে গ্ৰাহক তথ্য ব্যৱহাৰ নকৰো, আৰু অনুৰোধ অনুসৰি সম্পূৰ্ণ তথ্য অভিগম, সংশোধন, আৰু মুছে ফেলা অধিকাৰ প্ৰদান কৰোঁ।

আমি অবিৰতভাৱে মুক্ত উৎসৰ কণ্ঠ AI পৰিৱেশ নিৰীক্ষণ কৰিছো আৰু নতুন মডেলসমূহ উপলব্ধ হোৱাৰ লগে লগে আৰু তেওঁলোকৰ গুণমান প্ৰমাণ কৰাৰ লগে লগে যোগ কৰিছো।

প্ৰশ্ন? ফিডব্যাক? আমি

আমাক যোগাযোগ কৰক API দস্তাবেজ