ওপেন সোর্স টেক্সট-টু-স্পিচ মডেল

আমাদের প্ল্যাটফর্মের প্রতিটি টিটিএস মডেল বাণিজ্যিকভাবে বন্ধুত্বপূর্ণ লাইসেন্সের সাথে উন্মুক্ত উৎস। এমআইটি, অ্যাপাচি ২. ০ - কোন মালিকানাধীন লক-ইন, কোন ব্যবহারের সীমাবদ্ধতা, কোন অপ্রত্যাশিত লাইসেন্সিং ফি। আমাদের হোস্ট করা এপিআই-এর মাধ্যমে তাদের ব্যবহার করুন, অথবা আপনার নিজস্ব অবকাঠামোতে সম্পূর্ণ নিয়ন্ত্রণের সাথে তাদের স্ব-হোস্ট করুন।

ওপেন সোর্স এমআইটি লাইসেন্স অ্যাপাচি স্বয়ংক্রিয় গিটহাব

এখন চেষ্টা করুন

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে
আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে
তৈরি করা হয়েছে
ডাউনলোড
TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

ওপেন সোর্স TTS সুবিধা

কেন উন্মুক্ত উৎস মডেল আপনার প্রকল্পের জন্য গুরুত্বপূর্ণ

সব উন্মুক্ত-সোর্স লাইসেন্সকৃত

TTS.ai-এর প্রত্যেকটি মডেল একটি অনুমোদিত উন্মুক্ত সোর্স লাইসেন্স ব্যবহার করে। কোন মালিকানাধীন ব্ল্যাকবক্স নেই, কোন বিক্রেতা লক-ইন নেই, কোন অপ্রত্যাশিত লাইসেন্সিং ফি নেই।

এম- আই- টি / অ্যাপাচি ২. ০

মডেলগুলো এমআইটি অথবা অ্যাপাচি ২.০ এর অধীনে লাইসেন্স করা হয়েছে, যা সবচেয়ে বেশি অনুমোদিত মুক্ত উৎস লাইসেন্স। বাণিজ্যিকভাবে ব্যবহার করুন, পরিবর্তন করুন, পুনরায় বিতরণ করুন - কোন নিষেধাজ্ঞা নেই।

স্বয়ংক্রিয়

যেকোন মডেল ডাউনলোড করুন এবং আপনার নিজের হার্ডওয়্যারে চালানোর জন্য এটি ব্যবহার করুন। আপনার ডাটা, লেটেন্সি এবং পরিকাঠামোর উপর সম্পূর্ণ নিয়ন্ত্রণ রাখুন। কোন ক্লাউড নির্ভরতা প্রয়োজন নেই।

GPU অপটিমাইজড

মডেলগুলো CUDA সমর্থন সহ NVIDIA GPUs এর জন্য অপটিমাইজ করা হয়েছে। পাইপার শুধুমাত্র CPU-এ চলবে। অধিকাংশ মডেলের জন্য দক্ষ অনুমানের জন্য ২-৮GB VRAM প্রয়োজন।

সম্প্রদায় রক্ষণাবেক্ষণ করা হচ্ছে

সক্রিয় উন্মুক্ত উৎস সম্প্রদায় এই মডেলগুলি রক্ষণাবেক্ষণ এবং উন্নত করে। অবদান স্বাগতম - বাগ, উন্নতি এবং নতুন কণ্ঠস্বর গিটহাবে জমা দিন।

বাণিজ্যিক ব্যবহার ঠিক আছে

সকল মডেল তাদের লাইসেন্সের অধীনে বাণিজ্যিক ব্যবহারের অনুমতি প্রদান করে। কোন রয়্যালটি বা ব্যবহার ফি ছাড়াই পণ্য তৈরি, পরিষেবা বিক্রি এবং বাণিজ্যিক বিষয়বস্তু তৈরি করুন।

আমাদের মুক্ত উৎস মডেল ক্যাটালগ

প্রত্যেক মডেল, তার লাইসেন্স, এবং সে সবচেয়ে ভাল কি করে

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

সর্বোত্তম: আপাচি ২. ০ — সর্বোচ্চ গুণমানের বিনামূল্যে মডেল, ৮২M পরামিতি, সহজ স্ব-হোস্ট

চেষ্টা করো Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

সর্বোত্তম: MIT — কেবল সিপিইউ, প্রান্তের ডিভাইস এবং অন্তর্ভুক্ত স্বয়ংক্রিয় হোস্টিং-এর জন্য উপযুক্ত

চেষ্টা করো Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

সর্বোত্তম: এমআইটি — অনেক ডাউনস্ট্রিম মডেল দ্বারা ব্যবহৃত ভিত্তি স্থাপত্য

চেষ্টা করো VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সর্বোত্তম: এমআইটি — আদর্শ TTS এর বাইরে অনন্য অডিও উৎপাদন ক্ষমতা

চেষ্টা করো Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 ভয়েস ক্লোন

সর্বোত্তম: আপাচি ২. ০ — সর্বোচ্চ গুণমান, ব্যাপকভাবে অধ্যয়ন রেফারেন্স বাস্তবায়ন

চেষ্টা করো Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 ভয়েস ক্লোন

সর্বোত্তম: MIT — মুক্ত উৎস কণিকা স্টাইল নিয়ন্ত্রণ সঙ্গে ভয়েস ক্লোনিং

চেষ্টা করো OpenVoice

কিভাবে ওপেন সোর্স TTS ব্যবহার করবেন

আমাদের হোস্ট করা API ব্যবহার করুন অথবা নিজেই মডেল চালান

1

উন্মুক্ত উৎস মডেল অনুসন্ধান করুন

২০+ উন্মুক্ত উৎস TTS মডেলের আমাদের ক্যাটালগ ব্রাউজ করুন। প্রতিটি মডেল পৃষ্ঠা লাইসেন্স, স্থাপত্য, ক্ষমতা এবং স্ব-হোস্টিং প্রয়োজনীয়তা প্রদর্শন করে।

2

আপনার ব্রাউজার- এ চেষ্টা করুন

কোন কিছু ইনস্টল না করে TTS.ai-এ যে কোন মডেল সরাসরি পরীক্ষা করুন। আমাদের GPU সার্ভার প্রক্রিয়াকরণ পরিচালনা করে যাতে আপনি স্ব-হোস্টিং করার আগে গুণমান মূল্যায়ন করতে পারেন।

3

স্ব-হোস্ট অথবা আমাদের API ব্যবহার করুন

GitHub থেকে ক্লোন মডেল রেপো এবং স্থানীয়ভাবে চালানো, অথবা উৎপাদনের জন্য আমাদের হোস্ট করা API ব্যবহার করুন। স্ব-হোস্টিং সম্পূর্ণ নিয়ন্ত্রণ প্রদান করে; আমাদের API পরিচালিত অবকাঠামো প্রদান করে।

4

আপনার অ্যাপ্লিকেশন তৈরি করুন

আপনার পণ্যটিতে TTS একীভূত করুন স্ব-হোস্ট মডেল বা আমাদের REST API ব্যবহার করে। সব মডেল বাণিজ্যিকভাবে ব্যবহারযোগ্য কোন লাইসেন্স ফি বা রাইটস ছাড়াই।

লাইসেন্সের তুলনা

TTS.ai এর সব মডেল বাণিজ্যিকভাবে বন্ধুত্বপূর্ণ উন্মুক্ত উৎস লাইসেন্স ব্যবহার করে

মডেল লাইসেন্স বাণিজ্যিক ব্যবহার পরিবর্তন স্ব- হোস্ট বরাদ্দ
Kokoro Apache 2.0 আবশ্যক
Piper MIT বৈকল্পিক
VITS MIT বৈকল্পিক
MeloTTS MIT বৈকল্পিক
Chatterbox MIT বৈকল্পিক
Tortoise TTS Apache 2.0 আবশ্যক
StyleTTS 2 MIT বৈকল্পিক
OpenVoice MIT বৈকল্পিক
Sesame CSM Apache 2.0 আবশ্যক
Orpheus Llama 3.2 "Built with Llama"

স্ব-হোস্টিং বনাম হোস্ট করা API

মডেল নিজেই চালাও অথবা আমাদেরকে পরিকাঠামোর ব্যবস্থাপনা করতে দিন

আপনার হার্ডওয়্যারে স্বয়ংক্রিয় হোস্ট

TTS.ai এর প্রত্যেকটি মডেল গিথহাব অথবা হ্যাগিং ফেস এর ওপেন সোর্স প্রকল্প হিসেবে উপলব্ধ। ওজন ডাউনলোড করুন, নির্ভরশীলতা ইনস্টল করুন, এবং আপনার নিজস্ব GPUs এর উপর অনুমান চালান। আপনি latency, গোপনীয়তা এবং স্কেলিং এর উপর সম্পূর্ণ নিয়ন্ত্রণ রাখেন।

  • সম্পূর্ণ ডাটা গোপনীয়তা — অডিও কখনোই আপনার সার্ভার ত্যাগ করে না
  • প্রাথমিক সেটআপের পরে প্রতি-আবেদন খরচ নেই
  • আপনার নিজের তথ্যের উপর স্বনির্ধারিত ফিন-টুইন
  • GPU হার্ডওয়্যার প্রয়োজন (NVIDIA সুপারিশ করা হয়)
  • আপনি আপডেট, স্কেলিং এবং নির্ভরশীলতা পরিচালনা করেন

TTS.ai হোস্ট করা API ব্যবহার করো

একক REST API এর মাধ্যমে ২০+ মডেলের জন্য তাৎক্ষণিক প্রবেশাধিকার পাবেন। আমরা GPU প্রদান, মডেল আপডেট, লাইন ব্যবস্থাপনা এবং স্কেলিং পরিচালনা করি। একটি API কী আপনাকে প্রতিটি মডেলে প্রবেশাধিকার প্রদান করে - পৃথকভাবে বিনিয়োগের ব্যবস্থাপনা করার প্রয়োজন নেই।

  • GPU হার্ডওয়্যারের প্রয়োজন নেই
  • একটি API দ্বারা সব 20+ মডেল
  • স্বয়ংক্রিয় মডেল আপডেট এবং উন্নতি
  • অতিরিক্ত অবকাঠামোর সাথে ৯৯.৯% আপটাইম
  • শুধুমাত্র আপনি যা ব্যবহার করেন তার জন্যই টাকা প্রদান করুন

জলদি শুরু: API অথবা Self- Host

আমাদের হোস্ট করা API ব্যবহার করুন, অথবা মিনিটগুলোতে Kokoro স্থানীয়ভাবে ইনস্টল করুন

অপশন ১: TTS.ai হোস্ট করা API খুবই সহজ
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
অপশন ২: পিপ সহ স্বয়ংক্রিয় হোস্ট সম্পূর্ণ নিয়ন্ত্রণ
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

মুক্ত উৎস, সস্তা মূল্য

আমাদের হোস্ট করা এপিআই মুক্ত উৎস টিটিএস ব্যবহারযোগ্য করে তোলে জিপিইউ পরিচালনা না করেই।

মুক্ত স্তর

$0

সাইন আপ ৫০ ক্রেডিট

  • 4 উন্মুক্ত উৎস মডেল বিনামূল্যে
  • মৌলিক ব্যবহারের জন্য কোন নিবন্ধন নেই
  • বাণিজ্যিক ব্যবহার অনুমোদিত

আরম্ভকারী

$9

মাসে ৫০০ ক্রেডিট

  • সকল ২০+ উন্মুক্ত-সোর্স মডেল
  • শব্দের ক্লোন
  • API ব্যবহার

প্রফেসর

$29

২,০০০,০০০ অক্ষর/মাস

  • GPU প্রসেসিং- এর অগ্রাধিকার
  • সব প্রিমিয়াম মডেল
  • এন্টারপ্রাইজ সমর্থন
সম্পূর্ণ মূল্য দেখুন

প্রায়শ জিজ্ঞাসিত প্রশ্ন

মুক্ত উৎস টেক্সট-টু-স্পিকার সম্পর্কে সাধারণ প্রশ্ন

হ্যাঁ। TTS.ai-এর প্রতিটি মডেল একটি অনুমোদিত উন্মুক্ত উৎস লাইসেন্স ব্যবহার করে - MIT অথবা Apache ২.০। আমরা বিশেষভাবে নিষেধাজ্ঞামূলক লাইসেন্সের সাথে মডেলগুলিকে বাদ দিই (যেমন Coqui's CPML অথবা অবাণিজ্যিক CC-BY-NC)। আপনি প্রতিটি মডেলের লাইসেন্স এর GitHub রিপোজিটরিতে পরীক্ষা করতে পারেন।

উভয়ই বাণিজ্যিক ব্যবহার, পরিবর্তন এবং পুনঃবিতরণের অনুমতি প্রদানকারী অনুমোদনমূলক মুক্ত-সোর্স লাইসেন্স। অ্যাপাচি ২.০ স্পষ্টভাবে পেটেন্ট অনুমোদন যোগ করে এবং আপনি কোড পরিবর্তন করলে পরিবর্তনগুলি উল্লেখ করার প্রয়োজন হয়। এমআইটি কম প্রয়োজনীয়তার সাথে সহজ। উভয়ই ব্যবসা-বান্ধব।

হ্যাঁ। প্রত্যেক মডেল স্ব-হোস্ট করা যেতে পারে। GitHub থেকে মডেল রিপোজিটরি ক্লোন করুন, নির্ভরতা ইনস্টল করুন, মডেল ওজন ডাউনলোড করুন এবং অনুমান চালানো। আমরা প্রত্যেক মডেলের স্ব-হোস্টিং প্রয়োজনীয়তা সহ GPU, RAM এবং Python সংস্করণের জন্য নথিভুক্ত করি।

মডেল অনুযায়ী প্রয়োজনীয়তা ভিন্ন হতে পারে। পাইপার-এর জন্য কোন GPU প্রয়োজন নয় (শুধুমাত্র CPU)। কোকোরো এবং মেলোটিটিএস-এর জন্য ১-২GB VRAM প্রয়োজন। অধিকাংশ প্রমিত মডেলের জন্য ৪GB VRAM প্রয়োজন। টর্টোইজ এবং সেসাম সিএসএম-এর জন্য ৮GB প্রয়োজন। NVIDIA RTX 3060 (১২GB) বেশিরভাগ মডেলকে আরামদায়কভাবে চালাতে পারে।

হ্যাঁ। উন্মুক্ত সোর্স লাইসেন্সের মাধ্যমে ফাইন-টিউনিং সহকারে পরিবর্তন করা যাবে। GPT-SoVITS এবং Bark-এর মতো মডেল ফাইন-টিউনিং স্ক্রিপ্ট প্রদান করে। আপনি আপনার নিজস্ব কন্ঠ তথ্যের উপর মডেল প্রশিক্ষণ দিতে পারেন স্বনির্বাচিত কন্ঠ তৈরি করতে অথবা নির্দিষ্ট ভাষার জন্য কার্যকারিতা উন্নত করতে।

শীর্ষ ওপেন সোর্স মডেল (কোকোরো, স্টাইলটিটিএস ২, চ্যাটার্বক্স) এখন বাণিজ্যিক পরিষেবা যেমন ইলেভেনল্যাবস এবং গুগল টিটিএসের সাথে মানানসই বা তার চেয়েও ভালো। বাণিজ্যিক পরিষেবার প্রধান সুবিধা হচ্ছে পরিচালিত পরিকাঠামো এবং সমর্থন, অডিও গুণমান নয়।

আমরা তাদেরকে ইতোমধ্যে বাদ দিয়েছি। XTTS/XTTS-v2 (Coqui's CPML — অবাণিজ্যিক), F5-TTS (CC-BY-NC — অবাণিজ্যিক), এবং Higgs-v2 (বোসন লাইসেন্স — সংরক্ষিত) সবগুলোই অপসারণ করা হয়েছে। TTS.ai-এর প্রতিটি মডেল বাণিজ্যিক ব্যবহারের জন্য নিরাপদ বলে প্রমাণিত হয়েছে।

হ্যাঁ। বেশিরভাগ মডেল GitHub-এর মাধ্যমে সম্প্রদায়ের অবদান গ্রহণ করে। আপনি বাগ রিপোর্ট, নতুন ভাষার জন্য শব্দ রেকর্ডিং, কোড উন্নতি এবং নথিপত্র জমা দিতে পারেন। প্রত্যেক মডেলের GitHub রিপোজিটরিতে অবদান নির্দেশিকা এবং সক্রিয় সমস্যার জন্য পরীক্ষা করুন।

চাহিদা অনুযায়ী মডেল লোড করুন এবং GPU মেমরি শেয়ার করার জন্য নিষ্ক্রিয় অবস্থায় আনলোড করুন। আমাদের GPU সার্ভার গতিশীল লোড ব্যবহার করে 4x Tesla P40 (মোট 96GB VRAM)-এ ২০+ মডেল চালায়। স্ব-হোস্টিংয়ের জন্য, একটি ২৪GB GPU একই সময়ে ৩-৫টি মডেল পরিসেবা দিতে পারে।

অনেক মডেল অফিসিয়াল ডকার ছবি অথবা ডকফাইল প্রদান করে। একাধিক মডেল চালানোর জন্য, আপনি GPU অ্যাক্সেস করার জন্য এনভিডিএ কনটেইনার টুলকিট সহ একটি স্বনির্ধারিত ডকার সেটআপ তৈরি করতে পারেন। আমাদের API সার্ভার স্থাপত্য একটি রেফারেন্স বাস্তবায়ন হিসাবে কাজ করতে পারে।

বেশিরভাগ মডেলের জন্য পাইথন ৩.১০-৩.১২ প্রয়োজন। Coqui TTS (VITS)-এর জন্য বিশেষভাবে পাইথন ৩.১১ প্রয়োজন। বেশিরভাগ মডেলের জন্য পাইথন ৩.১২ সুপারিশ করা হয়। সঠিক সংস্করণের জন্য প্রত্যেক মডেলের requirements.txt পরীক্ষা করুন।

হ্যাঁ। এমআইটি এবং অ্যাপাচি ২.০ লাইসেন্স স্পষ্টভাবে বাণিজ্যিক ব্যবহারের অনুমতি দেয়। আপনি এই মডেল ব্যবহার করে SaaS পণ্য, মোবাইল অ্যাপস, গেম এবং পরিষেবা তৈরি করতে পারেন, লাইসেন্স ফি, রাইটস বা অনুমোদনের প্রয়োজন ছাড়াই (যদিও অনুমোদন প্রশংসিত)।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

আজ মুক্ত উৎস TTS চেষ্টা করুন

২০+ উন্মুক্ত উৎস মডেল, সবগুলোই বাণিজ্যিকভাবে লাইসেন্সপ্রাপ্ত। আমাদের অ্যাপআই ব্যবহার করুন অথবা স্বয়ংক্রিয়ভাবে হোস্ট করুন - পছন্দ আপনার।