ওপেন সোর্স টেক্সট-টু-স্পিচ মডেল

আমাদের প্ল্যাটফর্মের প্রতিটি টিটিএস মডেল বাণিজ্যিকভাবে বন্ধুত্বপূর্ণ লাইসেন্সের সাথে উন্মুক্ত উৎস। এমআইটি, অ্যাপাচি ২. ০ - কোন মালিকানাধীন লক-ইন, কোন ব্যবহারের সীমাবদ্ধতা, কোন অপ্রত্যাশিত লাইসেন্সিং ফি। আমাদের হোস্ট করা এপিআই-এর মাধ্যমে তাদের ব্যবহার করুন, অথবা আপনার নিজস্ব অবকাঠামোতে সম্পূর্ণ নিয়ন্ত্রণের সাথে তাদের স্ব-হোস্ট করুন।

ওপেন সোর্স এমআইটি লাইসেন্স অ্যাপাচি স্বয়ংক্রিয় গিটহাব

সম্পূর্ণ TTS সম্পাদক API ডকুমেন্টেশন

এখন চেষ্টা করুন

0/500

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে

আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে

সম্পূর্ণ TTS সম্পাদক খোলো

ওপেন সোর্স TTS সুবিধা

কেন উন্মুক্ত উৎস মডেল আপনার প্রকল্পের জন্য গুরুত্বপূর্ণ

সব উন্মুক্ত-সোর্স লাইসেন্সকৃত

TTS.ai-এর প্রত্যেকটি মডেল একটি অনুমোদিত উন্মুক্ত সোর্স লাইসেন্স ব্যবহার করে। কোন মালিকানাধীন ব্ল্যাকবক্স নেই, কোন বিক্রেতা লক-ইন নেই, কোন অপ্রত্যাশিত লাইসেন্সিং ফি নেই।

এম- আই- টি / অ্যাপাচি ২. ০

মডেলগুলো এমআইটি অথবা অ্যাপাচি ২.০ এর অধীনে লাইসেন্স করা হয়েছে, যা সবচেয়ে বেশি অনুমোদিত মুক্ত উৎস লাইসেন্স। বাণিজ্যিকভাবে ব্যবহার করুন, পরিবর্তন করুন, পুনরায় বিতরণ করুন - কোন নিষেধাজ্ঞা নেই।

স্বয়ংক্রিয়

যেকোন মডেল ডাউনলোড করুন এবং আপনার নিজের হার্ডওয়্যারে চালানোর জন্য এটি ব্যবহার করুন। আপনার ডাটা, লেটেন্সি এবং পরিকাঠামোর উপর সম্পূর্ণ নিয়ন্ত্রণ রাখুন। কোন ক্লাউড নির্ভরতা প্রয়োজন নেই।

GPU অপটিমাইজড

মডেলগুলো CUDA সমর্থন সহ NVIDIA GPUs এর জন্য অপটিমাইজ করা হয়েছে। পাইপার শুধুমাত্র CPU-এ চলবে। অধিকাংশ মডেলের জন্য দক্ষ অনুমানের জন্য ২-৮GB VRAM প্রয়োজন।

সম্প্রদায় রক্ষণাবেক্ষণ করা হচ্ছে

সক্রিয় উন্মুক্ত উৎস সম্প্রদায় এই মডেলগুলি রক্ষণাবেক্ষণ এবং উন্নত করে। অবদান স্বাগতম - বাগ, উন্নতি এবং নতুন কণ্ঠস্বর গিটহাবে জমা দিন।

বাণিজ্যিক ব্যবহার ঠিক আছে

সকল মডেল তাদের লাইসেন্সের অধীনে বাণিজ্যিক ব্যবহারের অনুমতি প্রদান করে। কোন রয়্যালটি বা ব্যবহার ফি ছাড়াই পণ্য তৈরি, পরিষেবা বিক্রি এবং বাণিজ্যিক বিষয়বস্তু তৈরি করুন।

আমাদের মুক্ত উৎস মডেল ক্যাটালগ

প্রত্যেক মডেল, তার লাইসেন্স, এবং সে সবচেয়ে ভাল কি করে

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

স্থায়ী 5/5

সর্বোত্তম: আপাচি ২. ০ — সর্বোচ্চ গুণমানের বিনামূল্যে মডেল, ৮২M পরামিতি, সহজ স্ব-হোস্ট

চেষ্টা করো Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

স্থায়ী 3/5

সর্বোত্তম: MIT — কেবল সিপিইউ, প্রান্তের ডিভাইস এবং অন্তর্ভুক্ত স্বয়ংক্রিয় হোস্টিং-এর জন্য উপযুক্ত

চেষ্টা করো Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

স্থায়ী 3/5

সর্বোত্তম: এমআইটি — অনেক ডাউনস্ট্রিম মডেল দ্বারা ব্যবহৃত ভিত্তি স্থাপত্য

চেষ্টা করো VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ধীর 4/5

সর্বোত্তম: এমআইটি — আদর্শ TTS এর বাইরে অনন্য অডিও উৎপাদন ক্ষমতা

চেষ্টা করো Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

ধীর 5/5 ভয়েস ক্লোন

সর্বোত্তম: আপাচি ২. ০ — সর্বোচ্চ গুণমান, ব্যাপকভাবে অধ্যয়ন রেফারেন্স বাস্তবায়ন

চেষ্টা করো Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

মধ্যম 4/5 ভয়েস ক্লোন

সর্বোত্তম: MIT — মুক্ত উৎস কণিকা স্টাইল নিয়ন্ত্রণ সঙ্গে ভয়েস ক্লোনিং

চেষ্টা করো OpenVoice

কিভাবে ওপেন সোর্স TTS ব্যবহার করবেন

আমাদের হোস্ট করা API ব্যবহার করুন অথবা নিজেই মডেল চালান

উন্মুক্ত উৎস মডেল অনুসন্ধান করুন

২০+ উন্মুক্ত উৎস TTS মডেলের আমাদের ক্যাটালগ ব্রাউজ করুন। প্রতিটি মডেল পৃষ্ঠা লাইসেন্স, স্থাপত্য, ক্ষমতা এবং স্ব-হোস্টিং প্রয়োজনীয়তা প্রদর্শন করে।

আপনার ব্রাউজার- এ চেষ্টা করুন

কোন কিছু ইনস্টল না করে TTS.ai-এ যে কোন মডেল সরাসরি পরীক্ষা করুন। আমাদের GPU সার্ভার প্রক্রিয়াকরণ পরিচালনা করে যাতে আপনি স্ব-হোস্টিং করার আগে গুণমান মূল্যায়ন করতে পারেন।

স্ব-হোস্ট অথবা আমাদের API ব্যবহার করুন

GitHub থেকে ক্লোন মডেল রেপো এবং স্থানীয়ভাবে চালানো, অথবা উৎপাদনের জন্য আমাদের হোস্ট করা API ব্যবহার করুন। স্ব-হোস্টিং সম্পূর্ণ নিয়ন্ত্রণ প্রদান করে; আমাদের API পরিচালিত অবকাঠামো প্রদান করে।

আপনার অ্যাপ্লিকেশন তৈরি করুন

আপনার পণ্যটিতে TTS একীভূত করুন স্ব-হোস্ট মডেল বা আমাদের REST API ব্যবহার করে। সব মডেল বাণিজ্যিকভাবে ব্যবহারযোগ্য কোন লাইসেন্স ফি বা রাইটস ছাড়াই।

লাইসেন্সের তুলনা

TTS.ai এর সব মডেল বাণিজ্যিকভাবে বন্ধুত্বপূর্ণ উন্মুক্ত উৎস লাইসেন্স ব্যবহার করে

মডেল	লাইসেন্স	বরাদ্দ
Kokoro	Apache 2.0	আবশ্যক
Piper	MIT	বৈকল্পিক
VITS	MIT	বৈকল্পিক
MeloTTS	MIT	বৈকল্পিক
Chatterbox	MIT	বৈকল্পিক
Tortoise TTS	Apache 2.0	আবশ্যক
StyleTTS 2	MIT	বৈকল্পিক
OpenVoice	MIT	বৈকল্পিক
Sesame CSM	Apache 2.0	আবশ্যক
Orpheus	Llama 3.2	"Built with Llama"

এই মডেলগুলি বিনামূল্যে চেষ্টা করুন

স্ব-হোস্টিং বনাম হোস্ট করা API

মডেল নিজেই চালাও অথবা আমাদেরকে পরিকাঠামোর ব্যবস্থাপনা করতে দিন

আপনার হার্ডওয়্যারে স্বয়ংক্রিয় হোস্ট

TTS.ai এর প্রত্যেকটি মডেল গিথহাব অথবা হ্যাগিং ফেস এর ওপেন সোর্স প্রকল্প হিসেবে উপলব্ধ। ওজন ডাউনলোড করুন, নির্ভরশীলতা ইনস্টল করুন, এবং আপনার নিজস্ব GPUs এর উপর অনুমান চালান। আপনি latency, গোপনীয়তা এবং স্কেলিং এর উপর সম্পূর্ণ নিয়ন্ত্রণ রাখেন।

সম্পূর্ণ ডাটা গোপনীয়তা — অডিও কখনোই আপনার সার্ভার ত্যাগ করে না
প্রাথমিক সেটআপের পরে প্রতি-আবেদন খরচ নেই
আপনার নিজের তথ্যের উপর স্বনির্ধারিত ফিন-টুইন
GPU হার্ডওয়্যার প্রয়োজন (NVIDIA সুপারিশ করা হয়)
আপনি আপডেট, স্কেলিং এবং নির্ভরশীলতা পরিচালনা করেন

TTS.ai হোস্ট করা API ব্যবহার করো

একক REST API এর মাধ্যমে ২০+ মডেলের জন্য তাৎক্ষণিক প্রবেশাধিকার পাবেন। আমরা GPU প্রদান, মডেল আপডেট, লাইন ব্যবস্থাপনা এবং স্কেলিং পরিচালনা করি। একটি API কী আপনাকে প্রতিটি মডেলে প্রবেশাধিকার প্রদান করে - পৃথকভাবে বিনিয়োগের ব্যবস্থাপনা করার প্রয়োজন নেই।

GPU হার্ডওয়্যারের প্রয়োজন নেই
একটি API দ্বারা সব 20+ মডেল
স্বয়ংক্রিয় মডেল আপডেট এবং উন্নতি
অতিরিক্ত অবকাঠামোর সাথে ৯৯.৯% আপটাইম
শুধুমাত্র আপনি যা ব্যবহার করেন তার জন্যই টাকা প্রদান করুন

এর পরিবর্তে হোস্ট করা API ব্যবহার করো

জলদি শুরু: API অথবা Self- Host

আমাদের হোস্ট করা API ব্যবহার করুন, অথবা মিনিটগুলোতে Kokoro স্থানীয়ভাবে ইনস্টল করুন

অপশন ১: TTS.ai হোস্ট করা API খুবই সহজ

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

অপশন ২: পিপ সহ স্বয়ংক্রিয় হোস্ট সম্পূর্ণ নিয়ন্ত্রণ

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API নথিপত্র প্রদর্শন

মুক্ত উৎস, সস্তা মূল্য

আমাদের হোস্ট করা এপিআই মুক্ত উৎস টিটিএস ব্যবহারযোগ্য করে তোলে জিপিইউ পরিচালনা না করেই।

মুক্ত স্তর

সাইন আপ ৫০ ক্রেডিট

4 উন্মুক্ত উৎস মডেল বিনামূল্যে
মৌলিক ব্যবহারের জন্য কোন নিবন্ধন নেই
বাণিজ্যিক ব্যবহার অনুমোদিত

আরম্ভকারী

মাসে ৫০০ ক্রেডিট

সকল ২০+ উন্মুক্ত-সোর্স মডেল
শব্দের ক্লোন
API ব্যবহার

প্রফেসর

$29

২,০০০,০০০ অক্ষর/মাস

GPU প্রসেসিং- এর অগ্রাধিকার
সব প্রিমিয়াম মডেল
এন্টারপ্রাইজ সমর্থন

সম্পূর্ণ মূল্য দেখুন

প্রায়শ জিজ্ঞাসিত প্রশ্ন

মুক্ত উৎস টেক্সট-টু-স্পিকার সম্পর্কে সাধারণ প্রশ্ন

হ্যাঁ। TTS.ai-এর প্রতিটি মডেল একটি অনুমোদিত উন্মুক্ত উৎস লাইসেন্স ব্যবহার করে - MIT অথবা Apache ২.০। আমরা বিশেষভাবে নিষেধাজ্ঞামূলক লাইসেন্সের সাথে মডেলগুলিকে বাদ দিই (যেমন Coqui's CPML অথবা অবাণিজ্যিক CC-BY-NC)। আপনি প্রতিটি মডেলের লাইসেন্স এর GitHub রিপোজিটরিতে পরীক্ষা করতে পারেন।

উভয়ই বাণিজ্যিক ব্যবহার, পরিবর্তন এবং পুনঃবিতরণের অনুমতি প্রদানকারী অনুমোদনমূলক মুক্ত-সোর্স লাইসেন্স। অ্যাপাচি ২.০ স্পষ্টভাবে পেটেন্ট অনুমোদন যোগ করে এবং আপনি কোড পরিবর্তন করলে পরিবর্তনগুলি উল্লেখ করার প্রয়োজন হয়। এমআইটি কম প্রয়োজনীয়তার সাথে সহজ। উভয়ই ব্যবসা-বান্ধব।

হ্যাঁ। প্রত্যেক মডেল স্ব-হোস্ট করা যেতে পারে। GitHub থেকে মডেল রিপোজিটরি ক্লোন করুন, নির্ভরতা ইনস্টল করুন, মডেল ওজন ডাউনলোড করুন এবং অনুমান চালানো। আমরা প্রত্যেক মডেলের স্ব-হোস্টিং প্রয়োজনীয়তা সহ GPU, RAM এবং Python সংস্করণের জন্য নথিভুক্ত করি।

মডেল অনুযায়ী প্রয়োজনীয়তা ভিন্ন হতে পারে। পাইপার-এর জন্য কোন GPU প্রয়োজন নয় (শুধুমাত্র CPU)। কোকোরো এবং মেলোটিটিএস-এর জন্য ১-২GB VRAM প্রয়োজন। অধিকাংশ প্রমিত মডেলের জন্য ৪GB VRAM প্রয়োজন। টর্টোইজ এবং সেসাম সিএসএম-এর জন্য ৮GB প্রয়োজন। NVIDIA RTX 3060 (১২GB) বেশিরভাগ মডেলকে আরামদায়কভাবে চালাতে পারে।

হ্যাঁ। উন্মুক্ত সোর্স লাইসেন্সের মাধ্যমে ফাইন-টিউনিং সহকারে পরিবর্তন করা যাবে। GPT-SoVITS এবং Bark-এর মতো মডেল ফাইন-টিউনিং স্ক্রিপ্ট প্রদান করে। আপনি আপনার নিজস্ব কন্ঠ তথ্যের উপর মডেল প্রশিক্ষণ দিতে পারেন স্বনির্বাচিত কন্ঠ তৈরি করতে অথবা নির্দিষ্ট ভাষার জন্য কার্যকারিতা উন্নত করতে।

শীর্ষ ওপেন সোর্স মডেল (কোকোরো, স্টাইলটিটিএস ২, চ্যাটার্বক্স) এখন বাণিজ্যিক পরিষেবা যেমন ইলেভেনল্যাবস এবং গুগল টিটিএসের সাথে মানানসই বা তার চেয়েও ভালো। বাণিজ্যিক পরিষেবার প্রধান সুবিধা হচ্ছে পরিচালিত পরিকাঠামো এবং সমর্থন, অডিও গুণমান নয়।

আমরা তাদেরকে ইতোমধ্যে বাদ দিয়েছি। XTTS/XTTS-v2 (Coqui's CPML — অবাণিজ্যিক), F5-TTS (CC-BY-NC — অবাণিজ্যিক), এবং Higgs-v2 (বোসন লাইসেন্স — সংরক্ষিত) সবগুলোই অপসারণ করা হয়েছে। TTS.ai-এর প্রতিটি মডেল বাণিজ্যিক ব্যবহারের জন্য নিরাপদ বলে প্রমাণিত হয়েছে।

হ্যাঁ। বেশিরভাগ মডেল GitHub-এর মাধ্যমে সম্প্রদায়ের অবদান গ্রহণ করে। আপনি বাগ রিপোর্ট, নতুন ভাষার জন্য শব্দ রেকর্ডিং, কোড উন্নতি এবং নথিপত্র জমা দিতে পারেন। প্রত্যেক মডেলের GitHub রিপোজিটরিতে অবদান নির্দেশিকা এবং সক্রিয় সমস্যার জন্য পরীক্ষা করুন।

চাহিদা অনুযায়ী মডেল লোড করুন এবং GPU মেমরি শেয়ার করার জন্য নিষ্ক্রিয় অবস্থায় আনলোড করুন। আমাদের GPU সার্ভার গতিশীল লোড ব্যবহার করে 4x Tesla P40 (মোট 96GB VRAM)-এ ২০+ মডেল চালায়। স্ব-হোস্টিংয়ের জন্য, একটি ২৪GB GPU একই সময়ে ৩-৫টি মডেল পরিসেবা দিতে পারে।

অনেক মডেল অফিসিয়াল ডকার ছবি অথবা ডকফাইল প্রদান করে। একাধিক মডেল চালানোর জন্য, আপনি GPU অ্যাক্সেস করার জন্য এনভিডিএ কনটেইনার টুলকিট সহ একটি স্বনির্ধারিত ডকার সেটআপ তৈরি করতে পারেন। আমাদের API সার্ভার স্থাপত্য একটি রেফারেন্স বাস্তবায়ন হিসাবে কাজ করতে পারে।

বেশিরভাগ মডেলের জন্য পাইথন ৩.১০-৩.১২ প্রয়োজন। Coqui TTS (VITS)-এর জন্য বিশেষভাবে পাইথন ৩.১১ প্রয়োজন। বেশিরভাগ মডেলের জন্য পাইথন ৩.১২ সুপারিশ করা হয়। সঠিক সংস্করণের জন্য প্রত্যেক মডেলের requirements.txt পরীক্ষা করুন।

হ্যাঁ। এমআইটি এবং অ্যাপাচি ২.০ লাইসেন্স স্পষ্টভাবে বাণিজ্যিক ব্যবহারের অনুমতি দেয়। আপনি এই মডেল ব্যবহার করে SaaS পণ্য, মোবাইল অ্যাপস, গেম এবং পরিষেবা তৈরি করতে পারেন, লাইসেন্স ফি, রাইটস বা অনুমোদনের প্রয়োজন ছাড়াই (যদিও অনুমোদন প্রশংসিত)।

5.0/5 (1)

আজ মুক্ত উৎস TTS চেষ্টা করুন

২০+ উন্মুক্ত উৎস মডেল, সবগুলোই বাণিজ্যিকভাবে লাইসেন্সপ্রাপ্ত। আমাদের অ্যাপআই ব্যবহার করুন অথবা স্বয়ংক্রিয়ভাবে হোস্ট করুন - পছন্দ আপনার।

নিবন্ধন করুন মূল্য প্রদর্শন

ওপেন সোর্স টেক্সট-টু-স্পিচ মডেল

এখন চেষ্টা করুন

TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

ওপেন সোর্স TTS সুবিধা

সব উন্মুক্ত-সোর্স লাইসেন্সকৃত

এম- আই- টি / অ্যাপাচি ২. ০

স্বয়ংক্রিয়

GPU অপটিমাইজড

সম্প্রদায় রক্ষণাবেক্ষণ করা হচ্ছে

বাণিজ্যিক ব্যবহার ঠিক আছে

আমাদের মুক্ত উৎস মডেল ক্যাটালগ

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

কিভাবে ওপেন সোর্স TTS ব্যবহার করবেন

উন্মুক্ত উৎস মডেল অনুসন্ধান করুন

আপনার ব্রাউজার- এ চেষ্টা করুন

স্ব-হোস্ট অথবা আমাদের API ব্যবহার করুন

আপনার অ্যাপ্লিকেশন তৈরি করুন

লাইসেন্সের তুলনা

স্ব-হোস্টিং বনাম হোস্ট করা API

আপনার হার্ডওয়্যারে স্বয়ংক্রিয় হোস্ট

TTS.ai হোস্ট করা API ব্যবহার করো

জলদি শুরু: API অথবা Self- Host

মুক্ত উৎস, সস্তা মূল্য

মুক্ত স্তর

আরম্ভকারী

প্রফেসর

প্রায়শ জিজ্ঞাসিত প্রশ্ন

সকল TTS.ai মডেল কি সত্যিই মুক্ত উৎস?

এমআইটি এবং অ্যাপাচি ২. ০ লাইসেন্সের মধ্যে পার্থক্য কি?

আমি কি আমার নিজের সার্ভারে এই মডেলগুলো হোস্ট করতে পারি?

TTS মডেল স্বয়ংক্রিয়ভাবে হোস্ট করতে আমার কোন GPU প্রয়োজন?

আমি কি উন্মুক্ত উৎস TTS মডেলগুলিকে ফিন-টুইন করতে পারি?

বাণিজ্যিক পরিষেবার সাথে উন্মুক্ত উৎস টিটিএস মডেলের তুলনা কিভাবে করা যায়?

এমন কোন মডেল আছে কি যাদের লাইসেন্স সীমিত, যাদের থেকে আমার বিরত থাকা উচিত?

আমি কি এই উন্মুক্ত উৎস মডেলে অবদান রাখতে পারি?

একই GPU সার্ভারে একাধিক মডেল কিভাবে চালানো যায়?

স্ব-হোস্টিং এর জন্য কি কোন Docker ছবি আছে?

স্ব-হোস্টিং করার জন্য আমার কোন পাইথন সংস্করণের প্রয়োজন?

আমি কি এই মডেলগুলো ব্যবহার করে বাণিজ্যিক পণ্য তৈরি করতে পারি?

আজ মুক্ত উৎস TTS চেষ্টা করুন