মুক্ত উৎস টেক্সট-টু-স্পিচ মডেলName

আমাৰ প্লেটফৰ্মৰ প্ৰতিটো TTS মডেল বাণিজ্যিক-প্ৰিয় লাইচেঞ্চৰ সৈতে ওপেন সোর্স। MIT, Apache 2.0 — কোনো স্বত্বাধিকাৰী লক-ইন, কোনো ব্যৱহাৰৰ সীমাবদ্ধতা, কোনো অপ্ৰত্যাশিত লাইচেঞ্চিং ফি। আমাৰ হোস্ট কৰা APIৰ দ্বাৰা ইয়াক ব্যৱহাৰ কৰক, অথবা সম্পূৰ্ণ নিয়ন্ত্ৰণৰ সৈতে নিজস্ব আন্তঃগাঁথনিত ইয়াক স্ব-হোস্ট কৰক।

মুক্ত উৎস MIT অনুমতি আপাচি ২.০ স্ব-হোস্টযোগ্য GitHub

এতিয়া চেষ্টা কৰক

0/500
Kokoro, Piper, VITS, MeloTTS ৰ সৈতে মুক্ত
Your generated audio will appear here
সৃষ্টি কৰা হৈছে
0:00 0:00
ডাউনলোড কৰক
TTS.ai পছন্দ হৈছে? আপোনাৰ বন্ধুসকলক কওক!

মুক্ত উৎস TTS সুবিধাসমূহ

আপোনাৰ প্ৰকল্পৰ বাবে উন্মুক্ত উৎসৰ মডেলসমূহ কিয় গুৰুত্বপূৰ্ণ

সকলো মুক্ত উৎস লাইচেঞ্চিত

TTS.ai ৰ প্ৰতিটো মডেলে এটা অনুমতিমূলক উন্মুক্ত উৎসৰ লাইচেঞ্চ ব্যৱহাৰ কৰে। কোনো স্বত্বাধিকাৰী ব্লেক বক্স নাই, কোনো ভেণ্ডাৰ লক-ইন নাই, কোনো অপ্ৰত্যাশিত লাইচেঞ্চিং ফি নাই।

MIT / Apache ২.০

মডেলসমূহ MIT অথবা Apache 2.0 ৰ অধীনত লাইসেন্স কৰা হৈছে, যিটো সৰ্বাধিক অনুমোদিত উন্মুক্ত উৎসৰ লাইসেন্স। বাণিজ্যিকভাৱে ব্যৱহাৰ কৰক, পৰিবৰ্তন কৰক, পুনৰ বিতৰন কৰক — কোনো প্ৰতিবন্ধকতা নাই।

স্ব-হোস্টযোগ্য

যিকোনো মডেল ডাউনল'ড কৰক আৰু ইয়াক আপোনাৰ নিজস্ব হাৰ্ডৱেৰত চলাওক। আপোনাৰ তথ্য, লেটেন্সী আৰু আন্তঃগাঁথনিৰ ওপৰত সম্পূৰ্ণ নিয়ন্ত্ৰণ। কোনো ক্লাউড নিৰ্ভৰতাৰ প্ৰয়োজন নাই।

GPU অনুকূলিত

CUDA সমৰ্থনৰ সৈতে NVIDIA GPUs ৰ বাবে মডেলসমূহ অনুকূলিত কৰা হৈছে। Piper কেৱল CPU ত চলায়। অধিকাংশ মডেলৰ সক্ষম অনুমানৰ বাবে ২-৮GB VRAMৰ প্ৰয়োজন হয়।

সম্প্রদায়ৰ দ্বাৰা পৰিচালিত

সক্ৰিয় উন্মুক্ত উৎসৰ সম্প্রদায়সমূহে এই মডেলসমূহ ৰক্ষা আৰু উন্নত কৰে। সহায়কসকলক স্বাগতম - বাগসমূহ, উন্নতিসমূহ, আৰু GitHub ত নতুন কণ্ঠসমূহ জমা কৰক।

বাণিজ্যিক ব্যৱহাৰ ঠিক আছে

সকলো মডেলে তেওঁলোকৰ লাইচেঞ্চৰ অধীনত বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। ৰয়েলটি বা ব্যৱহাৰৰ ফিৰ নোহোৱাকৈ সামগ্ৰী নিৰ্মাণ কৰক, সেৱা বিক্ৰী কৰক, আৰু বাণিজ্যিক সামগ্ৰী সৃষ্টি কৰক।

আমাৰ মুক্ত উৎস মডেল তালিকা

প্ৰতিটো মডেল, তাৰ লাইচেঞ্চ, আৰু ই কি ভাল কৰে

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

সৰ্বোত্তম: Apache 2.0 — সৰ্বোত্তম গুণমানৰ বিনামূলীয়া মডেল, 82M পৰামিটাৰ, স্ব-হোস্ট কৰিবলে সহজ

চেষ্টা কৰক Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

সৰ্বোত্তম: MIT — কেৱল CPU, প্ৰান্তীয় ডিভাইচ আৰু অন্তৰ্ভুক্ত স্ব-হোস্টিংৰ বাবে সম্পূৰ্ণ

চেষ্টা কৰক Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

সৰ্বোত্তম: MIT — বহু ডাউনস্ট্ৰীম মডেল দ্বাৰা ব্যৱহৃত মৌলিক স্থাপত্য

চেষ্টা কৰক VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সৰ্বোত্তম: MIT — প্ৰমিত TTS ৰ বাহিৰ অনন্য অডিঅ' উৎপাদন ক্ষমতা

চেষ্টা কৰক Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 ধ্বনি ক্লোনিং

সৰ্বোত্তম: Apache 2.0 — সৰ্বোচ্চ গুণমান, ব্যাপকভাৱে অধ্যয়ন কৰা প্ৰতিনিধিত্ব প্ৰণয়ন

চেষ্টা কৰক Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 ধ্বনি ক্লোনিং

সৰ্বোত্তম: MIT — মুক্ত উৎসৰ কন্ঠ ক্লোনিং আৰু পাতল বিন্যাস নিয়ন্ত্ৰণ

চেষ্টা কৰক OpenVoice

কিদৰে মুক্ত উৎস TTS ব্যৱহাৰ কৰিব

আমাৰ হোস্ট কৰা API ব্যৱহাৰ কৰক অথবা মডেল নিজে চলাওক

1

মুক্ত উৎসৰ মডেল অনুসন্ধান কৰক

২০+ উন্মুক্ত উৎসৰ TTS মডেলৰ আমাৰ বৰ্ষপঞ্জি ব্ৰাউছ কৰক। প্ৰত্যেক মডেল পৃষ্ঠাত লাইচেঞ্চ, গঠন, ক্ষমতা আৰু স্ব-হোস্টিংৰ প্ৰয়োজনীয়তা প্ৰদৰ্শিত হয়।

2

আপোনাৰ ব্ৰাউছাৰত চেষ্টা কৰক

কোনো কিছু ইনস্টল নকৰি TTS.ai ত প্ৰত্যক্ষভাৱে যিকোনো মডেল পৰীক্ষা কৰক। আমাৰ GPU চাৰ্ভাৰে প্ৰক্ৰিয়াকৰণ ব্যৱস্থাপনা কৰে যাতে আপুনি স্ব-হোস্টিং কৰিবলৈ প্ৰতিশ্ৰুতি দিয়াৰ পূৰ্বে গুণমানৰ মূল্যায়ন কৰিব পাৰে।

3

স্ব-হোস্ট অথবা আমাৰ API ব্যৱহাৰ কৰক

GitHub ৰ পৰা মডেল repo ক্লোন কৰক আৰু স্থানীয়ভাৱে চলাওক, অথবা উৎপাদনৰ বাবে আমাৰ হোস্ট কৰা API ব্যৱহাৰ কৰক। স্ব-হোস্টিংয়ে সম্পূৰ্ণ নিয়ন্ত্ৰণ দিয়ে; আমাৰ API দ্বাৰা পৰিচালিত আন্তঃগাঁথনি প্ৰদান কৰা হয়।

4

আপোনাৰ অনুপ্ৰয়োগ নিৰ্মাণ কৰক

স্ব-হোস্ট কৰা মডেল অথবা আমাৰ REST API ব্যৱহাৰ কৰি আপোনাৰ উৎপাদনত TTS অন্তৰ্ভুক্ত কৰক। সকলো মডেল লাইচেঞ্চিং ফি বা ৰয়েলটি নোহোৱাকৈ বাণিজ্যিকভাৱে ব্যৱহাৰযোগ্য।

লাইচেঞ্চৰ তুলনা

TTS.ai ৰ সকলো মডেল বাণিজ্যিকভাৱে বন্ধুত্বপূৰ্ণ উন্মুক্ত উৎসৰ লাইচেঞ্চ ব্যৱহাৰ কৰে

আৰ্হি প্ৰমাণপত্ৰ বাণিজ্যিক ব্যৱহাৰ পৰিবৰ্তন স্ব-গৃহস্থ স্বীকৃতি
Kokoro Apache 2.0 প্ৰয়োজনীয়
Piper MIT বৈকল্পিক
VITS MIT বৈকল্পিক
MeloTTS MIT বৈকল্পিক
Chatterbox MIT বৈকল্পিক
Tortoise TTS Apache 2.0 প্ৰয়োজনীয়
StyleTTS 2 MIT বৈকল্পিক
OpenVoice MIT বৈকল্পিক
Sesame CSM Apache 2.0 প্ৰয়োজনীয়
Orpheus Llama 3.2 "Built with Llama"

স্ব-হোস্টিং vs হোস্ট কৰা API

মডেল নিজেই চলাওক অথবা আন্তঃগাঁথনি ব্যৱস্থাপনা কৰিবলৈ আমাক দিয়ক

আপোনাৰ হাৰ্ডৱেৰত Self-Host

TTS.ai ৰ প্ৰতিটো মডেল GitHub অথবা Hugging Face ত এটা ওপেন-সোর্স প্ৰকল্প হিচাপে উপলব্ধ। ওজন ডাউনলোড কৰক, নিৰ্ভৰতাসমূহ ইনস্টল কৰক, আৰু আপোনাৰ নিজস্ব GPUs ত অনুমান চলাওক। আপোনাৰ লেটেন্সী, গোপনীয়তা, আৰু স্কেলিঙৰ ওপৰত সম্পূৰ্ণ নিয়ন্ত্ৰণ আছে।

  • সম্পূৰ্ণ তথ্য গোপনীয়তা — অডিঅ' কখনোই আপোনাৰ চাৰ্ভাৰ ত্যাগ নকৰে
  • প্ৰাৰম্ভিক স্থাপনাৰ পিছত প্ৰতি-আবেদনৰ কোনো ব্যয় নাই
  • আপোনাৰ নিজস্ব তথ্যত স্বনিৰ্বাচিত ফাইন-টুইনিং
  • GPU হাৰ্ডৱেৰৰ প্ৰয়োজন (NVIDIA ৰ পৰামৰ্শ কৰা হয়)
  • আপডেইট, স্কেলিং আৰু নিৰ্ভৰতাসমূহ পৰিচালনা কৰক

TTS.ai হোস্ট কৰা API ব্যৱহাৰ কৰক

একক REST APIৰ জৰিয়তে সকলো 24+ মডেললৈ তাৎক্ষণিকভাৱে প্ৰৱেশ কৰক। আমি GPU প্ৰদান, মডেল আপডেট, লাইন ব্যৱস্থাপনা আৰু স্কেলিং ব্যৱস্থাপনা কৰোঁ। এটা API চাবি আপুনি প্ৰতিটো মডেললৈ প্ৰৱেশ কৰিব পাৰে - পৃথক বিকাশ ব্যৱস্থাপনা কৰাৰ প্ৰয়োজন নাই।

  • GPU হাৰ্ডৱেৰৰ প্ৰয়োজন নাই
  • এটা APIৰ দ্বাৰা সকলো 24+ মডেল
  • স্বয়ংক্ৰিয় মডেল আপডেইট আৰু উন্নয়ন
  • অতিৰিক্ত আন্তঃগাঁথনিৰ সৈতে ৯৯.৯% আপটাইম
  • আপুনি যি ব্যৱহাৰ কৰে তাৰ বাবেহে পৰিশোধ কৰক

দ্ৰুত আৰম্ভ: API অথবা Self-Host

আমাৰ হোস্ট কৰা API ব্যৱহাৰ কৰক, অথবা মিনিটসমূহত Kokoro স্থানীয়ভাৱে ইন্সটল কৰক

বিকল্প ১: TTS.ai হোস্ট কৰা API সৰ্বসাধাৰণ
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
বিকল্প ২: pip ৰ সৈতে Self-Host সম্পূৰ্ণ নিয়ন্ত্ৰণ
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

মুক্ত উৎস, সস্তা মূল্য

আমাৰ হোস্ট কৰা API-এ GPUs পৰিচালনা নকৰাকৈ মুক্ত উৎসৰ TTS উপলব্ধ কৰে।

মুক্ত স্তৰ

$0

৫০ ক্রেডিট

  • 4 মুক্ত উৎসৰ মডেল বিনামূল্যে
  • মৌলিক ব্যৱহাৰৰ বাবে কোনো নিবন্ধন নাই
  • বাণিজ্যিক ব্যৱহাৰ অনুমোদিত

আৰম্ভ কৰক

$9

৫০০ ক্রেডিট/মাহ

  • সকলো 24+ মুক্ত উৎস মডেল
  • শব্দ ক্লোনিং
  • API অভিগম

প্ৰো

$29

২০০০ ক্রেডিট/মাহ

  • GPU প্ৰক্ৰিয়াকৰণৰ অগ্ৰাধিকাৰ
  • সকলো প্ৰিমিয়াম মডেল
  • এন্টারপ্ৰাইজ সমৰ্থন
সম্পূৰ্ণ মূল্য দেখুৱাওক

সদায় সোধা প্ৰশ্নসমূহ

মুক্ত উৎস টেক্সট-টু-স্পিচ সম্বন্ধে সাধাৰণ প্ৰশ্নসমূহ

হ'ব। TTS.ai ৰ প্ৰতিটো মডেলে MIT অথবা Apache 2.0 ৰ দৰে অনুমোদিত উন্মুক্ত উৎসৰ লাইচেঞ্চ ব্যৱহাৰ কৰে। আমি বিশেষভাৱে সীমাবদ্ধ লাইচেঞ্চৰ সৈতে মডেলসমূহ বাদ দিছো (যেনে Coqui ৰ CPML অথবা অবাণিজ্যিক CC-BY-NC)। আপুনি প্ৰতিটো মডেলৰ লাইচেঞ্চ তাৰ GitHub সংগ্ৰহস্থলত পৰীক্ষা কৰিব পাৰিব।

দুয়োটাই বাণিজ্যিক ব্যৱহাৰ, পৰিবৰ্তন আৰু পুনৰ বিতৰণৰ অনুমতি দিয়া অনুমোদনমূলক উন্মুক্ত উৎসৰ অনুমতিপত্ৰ। Apache 2.0 এ স্পষ্ট পেটেন্ট অনুমোদন যোগ কৰে আৰু যদি আপুনি কোড পৰিবৰ্তন কৰে তেন্তে পৰিবৰ্তনসমূহ উল্লেখ কৰাৰ প্ৰয়োজন হয়। MIT এ কম প্ৰয়োজনৰ সৈতে সৰল। দুয়োটা ব্যৱসায়-প্ৰেমী।

হ'ব। প্ৰতিটো মডেল স্ব-হোস্ট কৰা যাব। GitHub ৰ পৰা মডেল সংগ্ৰহস্থল ক্লোন কৰক, নিৰ্ভৰতাসমূহ ইনস্টল কৰক, মডেল ওজন ডাউনল'ড কৰক, আৰু অনুমান চলাওক। আমি GPU, RAM, আৰু Python সংস্কৰণ অন্তৰ্ভুক্ত প্ৰতিটো মডেলৰ স্ব-হোস্টিং প্ৰয়োজনসমূহৰ বাবে দস্তাবেজ প্ৰদান কৰোঁ।

আৰ্হি অনুযায়ী প্ৰয়োজনীয়তা সলনি হয়। Piper ৰ বাবে কোনো GPU প্ৰয়োজন নহয় (কেৱল CPU)। Kokoro আৰু MeloTTS ৰ বাবে 1-2GB VRAMৰ প্ৰয়োজন। অধিকাংশ প্ৰমিত আৰ্হিৰ বাবে4GB VRAMৰ প্ৰয়োজন। Tortoise আৰু Sesame CSM ৰ বাবে 8GBৰ প্ৰয়োজন। NVIDIA RTX 3060 (12GB) এ অধিকাংশ আৰ্হি সুখীভাৱে চলাব পাৰে।

হ্যাঁ। উন্মুক্ত উৎসৰ লাইচেঞ্চসমূহে ফাইন-টুইনিংসহ পৰিবৰ্তনৰ অনুমতি দিয়ে। GPT-SoVITS আৰু Bark ৰ দৰে মডেলসমূহে ফাইন-টুইনিং স্ক্ৰিপ্টসমূহ প্ৰদান কৰে। আপুনি আপোনাৰ নিজস্ব ধ্বনি তথ্যত মডেলসমূহ প্ৰশিক্ষণ দিব পাৰে স্বনিৰ্বাচিত ধ্বনিসমূহ সৃষ্টি কৰিবলৈ অথবা নিৰ্দিষ্ট ভাষাসমূহৰ বাবে কাৰ্যক্ষমতা উন্নত কৰিবলৈ।

শীৰ্ষ উন্মুক্ত উৎস মডেল (Kokoro, StyleTTS 2, Chatterbox) এতিয়া ElevenLabs আৰু Google TTSৰ দৰে বাণিজ্যিক সেৱাসমূহৰ সৈতে মানানসই বা অতিক্ৰম কৰে। বাণিজ্যিক সেৱাৰ প্ৰধান সুবিধা হৈছে পৰিচালিত আন্তঃগাঁথনি আৰু সমৰ্থন, অডিঅ’ৰ গুণগত মান নহয়।

XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), আৰু Higgs-v2 (Boson License — restrictive) সকলো আঁতৰুৱা হৈছে। TTS.ai ৰ প্ৰতিটো মডেল বাণিজ্যিক ব্যৱহাৰৰ বাবে নিৰাপদ বুলি প্ৰমাণিত হৈছে।

হ'ব। অধিকাংশ মডেলে GitHubৰ জৰিয়তে সম্প্রদায়ৰ অংশগ্ৰহণ গ্ৰহণ কৰে। আপুনি বাগ প্ৰতিবেদন, নতুন ভাষাৰ বাবে শব্দ ৰেকৰ্ডিং, কোড উন্নয়ন আৰু দস্তাবেজসমূহ জমা দিব পাৰে। প্ৰতিটো মডেলৰ GitHub সংগ্ৰহস্থলত অংশগ্ৰহণৰ দিশ-নিৰ্দেশিকা আৰু সক্ৰিয় সমস্যাসমূহ পৰীক্ষা কৰক।

GPU মেমৰি অংশীদাৰী কৰাৰ বাবে অনুৰোধ অনুসৰি মডেল লোড কৰক আৰু নিষ্ক্ৰিয় অৱস্থাত আনলোড কৰক। আমাৰ GPU চাৰ্ভাৰে 4x Tesla P40 (মোট 96GB VRAM) ব্যৱহাৰ কৰি 20+ মডেল চলায়। স্ব-হোস্টিংৰ বাবে, এটা 24GB GPU এ 3-5 মডেল একসাথে সেৱা কৰিব পাৰে।

বহুতো মডেলে আনুষ্ঠানিক Docker ছবি অথবা Dockerfiles প্ৰদান কৰে। একাধিক মডেল চলাবলৈ, আপুনি GPU অভিগমৰ বাবে NVIDIA কন্টেইনাৰ টুলকিটৰ সৈতে এটা স্বনিৰ্বাচিত Docker সেটআপ নিৰ্মাণ কৰিব পাৰে। আমাৰ API চাৰ্ভাৰ স্থাপত্য এটা প্ৰসংগ প্ৰণয়ন হিচাপে কাম কৰিব পাৰে।

অধিকাংশ মডেলৰ বাবে Python 3.10-3.12 ৰ প্ৰয়োজন। Coqui TTS (VITS) ৰ বাবে বিশেষভাৱে Python 3.11 ৰ প্ৰয়োজন। আমি অধিকাংশ মডেলৰ বাবে Python 3.12 ৰ পৰামৰ্শ দিছো। সঠিক সংস্কৰণ সংগতিৰ বাবে প্ৰতিটো মডেলৰ requirements.txt পৰীক্ষা কৰক।

হ্যাঁ। MIT আৰু Apache 2.0 লাইচেঞ্চসমূহে স্পষ্টভাৱে বাণিজ্যিক ব্যৱহাৰৰ অনুমতি দিয়ে। আপুনি এই মডেলসমূহ ব্যৱহাৰ কৰি SaaS উৎপাদন, ম'বাইল এপ্লিকেচন, খেলা, আৰু সেৱাসমূহ লাইচেঞ্চিং ফি, ৰয়েলটি, অথবা স্বীকৃতিৰ প্ৰয়োজন নোহোৱাকে নিৰ্মাণ কৰিব পাৰে (যদিও স্বীকৃতিৰ প্ৰশংসা কৰা হয়)।
5.0/5 (1)

আজি মুক্ত উৎসৰ TTS চেষ্টা কৰক

24+ উন্মুক্ত উৎসৰ মডেল, সকলো বাণিজ্যিক-লাইচেঞ্চিত। আমাৰ API বা স্ব-হোস্ট ব্যৱহাৰ কৰক - পছন্দ আপোনাৰ।