বিনামূল্যে AI টেক্সট- থেকে- কথাName
20+ মুক্ত উৎস মডেল, 107+ কন্ঠস্বর, 32+ ভাষা। কোন অ্যাকাউন্টের প্রয়োজন নেই।
ভয়েস এআই-এর জন্য আপনার যা যা প্রয়োজন
উন্মুক্ত-সোর্স AI মডেল দ্বারা চালিত 30+ টুল
20+ AI শব্দ মডেল
একটি প্ল্যাটফর্মে মুক্ত-সোর্স TTS মডেলের সবচেয়ে বিস্তৃত সংগ্রহ
Kokoro Free
কোকোরো একটি ৮২ মিলিয়ন প্যারামিটার টেক্সট-টু-স্পিচ মডেল যা তার ওজন শ্রেণীর চেয়ে বেশী কাজ করে। এর ক্ষুদ্র আকার সত্ত্বেও, এটি আশ্চর্যজনকভাবে প্রাকৃতিক এবং অভিব্যক্তিমূলক ভাষা তৈরি করে। ইংরেজি, জাপানি, চীনা এবং কোরীয় সহ একাধিক ভাষা সমর্থন করে। এটি অসাধারণভাবে দ্রুত কাজ করে - একটি জিপিইউতে বাস্তব সময়ের চেয়ে প্রায় ১০০ গুণ দ্রুত অডিও উৎপাদন করে।
সর্বোত্তম: সর্বনিম্ন latency সহ উচ্চমানের TTS, স্ট্রিমিং অ্যাপ্লিকেশন
বিনামূল্যে চেষ্টা করুন
Piper Free
পাইপার একটি হালকা টেক্সট-টু-স্পিচ ইঞ্জিন যা Rhasspy দ্বারা উন্নত করা হয়েছে এবং VITS এবং larynx স্থাপত্য ব্যবহার করে। এটি সম্পূর্ণরূপে সিপিইউ-তে চলছে, এটিকে প্রান্ত ডিভাইস, হোম অটোমেশন এবং অফলাইন TTS প্রয়োজনীয় অ্যাপ্লিকেশনের জন্য আদর্শ করে তোলে। ৩০+ ভাষার মধ্যে ১০০ এরও বেশি কন্ঠ সহ, পাইপার একটি রাসবেরি পাই ৪-এও বাস্তব-সময়ের গতিতে প্রাকৃতিক-স্বরযুক্ত কথা প্রদান করে।
সর্বোত্তম: দ্রুত প্রাকদর্শন, প্রবেশযোগ্যতা এবং অন্তর্ভুক্ত অ্যাপ্লিকেশন
বিনামূল্যে চেষ্টা করুন
VITS Free
VITS (এন্ড- টু- এন্ড টেক্সট- টু- স্পিকারের জন্য প্রতিদ্বন্দ্বিতামূলক শেখার সাথে বৈচিত্র্যমূলক অনুমান) একটি সমান্তরাল শেষ- থেকে- শেষ TTS পদ্ধতি যা বর্তমান দুই- পর্যায়ের মডেলের চেয়ে বেশি প্রাকৃতিক শব্দের অডিও উৎপাদন করে। এটি বৈচিত্র্যমূলক অনুমান গ্রহণ করে যা স্বাভাবিক প্রবাহ এবং প্রতিদ্বন্দ্বিতামূলক প্রশিক্ষণ প্রক্রিয়া দ্বারা উন্নত, প্রাকৃতিকতার একটি উল্লেখযোগ্য উন্নতি অর্জন করে।
সর্বোত্তম: প্রাকৃতিক প্রসোডির সাথে সাধারণ উদ্দেশ্যে টেক্সট-টু-স্পীচ
বিনামূল্যে চেষ্টা করুন
MeloTTS Free
MyShell.ai দ্বারা MeloTTS একটি বহুভাষিক TTS লাইব্রেরী যা ইংরেজি (আমেরিকান, ব্রিটিশ, ভারতীয়, অস্ট্রেলিয়ান), স্প্যানিশ, ফরাসি, চীনা, জাপানি এবং কোরিয়ান সমর্থন করে। এটি অত্যন্ত দ্রুত, শুধুমাত্র সিপিইউ-তে প্রায় বাস্তব-সময়ের গতিতে টেক্সট প্রক্রিয়াকরণ করে। MeloTTS উৎপাদন ব্যবহারের জন্য ডিজাইন করা হয়েছে এবং সিপিইউ এবং জিপিইউ উভয়ই সমর্থন করে।
সর্বোত্তম: দ্রুত, বহুভাষিক TTS প্রয়োজনীয় উৎপাদন অ্যাপ্লিকেশন
বিনামূল্যে চেষ্টা করুন
Bark Standard
রূপান্তর-ভিত্তিক টেক্সট-টু-অডিও মডেল যা বাস্তববাদী বক্তৃতা, সঙ্গীত, এবং শব্দ প্রভাব উৎপাদন করে।
ডেভেলপার: Suno · লাইসেন্স: MIT
চেষ্টা করো
Bark Small Standard
দ্রুততর অনুমান এবং কম মেমরি ব্যবহারের সাথে Bark এর হালকা সংস্করণ।
ডেভেলপার: Suno · লাইসেন্স: MIT
চেষ্টা করো
CosyVoice 2 Standard
আলিবাবার স্কেলেবল স্ট্রিমিং টিটিএস মানব-সমান প্রাকৃতিকতা এবং শূন্যের কাছাকাছি লেটেন্সি সহ।
ডেভেলপার: Alibaba (Tongyi Lab) · লাইসেন্স: Apache 2.0
চেষ্টা করো
Dia TTS Standard
মাল্টি-স্পিকার ডায়ালগ উৎপাদন মডেল যা স্পিকারের মধ্যে প্রাকৃতিক কথোপকথন তৈরি করে।
ডেভেলপার: Nari Labs · লাইসেন্স: Apache 2.0
চেষ্টা করো
Parler TTS Standard
প্রাকৃতিক ভাষায় আপনি যে শব্দটি চান তা বর্ণনা করুন এবং পালারের মাধ্যমে সেটিকে সঙ্গতিপূর্ণ শব্দে রূপান্তর করা হবে।
ডেভেলপার: Hugging Face · লাইসেন্স: Apache 2.0
চেষ্টা করো
GLM-TTS Standard
মুক্ত উৎস TTS মডেলগুলির মধ্যে সর্বনিম্ন অক্ষর ত্রুটি হার অর্জন করে।
ডেভেলপার: Zhipu AI · লাইসেন্স: GLM-4 License
চেষ্টা করো
IndexTTS-2 Standard
নিরপেক্ষ আবেগ নিয়ন্ত্রণ এবং উচ্চ অভিব্যক্তির সাথে জিরো-শট টিটিএস।
ডেভেলপার: Index Team · লাইসেন্স: Bilibili Model License
চেষ্টা করো
Spark TTS Standard
কন্ট্রোলযোগ্য আবেগ এবং অনুরোধের মাধ্যমে কথা বলার শৈলীর সাথে শব্দ ক্লোনিং TTS।
ডেভেলপার: SparkAudio · লাইসেন্স: CC BY-NC-SA 4.0
চেষ্টা করো
GPT-SoVITS Standard
অডিও থেকে মাত্র ৫ সেকেন্ডের মধ্যে যে কোন শব্দ প্রতিলিপি করার জন্য কয়েকটি শব্দ ক্লোনিং TTS।
ডেভেলপার: RVC-Boss · লাইসেন্স: MIT
চেষ্টা করো
Orpheus Standard
মানব-স্তরের আবেগগত TTS মডেল ১০০K ঘন্টা বক্তৃতা তথ্য প্রশিক্ষণ।
ডেভেলপার: Canopy Labs · লাইসেন্স: Llama 3.2 Community
চেষ্টা করো
Qwen3 TTS Standard
আলিবাবার বহুভাষী টিটিএস, যার সাথে আছে শব্দ ক্লোনিং, পূর্বনির্ধারিত শব্দ এবং লেখা থেকে শব্দ ডিজাইন।
ডেভেলপার: Alibaba (Qwen) · লাইসেন্স: Apache 2.0
চেষ্টা করো
CosyVoice 2
আলিবাবার স্কেলেবল স্ট্রিমিং টিটিএস মানব-সমান প্রাকৃতিকতা এবং শূন্যের কাছাকাছি লেটেন্সি সহ।
ভাষা: en, zh, ja, ko, fr, de, it, es
শব্দ ক্লোন করো
GLM-TTS
মুক্ত উৎস TTS মডেলগুলির মধ্যে সর্বনিম্ন অক্ষর ত্রুটি হার অর্জন করে।
ভাষা: en, zh
শব্দ ক্লোন করো
IndexTTS-2
নিরপেক্ষ আবেগ নিয়ন্ত্রণ এবং উচ্চ অভিব্যক্তির সাথে জিরো-শট টিটিএস।
ভাষা: en, zh
শব্দ ক্লোন করো
Spark TTS
কন্ট্রোলযোগ্য আবেগ এবং অনুরোধের মাধ্যমে কথা বলার শৈলীর সাথে শব্দ ক্লোনিং TTS।
ভাষা: en, zh
শব্দ ক্লোন করো
GPT-SoVITS
অডিও থেকে মাত্র ৫ সেকেন্ডের মধ্যে যে কোন শব্দ প্রতিলিপি করার জন্য কয়েকটি শব্দ ক্লোনিং TTS।
ভাষা: en, zh, ja, ko
শব্দ ক্লোন করো
Chatterbox
রিসেম্বেল এআই থেকে আবেগ নিয়ন্ত্রণের সাথে অত্যাধুনিক জিরো-শট ভয়েস ক্লোনিং।
ভাষা: en
শব্দ ক্লোন করো
Tortoise TTS
স্ব-পশ্চাৎপসরণকারী স্থাপত্যের সাথে গুণগত মানকে কেন্দ্র করে বহু-স্বর টেক্সট-টু-স্পিকার।
ভাষা: en
শব্দ ক্লোন করো
OpenVoice
স্টাইল, আবেগ, এবং উচ্চারণ উপর granular নিয়ন্ত্রণ সঙ্গে অবিলম্বে ভয়েস ক্লোনিং।
ভাষা: en, zh, ja, ko, fr, de, es, it
শব্দ ক্লোন করো
Qwen3 TTS
আলিবাবার বহুভাষী টিটিএস, যার সাথে আছে শব্দ ক্লোনিং, পূর্বনির্ধারিত শব্দ এবং লেখা থেকে শব্দ ডিজাইন।
ভাষা: en, zh, ja, ko, de, fr, ru, pt, es, it
শব্দ ক্লোন করোডেভেলপার-প্রথম API
OpenAI-র সাথে সামঞ্জস্যপূর্ণ REST API। একটি এন্ডপয়েন্ট, ২২+ মডেল। বাস্তব-সময়ের অ্যাপ্লিকেশনের জন্য স্ট্রিমিং সমর্থন।
- OpenAI-র সাথে সামঞ্জস্যপূর্ণ ফরম্যাট
- রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য স্ট্রিমিং TTS
- বড় কাজের জন্য ব্যাচ প্রসেসিং
- Webhook বিজ্ঞপ্তি
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
সহজ, স্বচ্ছ মূল্য নির্ধারণ
মুক্তভাবে শুরু করো, বড় হও।
মুক্ত
১৫ ক্রেডিট
- Kokoro, Piper, VITS, MeloTTS
- ৫০০ অক্ষরের সীমা
- ৩ জন/ঘন্টা (কোনো অ্যাকাউন্ট নেই)
স্টার্টার
মাসে ৫০০ ক্রেডিট
- সব ২২+ মডেল
- প্রতি প্রজন্মে ১০০,০০০ অক্ষর
- ভয়েস ক্লোন
প্রফেশনাল
২,০০০ ক্রেডিট/মাস
- স্টার্টারে সবকিছু
- API প্রবেশাধিকার
- অগ্রাধিকার প্রসেসিং
ব্যবসা
১০,০০০ ক্রেডিট/মাস
- প্রো-তে সবকিছু
- ব্যাপক API
- অগ্রাধিকার তালিকা
প্রায়শ জিজ্ঞাসিত প্রশ্ন
AI Voice ব্যবহার শুরু করুন
TTS.ai ব্যবহার করে সৃষ্টিকর্তা, ডেভেলপার এবং ব্যবসায়ীদের সাথে যোগ দিন