মুক্ত AI টেক্সট-টু-স্পীচName
20+ উন্মুক্ত উৎসৰ মডেল, 107+ শব্দ, 32+ ভাষাসমূহ। কোনো একাওন্টৰ প্ৰয়োজন নাই।
Voice AI ৰ বাবে আপোনাৰ প্ৰয়োজনীয় সকলো
উন্মুক্ত উৎস AI মডেল দ্বাৰা শক্তিশালী ৩০+ সঁজুলি
20+ AI শব্দ মডেলসমূহ
এটা প্লেটফৰ্মত মুক্ত উৎসৰ TTS মডেলৰ সৰ্বাধিক বিস্তৃত সংকলন
Kokoro Free
Kokoro এটা ৮২ মিলিয়ন প্ৰাচলৰ টেক্সট-টু-স্পীচ মডেল যি ইয়াৰ ওজনৰ শ্ৰেণীৰ ওপৰত ভালদৰে কাম কৰে। ইয়াৰ ক্ষুদ্ৰ আকাৰ সত্ত্বেও, ই উল্লেখযোগ্যভাৱে প্ৰাকৃতিক আৰু অভিব্যক্তিমূলক ভাষা প্ৰস্তুত কৰে। Kokoro ইংৰাজী, জাপানী, চীনা আৰু কোৰীয় সহ বহুতো ভাষাক বিভিন্ন অভিব্যক্তিমূলক শব্দৰ সৈতে সমৰ্থন কৰে। ই অভূতপূৰ্বভাৱে দ্ৰুতভাৱে চলি থাকে - এটা GPU ত ৰিয়েল-টাইমৰ তুলনাত প্ৰায় ১০০x দ্ৰুতত অডিঅ' প্ৰস্তুত কৰে।
সৰ্বোত্তম: সৰ্বনিম্ন লেটেন্সিৰ সৈতে উচ্চ-মানৰ TTS, স্ট্ৰিমিং এপ্লিকেচনসমূহ
বিনামূল্যে চেষ্টা কৰক
Piper Free
Piper এটা হালধীয়া টেক্সট-টু-স্পীচ ইঞ্জিন যি Rhasspy দ্বাৰা উন্নত কৰা হৈছে যি VITS আৰু larynx স্থাপত্যসমূহ ব্যৱহাৰ কৰে। ই সম্পূৰ্ণৰূপে CPU ত চলায়, ই ইয়াক এডজ ডিভাইচ, ঘৰ স্বচালিতকৰণ, আৰু অফলাইন TTS প্ৰয়োজন হোৱা এপ্লিকেচনসমূহৰ বাবে আদর্শ কৰি তোলে। 30+ ভাষাত 100 ৰ অধিক কন্ঠৰ সৈতে, Piper এ এটা Raspberry Pi 4 ৰ ওপৰতো প্ৰকৃত-সময়ৰ গতিৰে প্ৰাকৃতিক-স্বৰযুক্ত কথন প্ৰদান কৰে।
সৰ্বোত্তম: দ্ৰুত পূৰ্বপ্ৰদৰ্শন, অভিগম্যতা আৰু অন্তৰ্ভুক্ত এপ্লিকেচনসমূহ
বিনামূল্যে চেষ্টা কৰক
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) হৈছে এটা সমান্তৰাল end-to-end TTS পদ্ধতি যি বৰ্তমান দুটা স্তৰৰ মডেলৰ তুলনাত অধিক প্ৰাকৃতিক সুৰযুক্ত অডিঅ' প্ৰস্তুত কৰে। ই প্ৰাকৃতিকতাত উল্লেখযোগ্য উন্নতি সাধন কৰি স্বাভাৱিকীকৰণ প্ৰবাহ আৰু প্ৰতিদ্বন্দ্বিতামূলক প্ৰশিক্ষণ প্ৰক্ৰিয়াৰ সৈতে বৃদ্ধি কৰা variational inference গ্ৰহণ কৰে।
সৰ্বোত্তম: স্বাভাৱিক প্ৰোসোডিৰ সৈতে সাধাৰণ-উদ্দেশ্যৰ টেক্সট-টু-স্পীচ
বিনামূল্যে চেষ্টা কৰক
MeloTTS Free
MyShell.ai দ্বাৰা MeloTTS এটা বহুভাষিক TTS লাইব্ৰেৰি যি ইংৰাজী (আমেৰিকান, ব্ৰিটিছ, ভাৰতীয়, অস্ট্ৰেলিয়ান), স্পেনিশ, ফৰাচী, চীনা, জাপানি আৰু কোৰীয় সমৰ্থন কৰে। ই অতি দ্রুত, কেৱল CPU ত প্ৰায় ৰিয়েল-টাইম গতিৰে টেক্সট প্ৰক্ৰিয়াকৰণ কৰে। MeloTTS উৎপাদন ব্যৱহাৰৰ বাবে নিৰ্মিত আৰু CPU আৰু GPU উভয়কে সমৰ্থন কৰে।
সৰ্বোত্তম: দ্ৰুত, বহুভাষিক TTS প্ৰয়োজনীয় উৎপাদন এপ্লিকেচনসমূহ
বিনামূল্যে চেষ্টা কৰক
Bark Standard
পৰিবৰ্তন-ভিত্তিক টেক্সট-টু-অডিঅ' মডেল যি বাস্তববাদী বক্তৃতা, সঙ্গীত, আৰু শব্দ প্ৰভাৱসমূহ সৃষ্টি কৰে।
বিকাশক: Suno · অনুমতি: MIT
চেষ্টা কৰক
Bark Small Standard
দ্ৰুত অনুমান আৰু কম মেমৰি ব্যৱহাৰৰ সৈতে Bark ৰ হালধীয়া সংস্কৰণ।
বিকাশক: Suno · অনুমতি: MIT
চেষ্টা কৰক
CosyVoice 2 Standard
Alibaba ৰ মানৱ-সমান প্ৰাকৃতিকতা আৰু নিকট-শূণ্য লেটেন্সিৰ সৈতে স্কেলেবল ষ্ট্ৰীমিং TTS।
বিকাশক: Alibaba (Tongyi Lab) · অনুমতি: Apache 2.0
চেষ্টা কৰক
Dia TTS Standard
মাল্টি-স্পীকাৰ ডাইলগ নিৰ্মাণ মডেল যি স্পীকাৰসমূহৰ মাজত প্ৰাকৃতিক কথোপকথন সৃষ্টি কৰে।
বিকাশক: Nari Labs · অনুমতি: Apache 2.0
চেষ্টা কৰক
Parler TTS Standard
প্ৰাকৃতিক ভাষাত আপুনি যি ধ্বনি বিচাৰে তাক বৰ্ণনা কৰক আৰু Parler এ মিল থকা ধ্বনি সৃষ্টি কৰিব।
বিকাশক: Hugging Face · অনুমতি: Apache 2.0
চেষ্টা কৰক
GLM-TTS Standard
মুক্ত উৎসৰ TTS মডেলসমূহৰ ভিতৰত সৰ্বনিম্ন অক্ষৰ ত্ৰুটিৰ হাৰ প্ৰাপ্ত কৰে।
বিকাশক: Zhipu AI · অনুমতি: GLM-4 License
চেষ্টা কৰক
IndexTTS-2 Standard
শূণ্য-শট TTS fine-grained অনুভূতি নিয়ন্ত্ৰণ আৰু উচ্চ অভিব্যক্তিৰ সৈতে।
বিকাশক: Index Team · অনুমতি: Bilibili Model License
চেষ্টা কৰক
Spark TTS Standard
কন্ট্ৰোল কৰিব পৰা অনুভূতি আৰু প্ৰমপ্টসমূহৰ দ্বাৰা কথোপকথনৰ শৈলীৰ সৈতে শব্দ ক্লোনিং TTS।
বিকাশক: SparkAudio · অনুমতি: CC BY-NC-SA 4.0
চেষ্টা কৰক
GPT-SoVITS Standard
অডিঅ'ৰ কেৱল ৫ ছেকেণ্ডৰ পৰা যিকোনো শব্দৰ প্ৰতিলিপি প্ৰস্তুত কৰা TTS ক্লোনিং কয়েকটা শব্দৰ দ্বাৰা।
বিকাশক: RVC-Boss · অনুমতি: MIT
চেষ্টা কৰক
Orpheus Standard
১০০K ঘণ্টাৰ কথন তথ্যৰ ওপৰত প্ৰশিক্ষিত মানৱ-স্তরৰ আবেগিক TTS মডেল।
বিকাশক: Canopy Labs · অনুমতি: Llama 3.2 Community
চেষ্টা কৰক
Qwen3 TTS Standard
Alibaba ৰ বহুভাষী TTS, যিটোত শব্দ ক্লোনিং, প্ৰাক-নিৰ্ধাৰিত শব্দ, আৰু টেক্সটৰ পৰা শব্দৰ নকশা আছে।
বিকাশক: Alibaba (Qwen) · অনুমতি: Apache 2.0
চেষ্টা কৰক
CosyVoice 2
Alibaba ৰ মানৱ-সমান প্ৰাকৃতিকতা আৰু নিকট-শূণ্য লেটেন্সিৰ সৈতে স্কেলেবল ষ্ট্ৰীমিং TTS।
ভাষা: en, zh, ja, ko, fr, de, it, es
ধ্বনি ক্লোন কৰক
GLM-TTS
মুক্ত উৎসৰ TTS মডেলসমূহৰ ভিতৰত সৰ্বনিম্ন অক্ষৰ ত্ৰুটিৰ হাৰ প্ৰাপ্ত কৰে।
ভাষা: en, zh
ধ্বনি ক্লোন কৰক
IndexTTS-2
শূণ্য-শট TTS fine-grained অনুভূতি নিয়ন্ত্ৰণ আৰু উচ্চ অভিব্যক্তিৰ সৈতে।
ভাষা: en, zh
ধ্বনি ক্লোন কৰক
Spark TTS
কন্ট্ৰোল কৰিব পৰা অনুভূতি আৰু প্ৰমপ্টসমূহৰ দ্বাৰা কথোপকথনৰ শৈলীৰ সৈতে শব্দ ক্লোনিং TTS।
ভাষা: en, zh
ধ্বনি ক্লোন কৰক
GPT-SoVITS
অডিঅ'ৰ কেৱল ৫ ছেকেণ্ডৰ পৰা যিকোনো শব্দৰ প্ৰতিলিপি প্ৰস্তুত কৰা TTS ক্লোনিং কয়েকটা শব্দৰ দ্বাৰা।
ভাষা: en, zh, ja, ko
ধ্বনি ক্লোন কৰক
Chatterbox
Resemble AI ৰ পৰা আবেগ নিয়ন্ত্ৰণৰ সৈতে state-of-the-art zero-shot শব্দ ক্লোনিং।
ভাষা: en
ধ্বনি ক্লোন কৰক
Tortoise TTS
বহু-ভাষা টেক্সট-টু-স্পীচ স্ব-পৰিবৰ্তনশীল স্থাপত্যৰ সৈতে গুণগত মানত গুৰুত্ব আৰোপ কৰা হৈছে।
ভাষা: en
ধ্বনি ক্লোন কৰক
OpenVoice
শৈলী, অনুভূতি, আৰু উচ্চাৰণৰ ওপৰত granular নিয়ন্ত্ৰণৰ সৈতে তাৎক্ষণিক শব্দ ক্লোনিং।
ভাষা: en, zh, ja, ko, fr, de, es, it
ধ্বনি ক্লোন কৰক
Qwen3 TTS
Alibaba ৰ বহুভাষী TTS, যিটোত শব্দ ক্লোনিং, প্ৰাক-নিৰ্ধাৰিত শব্দ, আৰু টেক্সটৰ পৰা শব্দৰ নকশা আছে।
ভাষা: en, zh, ja, ko, de, fr, ru, pt, es, it
ধ্বনি ক্লোন কৰকবিকাশক-প্ৰথম API
OpenAI-সংগতিপূৰ্ণ REST API। এটা অন্তবিন্দু, ২২+ মডেল। ৰিয়েল-টাইম এপ্লিকেচনৰ বাবে ষ্ট্ৰীমিং সমৰ্থন।
- OpenAI-সুসংগত বিন্যাস
- ৰিয়েল-টাইম এপ্লিকেচনৰ বাবে TTS স্ট্ৰিমিং
- ডাঙৰ কামসমূহৰ বাবে ব্যাচ প্ৰক্ৰিয়াকৰণ
- Webhook অধিসূচনাসমূহ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
সৰল, স্বচ্ছ মূল্য নিৰ্ধাৰণ
মুক্তভাৱে আৰম্ভ কৰক। বৃদ্ধিৰ লগে লগে স্কেল কৰক।
মুক্ত
৫০ ক্রেডিট
- Kokoro, Piper, VITS, MeloTTS
- ৫০০ আখৰৰ সীমা
- ৩ জন/ঘন্টা (কোনো একাওন্ট নাই)
আৰম্ভ কৰক
৫০০ ক্রেডিট/মাহ
- সকলো ২২+ আৰ্হি
- প্ৰতি প্ৰজন্মে ১০০,০০০ আখৰ
- ধ্বনি ক্লোনিং
প্ৰো
২,০০০ ক্রেডিট/মাহ
- আৰম্ভণিত সকলো
- API অভিগম
- অগ্ৰাধিকাৰ প্ৰক্ৰিয়াকৰণ
সদায় সোধা প্ৰশ্নসমূহ
AI Voice আজি ব্যৱহাৰ আৰম্ভ কৰক
TTS.ai ব্যৱহাৰ কৰি সৃষ্টিকৰ্তা, উন্নয়নকাৰী, আৰু ব্যৱসায়ত যোগদান কৰক