বিনামূল্যে AI টেক্সট- থেকে- কথাName

20+ মুক্ত উৎস মডেল, 107+ কন্ঠস্বর, 32+ ভাষা। কোন অ্যাকাউন্টের প্রয়োজন নেই।

1K+
নির্মাতা
2K+
প্রজন্ম
20+
AI মডেল
107+
আওয়াজ
0/500 অক্ষর মুক্ত
TTS.ai এর মত? আপনার বন্ধুদের বলুন!

ভয়েস এআই-এর জন্য আপনার যা যা প্রয়োজন

উন্মুক্ত-সোর্স AI মডেল দ্বারা চালিত 30+ টুল

20+ AI শব্দ মডেল

একটি প্ল্যাটফর্মে মুক্ত-সোর্স TTS মডেলের সবচেয়ে বিস্তৃত সংগ্রহ

KokoroKokoro Free

কোকোরো একটি ৮২ মিলিয়ন প্যারামিটার টেক্সট-টু-স্পিচ মডেল যা তার ওজন শ্রেণীর চেয়ে বেশী কাজ করে। এর ক্ষুদ্র আকার সত্ত্বেও, এটি আশ্চর্যজনকভাবে প্রাকৃতিক এবং অভিব্যক্তিমূলক ভাষা তৈরি করে। ইংরেজি, জাপানি, চীনা এবং কোরীয় সহ একাধিক ভাষা সমর্থন করে। এটি অসাধারণভাবে দ্রুত কাজ করে - একটি জিপিইউতে বাস্তব সময়ের চেয়ে প্রায় ১০০ গুণ দ্রুত অডিও উৎপাদন করে।

সর্বোত্তম: সর্বনিম্ন latency সহ উচ্চমানের TTS, স্ট্রিমিং অ্যাপ্লিকেশন

বিনামূল্যে চেষ্টা করুন

PiperPiper Free

পাইপার একটি হালকা টেক্সট-টু-স্পিচ ইঞ্জিন যা Rhasspy দ্বারা উন্নত করা হয়েছে এবং VITS এবং larynx স্থাপত্য ব্যবহার করে। এটি সম্পূর্ণরূপে সিপিইউ-তে চলছে, এটিকে প্রান্ত ডিভাইস, হোম অটোমেশন এবং অফলাইন TTS প্রয়োজনীয় অ্যাপ্লিকেশনের জন্য আদর্শ করে তোলে। ৩০+ ভাষার মধ্যে ১০০ এরও বেশি কন্ঠ সহ, পাইপার একটি রাসবেরি পাই ৪-এও বাস্তব-সময়ের গতিতে প্রাকৃতিক-স্বরযুক্ত কথা প্রদান করে।

সর্বোত্তম: দ্রুত প্রাকদর্শন, প্রবেশযোগ্যতা এবং অন্তর্ভুক্ত অ্যাপ্লিকেশন

বিনামূল্যে চেষ্টা করুন

VITSVITS Free

VITS (এন্ড- টু- এন্ড টেক্সট- টু- স্পিকারের জন্য প্রতিদ্বন্দ্বিতামূলক শেখার সাথে বৈচিত্র্যমূলক অনুমান) একটি সমান্তরাল শেষ- থেকে- শেষ TTS পদ্ধতি যা বর্তমান দুই- পর্যায়ের মডেলের চেয়ে বেশি প্রাকৃতিক শব্দের অডিও উৎপাদন করে। এটি বৈচিত্র্যমূলক অনুমান গ্রহণ করে যা স্বাভাবিক প্রবাহ এবং প্রতিদ্বন্দ্বিতামূলক প্রশিক্ষণ প্রক্রিয়া দ্বারা উন্নত, প্রাকৃতিকতার একটি উল্লেখযোগ্য উন্নতি অর্জন করে।

সর্বোত্তম: প্রাকৃতিক প্রসোডির সাথে সাধারণ উদ্দেশ্যে টেক্সট-টু-স্পীচ

বিনামূল্যে চেষ্টা করুন

MeloTTSMeloTTS Free

MyShell.ai দ্বারা MeloTTS একটি বহুভাষিক TTS লাইব্রেরী যা ইংরেজি (আমেরিকান, ব্রিটিশ, ভারতীয়, অস্ট্রেলিয়ান), স্প্যানিশ, ফরাসি, চীনা, জাপানি এবং কোরিয়ান সমর্থন করে। এটি অত্যন্ত দ্রুত, শুধুমাত্র সিপিইউ-তে প্রায় বাস্তব-সময়ের গতিতে টেক্সট প্রক্রিয়াকরণ করে। MeloTTS উৎপাদন ব্যবহারের জন্য ডিজাইন করা হয়েছে এবং সিপিইউ এবং জিপিইউ উভয়ই সমর্থন করে।

সর্বোত্তম: দ্রুত, বহুভাষিক TTS প্রয়োজনীয় উৎপাদন অ্যাপ্লিকেশন

বিনামূল্যে চেষ্টা করুন

BarkBark Standard

রূপান্তর-ভিত্তিক টেক্সট-টু-অডিও মডেল যা বাস্তববাদী বক্তৃতা, সঙ্গীত, এবং শব্দ প্রভাব উৎপাদন করে।

ডেভেলপার: Suno · লাইসেন্স: MIT

চেষ্টা করো

Bark SmallBark Small Standard

দ্রুততর অনুমান এবং কম মেমরি ব্যবহারের সাথে Bark এর হালকা সংস্করণ।

ডেভেলপার: Suno · লাইসেন্স: MIT

চেষ্টা করো

CosyVoice 2CosyVoice 2 Standard

আলিবাবার স্কেলেবল স্ট্রিমিং টিটিএস মানব-সমান প্রাকৃতিকতা এবং শূন্যের কাছাকাছি লেটেন্সি সহ।

ডেভেলপার: Alibaba (Tongyi Lab) · লাইসেন্স: Apache 2.0

চেষ্টা করো

Dia TTSDia TTS Standard

মাল্টি-স্পিকার ডায়ালগ উৎপাদন মডেল যা স্পিকারের মধ্যে প্রাকৃতিক কথোপকথন তৈরি করে।

ডেভেলপার: Nari Labs · লাইসেন্স: Apache 2.0

চেষ্টা করো

Parler TTSParler TTS Standard

প্রাকৃতিক ভাষায় আপনি যে শব্দটি চান তা বর্ণনা করুন এবং পালারের মাধ্যমে সেটিকে সঙ্গতিপূর্ণ শব্দে রূপান্তর করা হবে।

ডেভেলপার: Hugging Face · লাইসেন্স: Apache 2.0

চেষ্টা করো

GLM-TTSGLM-TTS Standard

মুক্ত উৎস TTS মডেলগুলির মধ্যে সর্বনিম্ন অক্ষর ত্রুটি হার অর্জন করে।

ডেভেলপার: Zhipu AI · লাইসেন্স: GLM-4 License

চেষ্টা করো

IndexTTS-2IndexTTS-2 Standard

নিরপেক্ষ আবেগ নিয়ন্ত্রণ এবং উচ্চ অভিব্যক্তির সাথে জিরো-শট টিটিএস।

ডেভেলপার: Index Team · লাইসেন্স: Bilibili Model License

চেষ্টা করো

Spark TTSSpark TTS Standard

কন্ট্রোলযোগ্য আবেগ এবং অনুরোধের মাধ্যমে কথা বলার শৈলীর সাথে শব্দ ক্লোনিং TTS।

ডেভেলপার: SparkAudio · লাইসেন্স: CC BY-NC-SA 4.0

চেষ্টা করো

GPT-SoVITSGPT-SoVITS Standard

অডিও থেকে মাত্র ৫ সেকেন্ডের মধ্যে যে কোন শব্দ প্রতিলিপি করার জন্য কয়েকটি শব্দ ক্লোনিং TTS।

ডেভেলপার: RVC-Boss · লাইসেন্স: MIT

চেষ্টা করো

OrpheusOrpheus Standard

মানব-স্তরের আবেগগত TTS মডেল ১০০K ঘন্টা বক্তৃতা তথ্য প্রশিক্ষণ।

ডেভেলপার: Canopy Labs · লাইসেন্স: Llama 3.2 Community

চেষ্টা করো

Qwen3 TTSQwen3 TTS Standard

আলিবাবার বহুভাষী টিটিএস, যার সাথে আছে শব্দ ক্লোনিং, পূর্বনির্ধারিত শব্দ এবং লেখা থেকে শব্দ ডিজাইন।

ডেভেলপার: Alibaba (Qwen) · লাইসেন্স: Apache 2.0

চেষ্টা করো

ChatterboxChatterbox Premium

রিসেম্বেল এআই থেকে আবেগ নিয়ন্ত্রণের সাথে অত্যাধুনিক জিরো-শট ভয়েস ক্লোনিং।

গুণমান:

চেষ্টা করো

Tortoise TTSTortoise TTS Premium

স্ব-পশ্চাৎপসরণকারী স্থাপত্যের সাথে গুণগত মানকে কেন্দ্র করে বহু-স্বর টেক্সট-টু-স্পিকার।

গুণমান:

চেষ্টা করো

StyleTTS 2StyleTTS 2 Premium

মানব-স্তরের টেক্সট-টু-স্পিকার স্টাইল ডিফেন্স এবং প্রতিদ্বন্দ্বী প্রশিক্ষণের মাধ্যমে।

গুণমান:

চেষ্টা করো

OpenVoiceOpenVoice Premium

স্টাইল, আবেগ, এবং উচ্চারণ উপর granular নিয়ন্ত্রণ সঙ্গে অবিলম্বে ভয়েস ক্লোনিং।

গুণমান:

চেষ্টা করো

Sesame CSMSesame CSM Premium

সঙ্গীতের সাথে কথা বলার মডেল, যা প্রাকৃতিক ভাবেই কথা বলার অনুমতি দেয়।

গুণমান:

চেষ্টা করো

CosyVoice 2CosyVoice 2

আলিবাবার স্কেলেবল স্ট্রিমিং টিটিএস মানব-সমান প্রাকৃতিকতা এবং শূন্যের কাছাকাছি লেটেন্সি সহ।

ভাষা: en, zh, ja, ko, fr, de, it, es

শব্দ ক্লোন করো

GLM-TTSGLM-TTS

মুক্ত উৎস TTS মডেলগুলির মধ্যে সর্বনিম্ন অক্ষর ত্রুটি হার অর্জন করে।

ভাষা: en, zh

শব্দ ক্লোন করো

IndexTTS-2IndexTTS-2

নিরপেক্ষ আবেগ নিয়ন্ত্রণ এবং উচ্চ অভিব্যক্তির সাথে জিরো-শট টিটিএস।

ভাষা: en, zh

শব্দ ক্লোন করো

Spark TTSSpark TTS

কন্ট্রোলযোগ্য আবেগ এবং অনুরোধের মাধ্যমে কথা বলার শৈলীর সাথে শব্দ ক্লোনিং TTS।

ভাষা: en, zh

শব্দ ক্লোন করো

GPT-SoVITSGPT-SoVITS

অডিও থেকে মাত্র ৫ সেকেন্ডের মধ্যে যে কোন শব্দ প্রতিলিপি করার জন্য কয়েকটি শব্দ ক্লোনিং TTS।

ভাষা: en, zh, ja, ko

শব্দ ক্লোন করো

ChatterboxChatterbox

রিসেম্বেল এআই থেকে আবেগ নিয়ন্ত্রণের সাথে অত্যাধুনিক জিরো-শট ভয়েস ক্লোনিং।

ভাষা: en

শব্দ ক্লোন করো

Tortoise TTSTortoise TTS

স্ব-পশ্চাৎপসরণকারী স্থাপত্যের সাথে গুণগত মানকে কেন্দ্র করে বহু-স্বর টেক্সট-টু-স্পিকার।

ভাষা: en

শব্দ ক্লোন করো

OpenVoiceOpenVoice

স্টাইল, আবেগ, এবং উচ্চারণ উপর granular নিয়ন্ত্রণ সঙ্গে অবিলম্বে ভয়েস ক্লোনিং।

ভাষা: en, zh, ja, ko, fr, de, es, it

শব্দ ক্লোন করো

Qwen3 TTSQwen3 TTS

আলিবাবার বহুভাষী টিটিএস, যার সাথে আছে শব্দ ক্লোনিং, পূর্বনির্ধারিত শব্দ এবং লেখা থেকে শব্দ ডিজাইন।

ভাষা: en, zh, ja, ko, de, fr, ru, pt, es, it

শব্দ ক্লোন করো

ডেভেলপার-প্রথম API

OpenAI-র সাথে সামঞ্জস্যপূর্ণ REST API। একটি এন্ডপয়েন্ট, ২২+ মডেল। বাস্তব-সময়ের অ্যাপ্লিকেশনের জন্য স্ট্রিমিং সমর্থন।

  • OpenAI-র সাথে সামঞ্জস্যপূর্ণ ফরম্যাট
  • রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য স্ট্রিমিং TTS
  • বড় কাজের জন্য ব্যাচ প্রসেসিং
  • Webhook বিজ্ঞপ্তি
API ডকুমেন্ট প্রদর্শন করুন
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

সহজ, স্বচ্ছ মূল্য নির্ধারণ

মুক্তভাবে শুরু করো, বড় হও।

মুক্ত

$0

১৫ ক্রেডিট

  • Kokoro, Piper, VITS, MeloTTS
  • ৫০০ অক্ষরের সীমা
  • ৩ জন/ঘন্টা (কোনো অ্যাকাউন্ট নেই)
নিবন্ধন করুন

স্টার্টার

$9/% 1 সেকেন্ড

মাসে ৫০০ ক্রেডিট

  • সব ২২+ মডেল
  • প্রতি প্রজন্মে ১০০,০০০ অক্ষর
  • ভয়েস ক্লোন
শুরু করো
সবচেয়ে জনপ্রিয়

প্রফেশনাল

$29/% 1 সেকেন্ড

২,০০০ ক্রেডিট/মাস

  • স্টার্টারে সবকিছু
  • API প্রবেশাধিকার
  • অগ্রাধিকার প্রসেসিং
প্রফেশনাল হয়ে যাও

ব্যবসা

$99/% 1 সেকেন্ড

১০,০০০ ক্রেডিট/মাস

  • প্রো-তে সবকিছু
  • ব্যাপক API
  • অগ্রাধিকার তালিকা
ব্যবসায়িক তথ্য

ক্রেডিট প্যাক সহ সব পরিকল্পনা দেখুন →

প্রায়শ জিজ্ঞাসিত প্রশ্ন

TTS.ai সবচেয়ে বিস্তৃত AI শব্দ প্ল্যাটফর্ম, ২২+ টেক্সট-টু-স্পিকার মডেল, শব্দ ক্লোনিং, শব্দ-টু-স্পিকার, এবং অডিও সরঞ্জাম প্রদান করে। সব মডেল উন্মুক্ত উৎস, কোন বিক্রেতা লক-ইন নেই।

হ্যাঁ! TTS.ai কোকোরো, পাইপার, ভিটিএস এবং মেলোটিটিএস মডেলের সাথে বিনামূল্যে টেক্সট-টু-স্পিকার প্রদান করে। কোন অ্যাকাউন্টের প্রয়োজন নেই। ১৫টি বিনামূল্যে ক্রেডিট এবং সমস্ত মডেল ব্যবহারের জন্য নিবন্ধন করুন। বিনামূল্যে পরিকল্পনা শুরু হয় $9/মাস।

গতি বাড়াতে Kokoro অথবা Piper ব্যবহার করুন। গুণগত মান বাড়াতে CosyVoice2অথবা StyleTTS2ব্যবহার করুন। শব্দের ক্লোন তৈরি করতে Chatterbox অথবা GPT-SoVITS ব্যবহার করুন। ডায়ালগ করার জন্য Dia TTS ব্যবহার করুন। একই টেক্সটের উপর একাধিক মডেল ব্যবহার করে তুলনা করুন।

হ্যাঁ। TTS, STT, ভয়েস ক্লোনিং এবং অডিও টুলস-এর জন্য OpenAI-সমর্থিত REST API। Pro ($29/mo) এবং Enterprise ($99/mo) প্ল্যানে উপলব্ধ। tts.ai/api/-এ নথিপত্র দেখুন।

মডেল অনুযায়ী শব্দের গুণগত মানের পার্থক্য দেখা যায়। প্রাইম মডেল যেমন CosyVoice2, StyleTTS2, এবং Chatterbox প্রাকৃতিক উচ্চারণ এবং অনুভূতি সহকারে মানুষের কাছাকাছি শব্দের গুণগত মানের সৃষ্টি করে। ফ্রি মডেল যেমন Kokoro বেশীরভাগ ব্যবহারের ক্ষেত্রে অসাধারণ গুণগত মানের প্রদান করে।

TTS.ai এর মডেল লাইব্রেরী ৩০+ ভাষা সমর্থন করে। ইংরেজি ভাষার সবচেয়ে বড় মডেল সমর্থন, কিন্তু CosyVoice2এর মত মডেল চীনা, জাপানি এবং কোরীয় ভাষা সমর্থন করে; GPT-SoVITS চীনা, জাপানি, কোরীয় এবং ইংরেজি ভাষা সমর্থন করে; এবং MeloTTS ইংরেজি, স্প্যানিশ, ফরাসি, চীনা, জাপানি এবং কোরীয় ভাষা সমর্থন করে।

হ্যাঁ। সমস্ত প্রক্রিয়াকরণ আমাদের নিবেদিত GPU সার্ভারে ঘটে। আমরা আপনার টেক্সট ইনপুট বা উত্পাদিত অডিও প্রেরণ করার পরে সংরক্ষণ করি না। ক্লোন করার জন্য আপলোড করা শব্দ নমুনা শুধুমাত্র বর্তমান সেশনের জন্য ব্যবহার করা হয় এবং সংরক্ষণ করা হয় না। আমরা কখনও আপনার তথ্য তৃতীয় পক্ষের সাথে শেয়ার করি না বা মডেল প্রশিক্ষণ দিতে এটি ব্যবহার করি না।

হ্যাঁ। TTS.ai-এ তৈরি সকল অডিও বাণিজ্যিকভাবে ব্যবহারের জন্য আপনার, যার মধ্যে ইউটিউব ভিডিও, পডকাস্ট, অডিওবুক, অ্যাপ, বিজ্ঞাপন এবং পণ্য অন্তর্ভুক্ত। আমাদের মডেলগুলি অনুমোদনযোগ্য লাইসেন্সের অধীনে উন্মুক্ত উৎস (MIT, Apache 2.0)। কোন মুক্ত বা অনুমোদন প্রয়োজন নেই।

TTS.ai সর্বোচ্চ গুণমানের জন্য ডিফল্টভাবে WAV ফরম্যাটে অডিও উৎপাদন করে। আপনি আমাদের বিনামূল্যে অডিও কনভার্টার টুল ব্যবহার করে MP3, FLAC, OGG, অথবা M4A তে রূপান্তর করতে পারেন। API অনুরোধের মধ্যে আপনার পছন্দের আউটপুট ফরম্যাট সরাসরি উল্লেখ করতে সমর্থন করে।

আপনি যে কণ্ঠ ক্লোন করতে চান তার একটি সংক্ষিপ্ত অডিও নমুনা (৫ সেকেন্ডের মধ্যে) আপলোড করুন, তারপর সেই কণ্ঠে কথা বলার জন্য যেকোন টেক্সট টাইপ করুন। Chatterbox, GPT-SoVITS, এবং CosyVoice2এর মতো মডেলগুলি কণ্ঠ ক্লোনিং সমর্থন করে। ক্লোন করা কণ্ঠ টোন, উচ্চারণ এবং কথা বলার শৈলী ধারণ করে।

ফ্রি মডেল (Kokoro, Piper, VITS, MeloTTS) ব্যবহারের জন্য কোন অ্যাকাউন্টের প্রয়োজন নেই এবং এর জন্য শূন্য ক্রেডিট খরচ হয়। স্ট্যান্ডার্ড মডেল (২ ক্রেডিট/১K অক্ষর)-এর মধ্যে রয়েছে Bark, CosyVoice ২, F5-TTS, এবং Dia। প্রিমিয়াম মডেল (৪ ক্রেডিট/১K অক্ষর)-এর মধ্যে রয়েছে OpenVoice, Chatterbox, StyleTTS ২, এবং Tortoise। প্রিমিয়াম মডেল সাধারণত উচ্চমানের, আরও বেশি কণ্ঠস্বর এবং অডিও ক্লোনিং-এর মতো অতিরিক্ত বৈশিষ্ট্য প্রদান করে।

হ্যাঁ। এই API ব্যাচ প্রক্রিয়াকরণ সমর্থন করে বড় পরিমাণে টেক্সটকে কথায় রূপান্তর করার জন্য। একাধিক অনুরোধ জমা দিন এবং কাজ UUIDs ব্যবহার করে ফলাফল অসঙ্গতভাবে পুনরুদ্ধার করুন। এন্টারপ্রাইজ প্ল্যান ($99/মাস) দ্রুত ব্যাচ প্রক্রিয়াকরণ করার জন্য অগ্রাধিকার লাইন প্রবেশাধিকার অন্তর্ভুক্ত করে। অডিওবুক উৎপাদন, কোর্স বিষয়বস্তু এবং বড় পরিসরের ভয়েসওভার প্রকল্পের জন্য আদর্শ।
4.0/5 (8)

AI Voice ব্যবহার শুরু করুন

TTS.ai ব্যবহার করে সৃষ্টিকর্তা, ডেভেলপার এবং ব্যবসায়ীদের সাথে যোগ দিন