বক্তৃতা থেকে বক্তৃতা

কথা বলা অডিও রূপান্তর করুন - মূল বিষয়বস্তু সংরক্ষণ করেই কণ্ঠ, আবেগ, ভাষা এবং শৈলী পরিবর্তন করুন।

নিবন্ধন করুন

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

অডিও উৎস

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

- অথবা আপনার কন্ঠস্বর রেকর্ড করুন -

00:00

রূপান্তর সেটিংস

রূপান্তর ধরন

মডেল

লক্ষ্য ভয়েস

ফলাফল

শব্দের অডিও আপলোড করুন, আপনার রূপান্তর নির্বাচন করুন এবং শুরু করতে রূপান্তর ক্লিক করুন

এটি কিভাবে কাজ করে

১. বক্তৃতা আপলোড করো

আপনি যে অডিওটি রূপান্তর করতে চান তা রেকর্ড অথবা আপলোড করুন

২. রূপান্তর নির্বাচন করুন

ভয়েস পরিবর্তন, শৈলী স্থানান্তর, অথবা ভাষা রূপান্তর নির্বাচন করুন

৩. এআই রূপান্তর

AI শেষ-থেকে-শেষ অডিও প্রক্রিয়াকরণ বাক্যের বিষয়বস্তু সংরক্ষণ করে

ডাউনলোড

ফলাফল শুনুন এবং আপনার রূপান্তরিত অডিও ডাউনলোড করুন

ব্যবহারের ক্ষেত্রে

বিষয়বস্তু, প্রবেশযোগ্যতা এবং সৃজনশীল প্রকল্পের জন্য কথা থেকে কথা

ভিডিও দ্বৈতকরণ

ভিডিওগুলোকে অন্য ভাষায় ডাব করুন, কিন্তু মূল বক্তার কন্ঠের বৈশিষ্ট্য রক্ষা করুন।

ইমোট- আইকন সংশোধন

রেকর্ডিং এর আবেগপূর্ণ টোন পরিবর্তন করুন - শান্ত কথাকে উত্তেজনাপূর্ণ বা নিরপেক্ষ কথাকে উষ্ণ এবং বন্ধুত্বপূর্ণ করুন।

বক্তৃতা প্রদর্শন

বিভিন্ন কন্ঠ এবং শৈলীর সাথে রুক্ষ ভয়েস রেকর্ডিংকে পলিশ করা ভয়েসওভারে রূপান্তর করুন।

ভয়েস অ্যানোনিমাইজেশন

উইস্টলব্লিং বা গোপনীয়তা রক্ষার জন্যে একজন বক্তার পরিচয় লুকিয়ে রাখার সময় প্রতিটি শব্দ সংরক্ষণ করুন।

কথা থেকে কথার মডেলName

OpenVoice

দ্রুত শব্দ রূপান্তর করে গ্রানালার স্টাইল নিয়ন্ত্রণ। শব্দ পরিচয়, গতি এবং আবেগ সেকেন্ডে পরিবর্তন করুন।

দ্রুত প্রসেসিং
স্টাইল স্থানান্তর
ক্রস-লিঙ্গুইজ

Chatterbox

Resemble AI-এর সুবিন্যস্ত আবেগ নিয়ন্ত্রণের সাথে শূন্য-শট ভয়েস ক্লোনিং।

আবেগ নিয়ন্ত্রণ
জিরো-শট ক্লোনিং
উচ্চ নির্ভরযোগ্যতা

CosyVoice 2

প্রাকৃতিক প্রসোডি এবং স্ট্রিমিং সমর্থনের সাথে ৮টি ভাষার মধ্যে ক্রস-লিঙ্গুইস্টিক ভয়েস ক্লোনিং।

৮টি ভাষা
ভয়েস ক্লোন
স্ট্রিমিং

প্রায়শ জিজ্ঞাসিত প্রশ্ন

স্পিকার টু স্পিকার (এসটিএস) এআই একটি কথা বলা অডিও রেকর্ডিংকে অন্য একটি কথা বলা আউটপুটে রূপান্তরিত করে - শব্দ, শৈলী, আবেগ, বা ভাষা পরিবর্তন করে, কিন্তু মূল শব্দ এবং সময় সংরক্ষণ করে। এটি একটি একক পাইপলাইনে কথা বলা সনাক্তকরণ, প্রক্রিয়াকরণ এবং সংশ্লেষণকে একত্রিত করে।

টেক্সট-টু-স্পীচ লেখা টেক্সটকে অডিওতে রূপান্তর করে। স্পীচ-টু-স্পীচ বর্তমান অডিওকে ইনপুট হিসেবে গ্রহণ করে এবং সরাসরি নতুন অডিওতে রূপান্তর করে - স্বাভাবিক রীতি, বিরতি, জোর এবং মূল রেকর্ডের আবেগ সংরক্ষণ করে, টেক্সট থেকে কথা তৈরি করার পরিবর্তে।

সাধারণ ব্যবহারের মধ্যে রয়েছে ভিডিওকে অন্য ভাষায় অনুবাদ করা, রেকর্ডিংয়ের সময়ে স্পিকারের কন্ঠ পরিবর্তন করা, অডিওতে আবেগ বা টোন পরিবর্তন করা, রেকর্ডিংয়ের পুরোনো অংশ থেকে ভয়েসওভার তৈরি করা এবং রেকর্ডিংয়ের বিষয়বস্তু সংরক্ষণের সময়ে শব্দের নাম গোপন করে রাখা।

অডিও রূপান্তর মডেল যেমন OpenVoice এবং RVC অডিও থেকে অডিও রূপান্তর পরিচালনা করে। ক্রস-ভাষা থেকে অডিও রূপান্তরের জন্য CosyVoice2এবং GPT-SoVITS একটি ভিন্ন ভাষায় ক্লোন এবং পুনরায় সংশ্লেষণ করতে পারে। Chatterbox এছাড়াও রেফারেন্স অডিও ভিত্তিক সংশ্লেষণ সমর্থন করে।

হ্যাঁ। শব্দ ক্লোনিং মডেল ব্যবহার করে, আপনি আপনার কথা অন্য ভাষায় রূপান্তর করতে পারেন, আপনার নিজের শব্দ বৈশিষ্ট্য সংরক্ষণ করে। AI আপনার শব্দ পরিচয় বের করে এবং লক্ষ্য ভাষা বা শৈলীতে অডিও পুনরায় সংশ্লেষণ করে।

পাইপলাইন প্রথমে আপনার কথার অনুবাদ করে, তারপর লক্ষ্য ভাষায় অনুবাদ করে, তারপর আপনার মূল ভাষায় অনুবাদকৃত লেখার সংশ্লেষণের জন্য শব্দ ক্লোনিং ব্যবহার করে। কোসিভয়েস ২-এর মতো মডেলগুলি ৮টি ভাষার ক্রস-ভাষা সংশ্লেষণের জন্য সমর্থন করে।

সবচেয়ে ভালো ফলাফল পেতে হলে, পরিষ্কার অডিও সর্বনিম্ন পটভূমির শব্দ সহ আপলোড করুন। WAV অথবা FLAC 16kHz অথবা উচ্চতর ব্যবহার করা সবচেয়ে ভালো। MP3, OGG, M4A, এবং WEBMও গ্রহণযোগ্য। পরিষ্কার কথা বলা সবচেয়ে সঠিক রূপান্তর তৈরি করে।

প্রায়-রিয়েল-টাইম প্রক্রিয়াকরণ আমাদের API ব্যবহার করে দ্রুত মডেল ব্যবহার করে যেমন Kokoro সংশ্লেষণের জন্য এবং দ্রুত Whisper সনাক্তকরণের জন্য। Latency মডেল এবং অডিও দৈর্ঘ্য উপর নির্ভর করে, কিন্তু সাব-৩-সেকেন্ড টুর্নআউট সংক্ষিপ্ত উক্তির জন্য অর্জন করা সম্ভব।

হ্যাঁ। Chatterbox, Spark TTS, এবং IndexTTS-2 এর মত মডেলগুলি আবেগ এবং শৈলী নিয়ন্ত্রণ সমর্থন করে। আপনি একই শব্দ এবং বক্তার পরিচয় বজায় রেখে শান্ত বক্তব্যকে উত্তেজিত, দুঃখীকে খুশিতে বা নিরপেক্ষকে নাটকীয়তে রূপান্তর করতে পারেন।

বক্তৃতা থেকে বক্তৃতা সনাক্তকরণ এবং সংশ্লেষণ ক্রেডিট একত্রিত করে। একটি সাধারণ ১- মিনিট রূপান্তর নির্বাচিত মডেলের উপর নির্ভর করে ৩- ৮ ক্রেডিট ব্যবহার করে। কোকোরোর মতো ফ্রি- টাইর মডেলগুলি শূন্য খরচে সংশ্লেষণের জন্য ব্যবহার করা যেতে পারে।

বিনামূল্যে ব্যবহারকারীরা ১ মিনিট পর্যন্ত অডিও প্রক্রিয়াকরণ করতে পারেন। বিনামূল্যে পরিকল্পনা ১০ মিনিট পর্যন্ত ফাইল সমর্থন করে। দীর্ঘ রেকর্ডের জন্য অডিওটি অংশে বিভক্ত করুন অথবা আমাদের API ব্যবহার করুন ব্যাচ প্রক্রিয়াকরণের জন্য কোন দৈর্ঘ্য সীমা নেই।

হ্যাঁ, আপলোডকৃত সকল অডিও আমাদের নিরাপদ GPU সার্ভারে প্রসেস করা হয় এবং ২৪ ঘণ্টার মধ্যে স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়। আমরা কখনো আপনার অডিওকে মডেল প্রশিক্ষণের জন্য ব্যবহার করি না। সকল স্থানান্তর এনক্রিপ্ট করা সংযোগ ব্যবহার করে এবং সার্ভার-টু-সার্ভার যোগাযোগ প্রমাণিত হয়।

5.0/5 (1)

AI এর সাথে যেকোন বক্তব্য রূপান্তর করুন

কন্ঠ, আবেগ, ভাষা এবং শৈলী পরিবর্তন করুন। বিনামূল্যে নিবন্ধন করুন এবং শুরু করার জন্য ৫০ ক্রেডিট পান।

নিবন্ধন করুন মূল্য প্রদর্শন

বক্তৃতা থেকে বক্তৃতা

অডিও উৎস

রূপান্তর সেটিংস

ফলাফল

প্রাথমিক

রূপান্তরিত

এটি কিভাবে কাজ করে

১. বক্তৃতা আপলোড করো

২. রূপান্তর নির্বাচন করুন

৩. এআই রূপান্তর

ডাউনলোড

ব্যবহারের ক্ষেত্রে

ভিডিও দ্বৈতকরণ

ইমোট- আইকন সংশোধন

বক্তৃতা প্রদর্শন

ভয়েস অ্যানোনিমাইজেশন

কথা থেকে কথার মডেলName

OpenVoice

Chatterbox

CosyVoice 2

প্রায়শ জিজ্ঞাসিত প্রশ্ন

স্পিকার থেকে স্পিকার এআই কি?

টেক্সট টু স্পিকার থেকে স্পিকার টু স্পিকার কিভাবে আলাদা?

আমি কিভাবে স্পিকার-টু-স্পিকার ব্যবহার করতে পারি?

কোন মডেলগুলি স্পিকার-টু-স্পিকার সমর্থন করে?

স্পীচ টু স্পীচ কি আমার মূল কণ্ঠ সংরক্ষণ করতে পারে?

ক্রস-লিঙ্গুইজ স্পিকার টু স্পিকার কিভাবে কাজ করে?

অডিও ফাইলের গুণগত মান কি হবে?

রিয়েল টাইম স্পীচ টু স্পীচ কি সম্ভব?

আমি কি আমার অনুভূতি বা কথা বলার ধরন পরিবর্তন করতে পারি?

কত খরচ হয় স্পিকার থেকে স্পিকারে কথা বলার?

অডিও ফাইলের সর্বোচ্চ দৈর্ঘ্য কত?

আমার অডিও কি গোপন রাখা হয়েছে?

AI এর সাথে যেকোন বক্তব্য রূপান্তর করুন