বক্তৃতা থেকে বক্তৃতা

কথা বলা অডিও রূপান্তর করুন - মূল বিষয়বস্তু সংরক্ষণ করেই কণ্ঠ, আবেগ, ভাষা এবং শৈলী পরিবর্তন করুন।

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

অডিও উৎস

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

ফাইল.mp3

0 MB
- অথবা আপনার কন্ঠস্বর রেকর্ড করুন -
00:00

রূপান্তর সেটিংস

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

Upload a reference of the target voice. 10-30 sec recommended.

ফাইল.mp3

0 MB

ফলাফল

শব্দের অডিও আপলোড করুন, আপনার রূপান্তর নির্বাচন করুন এবং শুরু করতে রূপান্তর ক্লিক করুন

বাক্যের রূপান্তর...

প্রাথমিক

রূপান্তরিত

এটি কিভাবে কাজ করে

১. বক্তৃতা আপলোড করো

আপনি যে অডিওটি রূপান্তর করতে চান তা রেকর্ড অথবা আপলোড করুন

২. রূপান্তর নির্বাচন করুন

ভয়েস পরিবর্তন, শৈলী স্থানান্তর, অথবা ভাষা রূপান্তর নির্বাচন করুন

৩. এআই রূপান্তর

AI শেষ-থেকে-শেষ অডিও প্রক্রিয়াকরণ বাক্যের বিষয়বস্তু সংরক্ষণ করে

ডাউনলোড

ফলাফল শুনুন এবং আপনার রূপান্তরিত অডিও ডাউনলোড করুন

ব্যবহারের ক্ষেত্রে

বিষয়বস্তু, প্রবেশযোগ্যতা এবং সৃজনশীল প্রকল্পের জন্য কথা থেকে কথা

ভিডিও দ্বৈতকরণ

ভিডিওগুলোকে অন্য ভাষায় ডাব করুন, কিন্তু মূল বক্তার কন্ঠের বৈশিষ্ট্য রক্ষা করুন।

ইমোট- আইকন সংশোধন

রেকর্ডিং এর আবেগপূর্ণ টোন পরিবর্তন করুন - শান্ত কথাকে উত্তেজনাপূর্ণ বা নিরপেক্ষ কথাকে উষ্ণ এবং বন্ধুত্বপূর্ণ করুন।

বক্তৃতা প্রদর্শন

বিভিন্ন কন্ঠ এবং শৈলীর সাথে রুক্ষ ভয়েস রেকর্ডিংকে পলিশ করা ভয়েসওভারে রূপান্তর করুন।

ভয়েস অ্যানোনিমাইজেশন

উইস্টলব্লিং বা গোপনীয়তা রক্ষার জন্যে একজন বক্তার পরিচয় লুকিয়ে রাখার সময় প্রতিটি শব্দ সংরক্ষণ করুন।

কথা থেকে কথার মডেলName

OpenVoice

দ্রুত শব্দ রূপান্তর করে গ্রানালার স্টাইল নিয়ন্ত্রণ। শব্দ পরিচয়, গতি এবং আবেগ সেকেন্ডে পরিবর্তন করুন।

  • দ্রুত প্রসেসিং
  • স্টাইল স্থানান্তর
  • ক্রস-লিঙ্গুইজ

Chatterbox

Resemble AI-এর সুবিন্যস্ত আবেগ নিয়ন্ত্রণের সাথে শূন্য-শট ভয়েস ক্লোনিং।

  • আবেগ নিয়ন্ত্রণ
  • জিরো-শট ক্লোনিং
  • উচ্চ নির্ভরযোগ্যতা

CosyVoice 2

প্রাকৃতিক প্রসোডি এবং স্ট্রিমিং সমর্থনের সাথে ৮টি ভাষার মধ্যে ক্রস-লিঙ্গুইস্টিক ভয়েস ক্লোনিং।

  • ৮টি ভাষা
  • ভয়েস ক্লোন
  • স্ট্রিমিং

প্রায়শ জিজ্ঞাসিত প্রশ্ন

স্পিকার টু স্পিকার (এসটিএস) এআই একটি কথা বলা অডিও রেকর্ডিংকে অন্য একটি কথা বলা আউটপুটে রূপান্তরিত করে - শব্দ, শৈলী, আবেগ, বা ভাষা পরিবর্তন করে, কিন্তু মূল শব্দ এবং সময় সংরক্ষণ করে। এটি একটি একক পাইপলাইনে কথা বলা সনাক্তকরণ, প্রক্রিয়াকরণ এবং সংশ্লেষণকে একত্রিত করে।

টেক্সট-টু-স্পীচ লেখা টেক্সটকে অডিওতে রূপান্তর করে। স্পীচ-টু-স্পীচ বর্তমান অডিওকে ইনপুট হিসেবে গ্রহণ করে এবং সরাসরি নতুন অডিওতে রূপান্তর করে - স্বাভাবিক রীতি, বিরতি, জোর এবং মূল রেকর্ডের আবেগ সংরক্ষণ করে, টেক্সট থেকে কথা তৈরি করার পরিবর্তে।

সাধারণ ব্যবহারের মধ্যে রয়েছে ভিডিওকে অন্য ভাষায় অনুবাদ করা, রেকর্ডিংয়ের সময়ে স্পিকারের কন্ঠ পরিবর্তন করা, অডিওতে আবেগ বা টোন পরিবর্তন করা, রেকর্ডিংয়ের পুরোনো অংশ থেকে ভয়েসওভার তৈরি করা এবং রেকর্ডিংয়ের বিষয়বস্তু সংরক্ষণের সময়ে শব্দের নাম গোপন করে রাখা।

অডিও রূপান্তর মডেল যেমন OpenVoice এবং RVC অডিও থেকে অডিও রূপান্তর পরিচালনা করে। ক্রস-ভাষা থেকে অডিও রূপান্তরের জন্য CosyVoice2এবং GPT-SoVITS একটি ভিন্ন ভাষায় ক্লোন এবং পুনরায় সংশ্লেষণ করতে পারে। Chatterbox এছাড়াও রেফারেন্স অডিও ভিত্তিক সংশ্লেষণ সমর্থন করে।

হ্যাঁ। শব্দ ক্লোনিং মডেল ব্যবহার করে, আপনি আপনার কথা অন্য ভাষায় রূপান্তর করতে পারেন, আপনার নিজের শব্দ বৈশিষ্ট্য সংরক্ষণ করে। AI আপনার শব্দ পরিচয় বের করে এবং লক্ষ্য ভাষা বা শৈলীতে অডিও পুনরায় সংশ্লেষণ করে।

পাইপলাইন প্রথমে আপনার কথার অনুবাদ করে, তারপর লক্ষ্য ভাষায় অনুবাদ করে, তারপর আপনার মূল ভাষায় অনুবাদকৃত লেখার সংশ্লেষণের জন্য শব্দ ক্লোনিং ব্যবহার করে। কোসিভয়েস ২-এর মতো মডেলগুলি ৮টি ভাষার ক্রস-ভাষা সংশ্লেষণের জন্য সমর্থন করে।

সবচেয়ে ভালো ফলাফল পেতে হলে, পরিষ্কার অডিও সর্বনিম্ন পটভূমির শব্দ সহ আপলোড করুন। WAV অথবা FLAC 16kHz অথবা উচ্চতর ব্যবহার করা সবচেয়ে ভালো। MP3, OGG, M4A, এবং WEBMও গ্রহণযোগ্য। পরিষ্কার কথা বলা সবচেয়ে সঠিক রূপান্তর তৈরি করে।

প্রায়-রিয়েল-টাইম প্রক্রিয়াকরণ আমাদের API ব্যবহার করে দ্রুত মডেল ব্যবহার করে যেমন Kokoro সংশ্লেষণের জন্য এবং দ্রুত Whisper সনাক্তকরণের জন্য। Latency মডেল এবং অডিও দৈর্ঘ্য উপর নির্ভর করে, কিন্তু সাব-৩-সেকেন্ড টুর্নআউট সংক্ষিপ্ত উক্তির জন্য অর্জন করা সম্ভব।

হ্যাঁ। Chatterbox, Spark TTS, এবং IndexTTS-2 এর মত মডেলগুলি আবেগ এবং শৈলী নিয়ন্ত্রণ সমর্থন করে। আপনি একই শব্দ এবং বক্তার পরিচয় বজায় রেখে শান্ত বক্তব্যকে উত্তেজিত, দুঃখীকে খুশিতে বা নিরপেক্ষকে নাটকীয়তে রূপান্তর করতে পারেন।

বক্তৃতা থেকে বক্তৃতা সনাক্তকরণ এবং সংশ্লেষণ ক্রেডিট একত্রিত করে। একটি সাধারণ ১- মিনিট রূপান্তর নির্বাচিত মডেলের উপর নির্ভর করে ৩- ৮ ক্রেডিট ব্যবহার করে। কোকোরোর মতো ফ্রি- টাইর মডেলগুলি শূন্য খরচে সংশ্লেষণের জন্য ব্যবহার করা যেতে পারে।

বিনামূল্যে ব্যবহারকারীরা ১ মিনিট পর্যন্ত অডিও প্রক্রিয়াকরণ করতে পারেন। বিনামূল্যে পরিকল্পনা ১০ মিনিট পর্যন্ত ফাইল সমর্থন করে। দীর্ঘ রেকর্ডের জন্য অডিওটি অংশে বিভক্ত করুন অথবা আমাদের API ব্যবহার করুন ব্যাচ প্রক্রিয়াকরণের জন্য কোন দৈর্ঘ্য সীমা নেই।

হ্যাঁ, আপলোডকৃত সকল অডিও আমাদের নিরাপদ GPU সার্ভারে প্রসেস করা হয় এবং ২৪ ঘণ্টার মধ্যে স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়। আমরা কখনো আপনার অডিওকে মডেল প্রশিক্ষণের জন্য ব্যবহার করি না। সকল স্থানান্তর এনক্রিপ্ট করা সংযোগ ব্যবহার করে এবং সার্ভার-টু-সার্ভার যোগাযোগ প্রমাণিত হয়।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

AI এর সাথে যেকোন বক্তব্য রূপান্তর করুন

কন্ঠ, আবেগ, ভাষা এবং শৈলী পরিবর্তন করুন। বিনামূল্যে নিবন্ধন করুন এবং শুরু করার জন্য ৫০ ক্রেডিট পান।