ব্যাচ TTS প্রসেসিং

একসাথে শত শত টেক্সটকে বাক্যে রূপান্তর করুন। প্রত্যেক লাইনের জন্য অডিও উৎপাদন করার জন্য নিজে হাতে সারি প্রবেশ করুন অথবা একটি CSV/XLSX স্প্রেডশীট আপলোড করুন।

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন
# টেক্সট ভয়েস ফাইলের নাম
1
2
3

আপনার CSV ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

কলাম সহ CSV: text, voice (বৈকল্পিক), filename (বৈকল্পিক)
file.csv
# টেক্সট ভয়েস ফাইলের নাম
উদাহরণ CSV ফরম্যাট:
textvoicefilename
আমাদের সার্ভিসে স্বাগতমaf_heartwelcome
আপনার অর্ডার পাঠানো হয়েছেorder_shipped
ফোন করার জন্য ধন্যবাদbf_emmathanks

এখানে আপনার এক্সেল ফাইল টানুন এবং ফেলে দিন, অথবা ব্রাউজ

কলাম সহ XLSX: text, voice (বৈকল্পিক), filename (বৈকল্পিক)
file.xlsx
# টেক্সট ভয়েস ফাইলের নাম
উদাহরণ XLSX ফরম্যাট:
textvoicefilename
আমাদের সার্ভিসে স্বাগতমaf_heartwelcome
আপনার অর্ডার পাঠানো হয়েছেorder_shipped
ফোন করার জন্য ধন্যবাদbf_emmathanks
0 তৈরি করার জন্য আইটেম প্রস্তুত 0 অক্ষর
কোকোরো মডেলের সাথে ফ্রি
বড় ব্যাচের জন্য প্রসেসিংয়ে কয়েক মিনিট সময় লাগতে পারে
০ / ০ প্রসেস করা হচ্ছে... 0%
ব্যাচ ফলাফল
# ফাইলের নাম স্ট্যাটাস অ্যাকশন

ব্যাচ সেটিংস

একটি সারি একটি শব্দ উল্লেখ না করলে ব্যবহৃত

কৃতজ্ঞতা

মোট খরচ 0 অক্ষর
বর্তমান ভারসাম্য লগ-ইন করা নেই
আরো অক্ষর লাগবে?

ব্যাচ প্রসেসিং টিপস

  • দ্রুততম কর্মপ্রবাহের জন্য ১০০+ আইটেমের জন্য CSV ব্যবহার করুন
  • প্রতিটি সারি একটি অডিও ফাইল তৈরি করে
  • প্রতি ব্যাচে সর্বোচ্চ ৫০০ আইটেম
  • প্রসেসিংয়ের সময় মোট টেক্সটের দৈর্ঘ্যের ওপর নির্ভর করে
  • ডিফল্ট কন্ঠ ব্যবহার করার জন্য কলামটি ফাঁকা রাখুন
  • ডাউনলোড করা ZIP আপনার নামকরণ নকশা সংরক্ষণ করে

ব্যাচ TTS প্রসেসিং কিভাবে কাজ করে

তিনটি সহজ পদক্ষেপে শত শত টেক্সটের জন্য অডিও তৈরি করুন। কোন স্ক্রিপ্টিং বা API জ্ঞানের প্রয়োজন নেই।

১ম ধাপ

আপনার লেখা যোগ করুন

একবার একটি সারিতে নিজে হাতে টেক্সট লিখুন, অথবা একটি CSV অথবা XLSX স্প্রেডশিট আপলোড করুন। প্রতিটি সারিতে একটি অডিও ফাইল তৈরি হবে। প্রত্যেক আউটপুট সম্পূর্ণ নিয়ন্ত্রণের জন্য প্রত্যেক সারিতে একটি শব্দ এবং ফাইলের নাম উল্লেখ করুন।

২য় ধাপ

সেটিংস কনফিগার করো

একটি ডিফল্ট AI মডেল এবং কন্ঠ বেছে নিন যা কোন নির্দিষ্ট কন্ঠ ছাড়া সমস্ত সারিতে প্রয়োগ করা হবে । আপনার আউটপুট ফরম্যাট (MP3 বা WAV) বেছে নিন এবং একটি নামকরণ প্যাটার্ন নির্ধারণ করুন: ফাইলের নামের কলাম, ধারাবাহিক সংখ্যা, অথবা একটি স্বনির্বাচিত উপসর্গ ব্যবহার করুন ।

৩য় ধাপ

ZIP তৈরি এবং ডাউনলোড করো

সব তৈরি করো ক্লিক করুন এবং প্রতিটি সারি প্রক্রিয়াকরণের সময় বাস্তব সময়ের অগ্রগতি দেখুন। একক ফলাফল চালানো বা ডাউনলোড করা, অথবা একই সাথে সবকিছুকে একটি ZIP আর্কাইভ হিসাবে ধারণ করা। ব্যর্থ বস্তুগুলি এককভাবে পুনরায় চেষ্টা করা যেতে পারে।

ব্যাচ TTS ব্যবহারের ক্ষেত্রে

ব্যাচ প্রসেসিং শিক্ষা, টেলিফোন, ই-কমার্স এবং বিষয়বস্তু স্থানীয়করণের ক্ষেত্রে ঘণ্টার পর ঘণ্টা পুনরাবৃত্তিমূলক কাজ সাশ্রয় করে।

ই- শিক্ষা মডিউল

একই সাথে সমগ্র কোর্সগুলির জন্য বর্ণনা তৈরি করুন। পাঠ স্ক্রিপ্টগুলির একটি স্প্রেডশীট আপলোড করুন এবং সমস্ত মডিউলগুলির মধ্যে একটি শব্দও নিজে হাতে রেকর্ড না করেই স্থিতিশীল, পেশাদার অডিও তৈরি করুন।

IVR অনুরোধ

আপনার ফোন সিস্টেমের সকল প্রম্পট একবার তৈরি করুন। মেনু অপশন, বার্তা রাখুন, কর্মদিবসের পর শুভেচ্ছা এবং বিভাগের স্থানান্তর -- একই শব্দ এবং টোন সহ শত শত প্রম্পট তৈরি করুন।

পণ্যের বর্ণনা

আপনার পণ্য ক্যাটালগকে অডিও বর্ণনা, স্মার্ট স্পিকার, অথবা স্টোর কিওস্কে পরিণত করুন। আপনার পণ্য CSV রপ্তানি করুন এবং প্রতিটি আইটেমের জন্য একটি অডিও ফাইল তৈরি করুন।

স্থানীয়করণ

আপনার ইউআই স্ট্রিং বা বিষয়বস্তু একাধিক ভাষায় অনুবাদ করুন, তারপর প্রতিটি স্থানীয় ভাষার জন্য ব্যাচ-উৎপাদন অডিও। অ্যাপ্লিকেশন, খেলা এবং ওয়েবসাইটের জন্য উপযুক্ত যাদের স্থানীয় ভাষার শব্দ বা বর্ণনা প্রয়োজন।

অডিও ক্যাটালগ

গঠনমূলক তথ্য থেকে অনুসন্ধানযোগ্য অডিও লাইব্রেরী নির্মাণ করুন। জাদুঘর, লাইব্রেরি এবং আর্কাইভ মেটাডাটা, বর্ণনা, অথবা ট্রান্সক্রিপশন ব্যাচ প্রসেসিং সহ অডিও গাইডগুলিতে রূপান্তর করতে পারে।

বিজ্ঞপ্তি শব্দ

আপনার অ্যাপলিকেশন বা ডিভাইসের জন্য বিজ্ঞপ্তি, সতর্কবার্তা এবং নিশ্চিতকরণ শব্দের একটি সম্পূর্ণ সেট তৈরি করুন। সংক্ষিপ্ত বার্তাগুলির একটি তালিকা আপলোড করুন এবং একটি ZIP ডাউনলোড করুন যা অডিও ফাইলগুলি একত্রিত করতে প্রস্তুত।

ব্যাচ প্রসেসিং বৈশিষ্ট্য

টেক্সট-টু-স্পিকারের বড় পরিমাণ কার্যকর ও নির্ভরযোগ্যভাবে প্রক্রিয়াকরণের জন্য আপনার যা যা প্রয়োজন।

CSV & XLSX আমদানি করো

আপনার লেখার সাথে একটি স্প্রেডশীট আপলোড করুন এবং সিস্টেম এটি স্বয়ংক্রিয়ভাবে পার্স করবে। প্রথম কলামটি রূপান্তরিত হতে পারে এমন লেখা এবং বৈকল্পিক কলামগুলি আপনাকে প্রতিটি সারিতে একটি শব্দ এবং ফাইলের নাম উল্লেখ করতে দেয়। কমন বা সেমিকোলন বিভাজকের সাথে স্ট্যান্ডার্ড CSV সমর্থন করে, পাশাপাশি এক্সেল XLSX ফাইল। শীর্ষচরণগুলি স্বয়ংক্রিয়ভাবে সনাক্ত করা হয় তাই কলামের ক্রমটি গুরুত্বপূর্ণ নয়।

প্রতি- সারির ভয়েস নিয়ন্ত্রণ

সর্বোচ্চ স্থিতিশীলতার জন্য প্রতিটি সারিকে একটি ভিন্ন কন্ঠ নির্ধারণ করুন। আপনার স্প্রেডশীটের কন্ঠ কলাম বা নিজে হাতে ইনপুট মোডে ড্রপডাউন ব্যবহার করুন। কোন নির্দিষ্ট কন্ঠ ছাড়া সারি স্বয়ংক্রিয়ভাবে আপনার ব্যাচ সেটিংস থেকে ডিফল্ট কন্ঠ ব্যবহার করে। একক ব্যাচের মধ্যে বিভিন্ন, প্রাকৃতিক-স্বরযুক্ত অডিও সেট তৈরি করতে কন্ঠ মিশ্রণ এবং মেলে।

অগ্রগতি অনুসরণ

আপনার ব্যাচ প্রক্রিয়াকরণের সময় বাস্তব সময়ের অগ্রগতি বার এবং প্রতিটি সারি অবস্থা আপডেট দেখুন। প্রত্যেক সারি অপেক্ষারত, প্রক্রিয়াকরণ, সম্পন্ন এবং ব্যর্থ অবস্থার মধ্য দিয়ে অগ্রসর হয়। ফলাফল টেবিল সরাসরি আপডেট করা হয় যাতে আপনি ব্যাচের বাকি অংশ এখনও উত্পাদন করা হচ্ছে যখন আপনি সম্পন্ন অডিও ফাইল প্রাকদর্শন শুরু করতে পারেন। ব্যর্থ বস্তুগুলি ত্রুটি বিবরণ প্রদর্শন করে এবং পুনরায় চেষ্টা করা যেতে পারে।

ZIP রপ্তানি

একটি ক্লিকের মাধ্যমে একটি একক ZIP আর্কাইভ হিসাবে সমস্ত উত্পন্ন অডিও ফাইল ডাউনলোড করুন। ফাইলগুলি আপনার নির্বাচিত নামকরণ প্যাটার্ন অনুযায়ী নামকরণ করা হয়: স্প্রেডশীট থেকে মূল ফাইলের নাম, ধারাবাহিক সংখ্যা (001.mp3, 002.mp3), অথবা একটি স্বনির্ধারিত উপসর্গ এবং একটি সংখ্যা। ZIP আপনার ইনপুট সারিগুলির ক্রম সংরক্ষণ করে যাতে সহজে আপনার উৎস ডেটাতে ফিরে ম্যাপ করা যায়।

প্রায়শ জিজ্ঞাসিত প্রশ্ন

ব্যাচ প্রসেসিং আপনাকে একসাথে অনেক টেক্সটকে কথায় রূপান্তর করতে দেয়। আপনার টেক্সটের সাথে একটি CSV অথবা XLSX স্প্রেডশীট আপলোড করুন, কন্ঠ এবং বৈশিষ্ট্য নির্বাচন করুন, এবং প্রতিটি সারি জন্য অডিও তৈরি করুন। সব ফলাফল একটি ZIP ফাইল হিসাবে ডাউনলোড করুন।

আপনার CSV ফাইলে অন্তত একটি "টেক্সট" কলাম থাকা আবশ্যক। বৈকল্পিক কলাম: "voice" (voice ID), "filename" (আউটপুট ফাইলের নাম), "model" (TTS মডেল)। প্রতিটি সারিতে voice/model উল্লেখ না করা হলে ডিফল্ট বৈশিষ্ট্য ব্যবহার করা হবে।

প্রতি ব্যাচে সর্বোচ্চ ৫০০টি বস্তু। বড় ব্যাচের জন্য, আপনার CSV একাধিক ফাইলে বিভক্ত করুন। প্রত্যেকটি বস্তু স্বাধীনভাবে প্রক্রিয়াকৃত হয়, তাই একটি সারি ব্যর্থ হলে অন্যগুলি প্রভাবিত হবে না।

হ্যাঁ। আপনার CSV-এ প্রতিটি সারির জন্য ভয়েস আইডি সহ একটি "ভয়েস" কলাম যোগ করুন। কোন ভয়েস উল্লেখ না করা সারিতে ব্যাচ সেটিংস প্যানেল থেকে ডিফল্ট ভয়েস ব্যবহার করা হবে।

প্রসেসিংয়ের সময় নির্ভর করে মোট টেক্সটের দৈর্ঘ্য এবং ব্যবহৃত মডেলের ওপর। Kokoro প্রায় ১০০ লাইন (প্রতিটিতে ৫০০ অক্ষর) প্রসেস করে প্রায় ২ মিনিটে। Tortoise-এর মত ধীরগতির মডেলগুলিতে বেশি সময় লাগবে।

হ্যাঁ। ইন্টারফেসটি একটি অগ্রগতি বার এবং প্রতিটি সারি অবস্থা প্রদর্শন করে (লিস্টে, প্রসেসিং, সম্পন্ন, ব্যর্থ)। আপনি বাস্তব সময়ে ফলাফল দেখতে পারেন এবং ব্যাচ শেষ হওয়ার আগে সম্পন্ন ফাইল ডাউনলোড শুরু করতে পারেন।

আউটপুট ফরম্যাট হিসেবে MP3 অথবা WAV বেছে নিন। ব্যাচের সমস্ত ফাইল একই ফরম্যাট ব্যবহার করে। একক ফাইল অথবা সমস্ত ফলাফল একক ZIP আর্কাইভ হিসাবে ডাউনলোড করুন।

ডিফল্ট অনুযায়ী, ফাইলগুলির সংখ্যা ক্রমানুসারে নির্ধারিত হয় (০০০১.mp3, ০০০২.mp3,...)। আপনি "ফাইলনাম" CSV কলামের মাধ্যমে স্বনির্বাচিত ফাইলের নাম নির্ধারণ করতে পারেন, অথবা বৈশিষ্ট্যগুলিতে একটি উপসর্গ প্যাটার্ন নির্ধারণ করতে পারেন।

হ্যাঁ। আমাদের API-তে অনুরূপভাবে ব্যক্তিগত TTS অনুরোধ জমা দিন। প্রত্যেকটি পোলিং-এর জন্য একটি UUID ফিরিয়ে দেয়। সুবিধার জন্য, ওয়েব ব্যাচ টুল আপনার জন্য orchestration, parallelism, এবং ZIP প্যাকেজিং পরিচালনা করে।

ই-লর্নিং কোর্স নারেশন (প্রতিটি স্লাইডে এক সারি), আইভিআর ফোন সিস্টেম প্রম্পট, পণ্য বর্ণনা অডিও, অ্যাপ নোটিফিকেশন শব্দ, বহুভাষিক বিষয়বস্তু স্থানীয়করণ, এবং বড় ধরনের বিষয়বস্তু লাইব্রেরির জন্যে ব্যবহারযোগ্য অডিও।

ব্যক্তিগত TTS-এর মতোই হার। ফ্রি-টাইর মডেল (Kokoro, Piper) ০ অক্ষর খরচ করে। স্ট্যান্ডার্ড মডেল ২x অক্ষর ব্যবহার করে, এবং প্রিমিয়াম মডেল ৪x অক্ষর ব্যবহার করে। ব্যাচ টুল শুরু করার আগে মোট খরচের অনুমান দেখায়।

হ্যাঁ । ব্যাচ সম্পন্ন হওয়ার পর, ব্যর্থ সারিগুলি একটি ত্রুটি বার্তা সহ চিহ্নিত করা হবে । আপনি ব্যর্থ বস্তুগুলিকে এককভাবে পুনরায় চেষ্টা করতে পারেন অথবা একটি ক্লিকের মাধ্যমে সমস্ত ব্যর্থতা পুনরায় প্রক্রিয়াকরণের জন্য পরিশোধক ব্যবহার করতে পারেন ।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

একসাথে শত শত টেক্সট প্রক্রিয়াকরণ করুন

একটি স্প্রেডশীট আপলোড করুন এবং প্রতিটি সারি জন্য অডিও তৈরি করুন। ই-লর্নিং, IVR এবং স্থানীয়করণ জন্য সম্পূর্ণ।