AI অডিওবুক নির্মাতা

যেকোন বই, পাণ্ডুলিপি, অথবা নথিকে AI বর্ণনা সহ পেশাদার অডিওবইতে পরিণত করুন। মাল্টি-স্পিকার ডায়ালগ, অধ্যায়-বিশেষে-অধ্যায় উৎপাদন এবং আপনার সমগ্র প্রকল্পে স্থায়ী চরিত্রের কণ্ঠস্বরের জন্য ভয়েস ক্লোনিং সহ ঘণ্টার পর ঘণ্টা প্রাকৃতিক-স্বরযুক্ত বক্তৃতা তৈরি করুন।

দীর্ঘ- ফর্ম বর্ণনা বহু- স্পিকার অধ্যায় তৈরি করো ভয়েস ক্লোন আবেগময় বর্ণনা

সম্পূর্ণ TTS সম্পাদক API ডকুমেন্টেশন

এখন চেষ্টা করুন

0/500

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে

আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে

সম্পূর্ণ TTS সম্পাদক খোলো

AI অডিওবুক উৎপাদন বৈশিষ্ট্য

পেশাদার অডিওবই তৈরি করার জন্য আপনার যা প্রয়োজন

দীর্ঘ- ফর্ম বর্ণনা

ঘন্টাখানেক অবিরাম বর্ণনা তৈরি করুন। স্বয়ংক্রিয় টেক্সট টুকরো, স্থায়ী কন্ঠ এবং ৪৮kHz এ স্টুডিও-মানের অডিও।

বহুভাষী অক্ষর

অক্ষরগুলির জন্য ১০০+ আলাদা আলাদা শব্দ। স্বনির্বাচিত অক্ষরগুলির জন্য শব্দ ক্লোনিং এবং Parler TTS। প্রাকৃতিক ডায়ালগের জন্য Dia TTS।

আবেগপ্রবণ অভিব্যক্তি

Orpheus মানব-স্তরের আবেগ প্রদান করে। IndexTTS-2 সুষম আবেগ ভেক্টর প্রদান করে। Bark অবাক্যগত শব্দ যোগ করে।

অধ্যায়-বিশেষে

অধ্যায়গুলি এককভাবে প্রক্রিয়াকরণ এবং পর্যালোচনা করুন। অডিবল, অ্যাপল বই এবং গুগল প্লে বিতরণ করার জন্য প্রতি অধ্যায় ফাইল রপ্তানি করুন।

লেখকের শব্দের ক্লোন

ব্যক্তিগতভাবে লেখকের কন্ঠস্বর ক্লোন করুন। একটি সংক্ষিপ্ত নমুনা থেকে লেখকের নিজস্ব কন্ঠস্বরে সমগ্র অডিওবই তৈরি করুন।

৯৫% খরচ সাশ্রয়

এআই নাটক বলার খরচ ৫-৫০ ডলার/ঘন্টা, আর ঐতিহ্যবাহী কণ্ঠ অভিনেতাদের খরচ ২,০০০-৫,০০০ ডলার/ঘন্টা, একই পেশাদার মানের।

অডিওবুক বর্ণনার জন্য সেরা AI মডেল

দীর্ঘ-ফর্ম শোনার জন্য ডিজাইন করা প্রাইম ভয়েস

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 ভয়েস ক্লোন

সর্বোত্তম: প্রিমিয়াম একক-নাট্যকার অডিওবুকের জন্য সর্বোচ্চ গুণমানের বর্ণনা

চেষ্টা করো Tortoise TTS

Orpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

সর্বোত্তম: আবেগময় গল্প বলার জন্য মানব-স্তরের আবেগ প্রকাশ

চেষ্টা করো Orpheus

StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

Medium 5/5

সর্বোত্তম: স্টুডিও-মানের একক স্পিকারের বর্ণনা মানব রেকর্ডিংয়ের প্রতিদ্বন্দ্বী

চেষ্টা করো StyleTTS 2

Dia TTS

Standard

Multi-speaker dialog generation model that creates natural conversations between speakers.

Medium 5/5

সর্বোত্তম: কথোপকথন-বহুল অধ্যায়ের জন্য প্রাকৃতিক দুই-স্পিকার ডায়ালগ

চেষ্টা করো Dia TTS

Chatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 ভয়েস ক্লোন

সর্বোত্তম: স্বনির্বাচিত অক্ষর শব্দের জন্য ইমোশন নিয়ন্ত্রণ সহযোগে শব্দ ক্লোনিং

চেষ্টা করো Chatterbox

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সর্বোত্তম: শব্দের প্রভাব, হাসি এবং প্রকাশ্য অডিও সহ শিশুদের বই

চেষ্টা করো Bark

AI অডিওবুক তৈরি করা হবে কিভাবে

পাণ্ডুলিপি থেকে শেষ অডিওবই

আপনার পাণ্ডুলিপি আপলোড করুন

আপনার লেখা পেস্ট অথবা আপলোড করুন। সিস্টেম স্বয়ংক্রিয়ভাবে এটিকে অধ্যায় এবং পরিচালনাযোগ্য অংশে বিভক্ত করে।

শব্দভাণ্ডার বরাদ্দ করো

একটি বক্তার কন্ঠ নির্বাচন করুন এবং অক্ষরের কন্ঠ নির্ধারণ করুন। স্বনির্বাচিত কন্ঠ ক্লোন করুন অথবা Parler TTS এর মাধ্যমে তাদের বর্ণনা করুন।

পর্যালোচনা তৈরি করো

অধ্যায় অনুযায়ী অধ্যায় তৈরি করুন। প্রাকদর্শন, নির্দিষ্ট বিভাগ পুনরুদ্ধার, গতি এবং আবেগ সংশোধন করুন।

রপ্তানি এবং প্রকাশ

মেটাডাটা সহ প্রতি অধ্যায়ে WAV ফাইল ডাউনলোড করুন। অডিবল ACX, অ্যাপল বই, গুগল প্লে এবং আরও অনেক কিছুর জন্য প্রস্তুত।

অডিওবুক উৎপাদন ক্ষমতা

AI দ্বারা চালিত পেশাদার অডিওবুক ওয়ার্কফ্লো

দীর্ঘ- ফর্ম বর্ণনা

আপনার লেখা থেকে ঘণ্টার পর ঘণ্টা ধরে অবিরাম বর্ণনা তৈরি করুন। আমাদের API টেক্সট টুকরো টুকরো করে, প্রাকৃতিক বাক্য সীমানা এবং অডিও স্টিকিং স্বয়ংক্রিয়ভাবে পরিচালনা করে। Tortoise TTS, StyleTTS2এবং Kokoro এর মত মডেলগুলি স্টুডিও-গুণমানের কথা তৈরি করে যা শ্রবণকারীরা ক্লান্তি ছাড়াই ঘণ্টার পর ঘণ্টা উপভোগ করতে পারে।

স্বাভাবিক সীমানায় স্বয়ংক্রিয়ভাবে টেক্সট বিভাজন
ঘণ্টার পর ঘণ্টা বিষয়বস্তুর মধ্যে স্থায়ী শব্দ
৪৮kHz/২৪-বিটে স্টুডিও-মানের অডিও
সম্পূর্ণ পাণ্ডুলিপি জন্য API দ্বারা ব্যাচ প্রসেসিং

বহু- স্পিকার অক্ষর শব্দ

আলাদা আলাদা চরিত্রের কণ্ঠ দিয়ে আপনার গল্পকে জীবন দান করুন। আমাদের কণ্ঠ লাইব্রেরী ব্যবহার করে প্রতিটি চরিত্রের জন্য আলাদা আলাদা কণ্ঠ নির্ধারণ করুন, অথবা কণ্ঠ ক্লোনিং এবং পার্লার টিটিএস কণ্ঠ বর্ণনা সহকারে স্বনির্ধারিত কণ্ঠ তৈরি করুন। ডায়া টিটিএস দুইজন বক্তার মধ্যে প্রাকৃতিক কথোপকথন বাস্তবসম্মত ধাপে ধাপে পরিচালনা করে।

অক্ষরের জন্য ১০০+ পৃথক শব্দ
স্বনির্বাচিত অক্ষরের শব্দের জন্য শব্দ ক্লোনিং
Parler TTS: শব্দে আপনি যে কন্ঠটি চান তা বর্ণনা করুন
স্বাভাবিক দুই-অক্ষর ডায়ালগের জন্য Dia TTS

আবেগপূর্ণ এবং অভিব্যক্তিমূলক বর্ণনা

বড় অডিও বইয়ের জন্য আবেগগত পরিসর প্রয়োজন। Orpheus (১০০K+ ঘন্টা বক্তৃতার উপর প্রশিক্ষিত) মানব-স্তরের আবেগগত অভিব্যক্তি প্রদান করে। IndexTTS-২ আবেগ ভেক্টর সহ সুবিন্যস্ত আবেগ নিয়ন্ত্রণ প্রদান করে। Bark আপনার বর্ণনায় হাসি, চিৎকার এবং অন্যান্য অবাক্যগত অভিব্যক্তি যোগ করতে পারে।

মানব-স্তরের আবেগপ্রবণ অভিব্যক্তি (Orpheus)
Fine-grained আবেগ ভেক্টর (IndexTTS-2)
হাসি আর চিৎকারের মত অবাঞ্ছিত শব্দ
প্রাকৃতিক জোর এবং পেসিং নিয়ন্ত্রণ

অধ্যায়-বিশেষে-অধ্যায় উৎপাদন

আপনার অডিওবইয়ের অধ্যায় অনুযায়ী গুণগত মান নিয়ন্ত্রণ এবং স্থায়ী গতির জন্য প্রক্রিয়াকরণ করুন। সমগ্র বইটি পুনরায় করা ছাড়াই পৃথক পৃথক বিভাগগুলি পর্যালোচনা এবং পুনরুদ্ধার করুন। অডিবল, অ্যাপল বই এবং গুগল প্লের মতো বিতরণ প্ল্যাটফর্মের জন্য পৃথক ফাইল হিসাবে অধ্যায়গুলি রপ্তানি করুন।

বিতরণ করার জন্য অধ্যায়-ভিত্তিক রপ্তানি
প্রতি-বিভাগ পর্যালোচনা এবং পুনর্জন্ম
অডিবল, অ্যাপল বই, গুগল প্লে সামঞ্জস্যপূর্ণ
মেটাডাটা এবং অধ্যায় চিহ্নিতকারী

অডিওবুকের শব্দ চেষ্টা করুন

অডিওবুক বর্ণনা মডেল তুলনা

আপনার অডিওবই প্রকল্পের জন্য সঠিক মডেল নির্বাচন করুন

মডেল	গুণমান	আবেগ	এর জন্য সেরা
Tortoise TTS	5/5	উচ্চ	প্রিমিয়াম একক-নাট্যকার অডিওবুক
Orpheus	5/5	মানব-স্তর	আবেগময়ী নানান রকম বর্ণনা
StyleTTS 2	5/5	উচ্চ	স্টুডিও-মানের পেশাদার বর্ণনা
Dia TTS	5/5	উচ্চ	মাল্টি-স্পিকার ডায়ালগ অধ্যায়
Chatterbox	5/5	নিয়ন্ত্রণযোগ্য	ইমোশন সহ স্বনির্বাচিত অক্ষর শব্দ
Bark	4/5	শব্দ FX	শব্দের প্রভাব সহ শিশুদের বই

শব্দের মডেল তুলনা করুন

অডিওবুক উৎপাদন খরচ তুলনা

AI বর্ণনা বনাম ঐতিহ্যবাহী কণ্ঠ অভিনেতা রেকর্ডিং

ঐতিহ্যবাহী কণ্ঠ অভিনেতা

$2,000 - $5,000

প্রতি সম্পন্ন ঘন্টায়

স্টুডিও বরাদ্দ ফি
কণ্ঠ অভিনেতার ফি ($২০০-৫০০/ঘন্টা)
অডিও প্রকৌশলী / সম্পাদনা
সময়সূচীর সপ্তাহ
পরিবর্তনের জন্য ব্যয়বহুল পুনঃরেকর্ডিং

TTS.ai AI বর্ণনা

$5 - $50

প্রতি সম্পন্ন ঘন্টায়

কোন স্টুডিওর প্রয়োজন নেই
২০+ প্রিমিয়াম AI কন্ঠ
অবিলম্বে উৎপাদন
সপ্তাহ নয়, ঘণ্টার মধ্যে প্রস্তুত
যেকোন সময়ে বিনামূল্যে পুনঃপ্রজনন

মূল্য পরিকল্পনা প্রদর্শন করুন

API ব্যবহার করে ব্যাচ অডিওবুক উৎপাদন

সম্পূর্ণ অধ্যায় প্রোগ্রামিং দ্বারা প্রক্রিয়াকরণ করুন

পাইথন (ব্যাচ চ্যাপ্টার প্রসেসিং) REST API

import requests

API_KEY = "YOUR_API_KEY"
chapters = ["Chapter 1 text...", "Chapter 2 text...", ...]

for i, chapter_text in enumerate(chapters):
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": chapter_text,
        "model": "tortoise",
        "voice": "narrator_01",
        "format": "wav"
    }, headers={"Authorization": f"Bearer {API_KEY}"})

    with open(f"chapter_{i+1:02d}.wav", "wb") as f:
        f.write(response.content)
    print(f"Chapter {i+1} generated successfully")

API নথিপত্র প্রদর্শন করো

প্রায়শ জিজ্ঞাসিত প্রশ্ন

AI অডিওবুক তৈরির বিষয়ে সাধারণ প্রশ্ন

টর্টোইজ টিটিএস, অর্ফিউস এবং স্টাইল টিটিএস ২-এর মতো প্রিমিয়াম মডেল অন্ধ শ্রবণ পরীক্ষায় মানব-স্তরের গুণমান অর্জন করে। যখন সবচেয়ে ভাল মানব কণ্ঠ অভিনেতারা এখনও অনন্য শৈল্পিক ব্যাখ্যা প্রদান করে, তখন বেশিরভাগ শ্রবণকারীর জন্য এআই বর্ণনা পেশাদার রেকর্ডিং থেকে আলাদা করা যায় না।

একটি সাধারণ ৮০,০০০ শব্দের উপন্যাস (প্রায় ১০ ঘণ্টার অডিও) তৈরি করতে এপিআই এর মাধ্যমে প্রাইম মডেল ব্যবহার করে ২-৪ ঘণ্টা সময় লাগে। কোকোরোর মতো দ্রুতগতির মডেল একই বই এক ঘণ্টারও কম সময়ে তৈরি করতে পারে। ঐতিহ্যবাহী রেকর্ডিংয়ের জন্য ৪০-৬০ ঘণ্টার স্টুডিও সময়ের তুলনায় এই সময় অনেক কম।

হ্যাঁ। আপনার একাধিক বিকল্প আছে: ১০০+ অভ্যন্তরীণ শব্দ থেকে বেছে নিন, অডিও নমুনা থেকে স্বনির্ধারিত শব্দ ক্লোন করুন, Parler TTS ব্যবহার করে প্রত্যেক চরিত্রের শব্দের বর্ণনা করুন, অথবা Dia TTS ব্যবহার করে স্বাভাবিক দুই-অক্ষর ডায়ালগ দৃশ্য তৈরি করুন।

অডিবল (ACX) কৃত্রিম বুদ্ধিমত্তা দ্বারা বর্ণনাকৃত অডিওবই গ্রহণ করে। আপনাকে অবশ্যই এগুলোকে কৃত্রিম বুদ্ধিমত্তা দ্বারা উৎপাদিত হিসেবে চিহ্নিত করতে হবে। আমাদের আউটপুট প্রযুক্তিগত প্রয়োজনীয়তা (WAV, সঠিক নমুনা হার এবং বিট গভীরতা) পূরণ করে। অডিবলের বর্তমান নীতিমালা অনুসারে কৃত্রিম বুদ্ধিমত্তা দ্বারা বর্ণনা সম্পর্কে সর্বশেষ নির্দেশিকা পরীক্ষা করুন।

Traditional audiobook production costs $2,000-5,000 per finished hour (voice actor, studio, engineer, editing). AI narration with TTS.ai costs roughly $5-50 per finished hour depending on the model. That is a 95-99% cost reduction.

হ্যাঁ। লেখকের পাঠের ১০-৩০ সেকেন্ড রেকর্ড করুন, আপলোড করুন এবং তাদের কন্ঠে সম্পূর্ণ অডিওবুক তৈরি করুন। চ্যাটার্বক্স, জিপিটি-সোভিটস এবং ওপেনভয়েস এর মত মডেলগুলি উচ্চ-মানের শব্দ ক্লোনিং প্রদান করে। দীর্ঘ রেফারেন্স অডিও (৩০-৬০ সেকেন্ড) ভাল ফলাফল প্রদান করে।

Kokoro এবং Sesame CSM-এর উচ্চারণ সঠিকতা অত্যন্ত ভাল। অপ্রচলিত নামের ক্ষেত্রে, আপনি উচ্চারণ নির্দেশনার জন্য টেক্সটে শব্দার্থিক বানান বা SSML ট্যাগ ব্যবহার করতে পারেন (যদি সমর্থিত হয়)।

প্রতিটি অধ্যায়কে পৃথক অডিও ফাইল হিসেবে তৈরি করুন। এটি আপনাকে সমগ্র বই পুনরায় প্রসেস না করেই পৃথক অধ্যায়গুলি পর্যালোচনা এবং পুনরুদ্ধার করতে দেয়। পরবর্তী প্রক্রিয়াকরণকালে অধ্যায়ের মধ্যে নীরবতা যোগ করুন এবং অডিবল এবং অ্যাপল বইয়ের বিতরণ জন্য অধ্যায় চিহ্ন অন্তর্ভুক্ত করুন।

হ্যাঁ। CosyVoice2আটটি ভাষার জন্য কণ্ঠস্বর ক্লোনিং সমর্থন করে এবং GPT-SoVITS চারটি ভাষা (ইংরেজি, চীনা, জাপানি, কোরীয়) সমর্থন করে। আপনি একই বইয়ের বহুভাষিক সংস্করণ তৈরি করতে পারেন এবং সব ভাষার সংস্করণে বর্ণনাকারীর কণ্ঠস্বর একই রকম রাখতে পারেন।

সর্বোত্তম ফলাফল পেতে প্রতিটি অনুরোধের জন্য ১,০০০-২,০০০ অক্ষর প্রক্রিয়াকরণ করুন। এটি প্রত্যেক অডিও সেগমেন্টকে গুণগত মান এবং গতি বজায় রাখে। API ব্যাচ প্রক্রিয়াকরণ সমর্থন করে যাতে আপনি স্বয়ংক্রিয়ভাবে বিভক্ত করতে পারেন এবং ক্রমানুসারে একটি সম্পূর্ণ ম্যানুস্ক্রীপ্ট তৈরি করতে পারেন।

হ্যাঁ। বর্ণনা করার জন্য একটি কন্ঠ ব্যবহার করুন এবং চরিত্রের ডায়ালগের জন্য ভিন্ন কন্ঠ ব্যবহার করুন। বর্ণনা এবং ডায়ালগের অংশ পৃথকভাবে প্রক্রিয়াকরণ করুন, তারপর একটি অডিও সম্পাদকে তাদের একত্রিত করুন। দুটি চরিত্রের দৃশ্যের জন্য, Dia TTS প্রাকৃতিক বারবার ডায়ালগ তৈরি করে।

প্রত্যেক অধ্যায়ের জন্য একই মডেল, কন্ঠ এবং সেটিংস ব্যবহার করুন। একই সেশন বা API ব্যাচের মধ্যে সমস্ত অধ্যায় তৈরি করুন, যাতে অডিও বৈশিষ্ট্য একই থাকে। একই ধরনের শ্রবণ অভিজ্ঞতার জন্য পরবর্তী প্রক্রিয়ায় ভলিউম স্তর স্বাভাবিক করুন।

5.0/5 (1)

আপনার অডিওবই তৈরি করতে প্রস্তুত?

আজ আপনার পাণ্ডুলিপিকে একটি পেশাদার অডিওবুকে পরিণত করুন। কন্ঠ পরীক্ষা করার জন্য বিনামূল্যে স্তর উপলব্ধ।

নিবন্ধন করুন মূল্য প্রদর্শন

AI অডিওবুক নির্মাতা

এখন চেষ্টা করুন

TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

AI অডিওবুক উৎপাদন বৈশিষ্ট্য

দীর্ঘ- ফর্ম বর্ণনা

বহুভাষী অক্ষর

আবেগপ্রবণ অভিব্যক্তি

অধ্যায়-বিশেষে

লেখকের শব্দের ক্লোন

৯৫% খরচ সাশ্রয়

অডিওবুক বর্ণনার জন্য সেরা AI মডেল

Tortoise TTS

Orpheus

StyleTTS 2

Dia TTS

Chatterbox

Bark

AI অডিওবুক তৈরি করা হবে কিভাবে

আপনার পাণ্ডুলিপি আপলোড করুন

শব্দভাণ্ডার বরাদ্দ করো

পর্যালোচনা তৈরি করো

রপ্তানি এবং প্রকাশ

অডিওবুক উৎপাদন ক্ষমতা

দীর্ঘ- ফর্ম বর্ণনা

বহু- স্পিকার অক্ষর শব্দ

আবেগপূর্ণ এবং অভিব্যক্তিমূলক বর্ণনা

অধ্যায়-বিশেষে-অধ্যায় উৎপাদন

অডিওবুক বর্ণনা মডেল তুলনা

অডিওবুক উৎপাদন খরচ তুলনা

ঐতিহ্যবাহী কণ্ঠ অভিনেতা

TTS.ai AI বর্ণনা

API ব্যবহার করে ব্যাচ অডিওবুক উৎপাদন

প্রায়শ জিজ্ঞাসিত প্রশ্ন

কৃত্রিম বুদ্ধিমত্তার গল্প বলা কি মানব কণ্ঠ অভিনেতাদের গুণমানের সাথে মিলবে?

একটি সম্পূর্ণ অডিওবই তৈরি করতে কত সময় লাগে?

আমি কি প্রত্যেক চরিত্রের জন্য আলাদা আলাদা কণ্ঠ তৈরি করতে পারি?

আমি কি অডিবল-এ কৃত্রিম বুদ্ধিমত্তা দ্বারা তৈরি অডিওবই প্রকাশ করতে পারি?

প্রাচীন অডিওবুক উৎপাদনের তুলনায় মূল্য নির্ধারণের ক্ষেত্রে কি পার্থক্য আছে?

আমি কি লেখকের কণ্ঠস্বরকে ক্লোন করে বর্ণনা করতে পারি?

চরিত্রের নাম এবং স্থানের উচ্চারণের ব্যাপারে কি বলবেন?

চ্যাপ্টার ব্রেক এবং সেকশন ট্রান্সফার কিভাবে পরিচালনা করব?

ইংরেজি ছাড়া অন্য ভাষায় অডিওবুক তৈরি করা যাবে কি?

প্রতি প্রজন্মে টেক্সটের সুপারিশকৃত দৈর্ঘ্য কত?

আমি কি একই অডিওবুকে বক্তা ও চরিত্রের কণ্ঠ মিশিয়ে দিতে পারি?

কিভাবে আমি অডিও ধারণ করার সময় চ্যাপ্টারগুলোর মধ্যে মিল বজায় রাখতে পারি?

আপনার অডিওবই তৈরি করতে প্রস্তুত?