বহুভাষিক টেক্সট-টু-স্পিকার - ৩০+ ভাষা

৩০টিরও বেশি ভাষায় প্রাকৃতিক শব্দের মত কথা বলার ক্ষমতা প্রদান করে। হিন্দি ও জাপানি থেকে আরবি ও স্প্যানিশ পর্যন্ত, আমাদের AI মডেলগুলি সত্যিকারের বহুভাষিক শব্দ সংশ্লেষণ প্রদান করে। স্থানীয়করণ, ভাষা শিখতে, আন্তর্জাতিক বিষয়বস্তু এবং ক্রস-ভাষা শব্দ ক্লোনিংয়ের জন্য এটি অসাধারণ।

৩০+ ভাষা হিন্দি জাপানি স্প্যানিশName আরবি

এখন চেষ্টা করুন

Kokoro, Piper, VITS, MeloTTS এর সাথে বিনামূল্যে
আপনার তৈরিকৃত অডিও এখানে প্রদর্শিত হবে
তৈরি করা হয়েছে
ডাউনলোড
TTS.ai পছন্দ করেন? আপনার বন্ধুদের বলুন!

বহুভাষিক TTS বৈশিষ্ট্য

ভাষা এবং উচ্চারণ দ্বারা বিশ্বমানের বক্তব্য সংশ্লেষণ

৩০+ ভাষা

ইংরেজি, হিন্দি, জাপানি, স্প্যানিশ, চীনা, আরবি, কোরীয়, ফরাসি, জার্মান, রুশ, পর্তুগিজ এবং আরো অনেক ভাষায় ৩০টিরও বেশি ভাষায় কথা বলতে পারবেন।

স্থানীয় উচ্চারণ

প্রত্যেকটি মডেলকে স্থানীয় ভাষাভাষীদের রেকর্ডিং এর উপর প্রশিক্ষণ দেয়া হয়, যা প্রত্যেকটি সমর্থিত ভাষার জন্য প্রকৃত উচ্চারণ, উচ্চারণ এবং রীতি নিশ্চিত করে।

ক্রস- লিঙ্গুয়াল ক্লোনিং

একটি ভাষায় একটি কণ্ঠস্বর ক্লোন করুন এবং অন্য ভাষায় বক্তৃতা তৈরি করুন। CosyVoice2গ্লোবাল বিষয়বস্তুর জন্য ৮টি ভাষার মধ্যে কণ্ঠস্বর পরিচয় সংরক্ষণ করে।

RTL ভাষা সমর্থন

সঠিক টেক্সট প্রসেসিং এবং স্বাভাবিক বক্তৃতা আউটপুট সহ আরবি, হিব্রু, উর্দু এবং ফার্সি সহ ডান থেকে বামে ভাষার জন্য সম্পূর্ণ সমর্থন।

ভাষা সনাক্তকরণ

স্বয়ংক্রিয় ভাষা সনাক্তকরণ ইনপুট টেক্সট ভাষা এবং পথের জন্য উপযুক্ত মডেল এবং উচ্চারণ গুণমানের জন্য শব্দের জন্য সনাক্ত করে।

উচ্চারণ বৈচিত্র্য

ভাষার মধ্যে একাধিক উচ্চারণ বিকল্প - আমেরিকান, ব্রিটিশ, ভারতীয় এবং অস্ট্রেলিয়ান ইংরেজি; ইউরোপীয় এবং ল্যাটিন আমেরিকান স্প্যানিশ; এবং আরো আঞ্চলিক বৈচিত্র্য।

বহুভাষিক TTS এর জন্য সেরা মডেল

সর্ববৃহৎ ভাষা সমর্থন এবং সর্বোত্তম ক্রস-ভাষা গুণমানের সাথে মডেল

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ভয়েস ক্লোন

সর্বোত্তম: সর্বোত্তম বহুভাষিক মডেল — ৮টি ভাষার সাথে ক্রস-ভাষিক ভয়েস ক্লোনিং

চেষ্টা করো CosyVoice 2

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

সর্বোত্তম: প্রতি ভাষার জন্য একাধিক উচ্চারণ বৈচিত্র্যের সাথে বিনামূল্যে বহুভাষী TTS

চেষ্টা করো MeloTTS

GPT-SoVITSGPT-SoVITS

Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Slow 5/5 ভয়েস ক্লোন

সর্বোত্তম: ইংরেজি, চীনা, জাপানি এবং কোরীয় ভাষার মধ্যে কয়েকটি শট ক্লোনিং

চেষ্টা করো GPT-SoVITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

সর্বোত্তম: আবেগপূর্ণ অভিব্যক্তি এবং শব্দের প্রভাব সহ ১৩+ ভাষা

চেষ্টা করো Bark

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

সর্বোত্তম: স্টুডিও গুণমানের সাথে ৯টি ভাষার মধ্যে অতিরিক্ত দ্রুত উৎপাদন

চেষ্টা করো Kokoro

কিভাবে বহুভাষিক বক্তৃতা উৎপাদন করা যায়

সেকেন্ডের মধ্যে যেকোন ভাষায় স্বাভাবিক বক্তৃতা

1

আপনার ভাষা নির্বাচন করুন

৩০+ সমর্থিত ভাষা থেকে বেছে নিন। সুবিধার জন্য সিস্টেম আপনার ইনপুট টেক্সটের ভাষা স্বয়ংক্রিয়ভাবে সনাক্ত করতে পারে।

2

যেকোন ভাষায় টেক্সট লিখুন

আপনার লক্ষ্য ভাষায় লেখা টাইপ অথবা সাঁটো। পূর্ণ ইউনিকোড সমর্থন CJK, Devanagari, আরবি, সিরিলিক এবং অন্যান্য সমস্ত স্ক্রিপ্ট পরিচালনা করে।

3

একটি স্থানীয় শব্দ বাছাই করুন

আপনার ভাষার জন্য একটি সর্বোত্তমকৃত শব্দ বাছাই করুন। প্রতিটি ভাষায় একাধিক শব্দের অপশন প্রদান করা হয়, যেখানে সম্ভব সেখানে আঞ্চলিক উচ্চারণ বৈচিত্র্য সহ।

4

ডাউনলোড করো

স্বদেশী উচ্চারণ সহ কথা তৈরি করুন এবং MP3 অথবা WAV হিসাবে ডাউনলোড করুন। একাধিক ভাষার ব্যাচ তৈরির জন্য API ব্যবহার করুন।

সমর্থিত ভাষাName

আমাদের বহুভাষিক TTS মডেলের মধ্যে উপলব্ধ ভাষা

আমেরিকা ও ইউরোপ

  • ইংরেজি (US, UK, AU)
  • স্প্যানিশ (ES, MX)
  • পর্তুগিজ (BR, PT)
  • ফরাসি (FR, CA)
  • জার্মান
  • ইতালীয়Name
  • ডাচName
  • পোলিশName

পূর্ব এশিয়াName

  • চীনা (ম্যান্ডারিন) Name
  • চীনা (ক্যানটোন) Name
  • জাপানি
  • কোরিয়ানName
  • ভিয়েতনামিName
  • থাই
  • ইন্দোনেশিয়ানName
  • মালয়Name

দক্ষিণ এশিয়া ও মধ্যপ্রাচ্য

  • হিন্দিName
  • আরবি
  • তুর্কিName
  • বাংলাName
  • তামিল
  • উর্দুName
  • ফার্সিName
  • হিব্রু

আরো ভাষাName

  • রুশName
  • ইউক্রেইনিয়ানName
  • চেকName
  • রোমানিয়ানName
  • গ্রিক
  • সুইডিশName
  • ফিনিশName
  • হাঙ্গেরীয়Name

ক্রস-লিঙ্গুয়াল ভয়েস ক্লোনিং

আপনার নিজের কণ্ঠে যে কোন ভাষায় কথা বলুন

আপনার কন্ঠের ক্লোন, যেকোন ভাষায় কথা বলুন

আপনার মাতৃভাষায় ১০ সেকেন্ডের একটি শব্দ নমুনা রেকর্ড করুন, তারপর আমাদের ৩০+ সমর্থিত ভাষার যে কোন একটিতে কথা তৈরি করুন। AI আপনার অনন্য কন্ঠ বৈশিষ্ট্য সংরক্ষণ করে - টাইমব্রে, পিট, কথা বলার শৈলী - লক্ষ্য ভাষায় মাতৃভাষা-স্বরযুক্ত উচ্চারণ তৈরি করার সময়। বিশ্বব্যাপী দর্শকদের কাছে পৌঁছানোর জন্য বিষয়বস্তু সৃষ্টিকারীদের জন্য এটি অসাধারণ।

  • 10 সেকেন্ডের ভয়েস নমুনা সব আপনি প্রয়োজন
  • আপনার কণ্ঠস্বরের বৈশিষ্ট্য ভাষার মধ্যে সংরক্ষিত
  • স্থানীয় উচ্চারণ এবং উচ্চারণশৈলী
  • মডেল: CosyVoice2, OpenVoice, Fish Speech

বিষয়বস্তু স্থানীয়করণ

একই স্পিকারের কণ্ঠ বজায় রেখে একাধিক ভাষায় ভিডিও, কোর্স এবং পডকাস্ট স্থানীয়করণ করুন। ইউটিউব নির্মাতারা একই ভিডিও ইংরেজি, স্প্যানিশ, হিন্দি এবং জাপানি ভাষায় প্রকাশ করতে পারেন— প্রত্যেক ভাষায় তাদের নিজস্ব কণ্ঠস্বর ব্যবহার করে। কোন ডাবিং স্টুডিওর প্রয়োজন নেই।

  • পুনরায় রেকর্ড না করেই বিষয়বস্তু স্থানীয়করণ করুন
  • সব ভাষার সংস্করণে একই শব্দ
  • বড় প্রকল্পের জন্য ব্যাচ প্রক্রিয়াকরণ
  • স্বয়ংক্রিয় পাইপলাইনের জন্য API সমন্বয়

বহুভাষিক API সংযোগ

একটি একক API কল দ্বারা যেকোন ভাষায় বক্তৃতা উত্পাদন করুন

পাইথন - বহুভাষিক বক্তৃতা উৎপাদন REST API
import requests

languages = {
    "en": "Hello, welcome to our service!",
    "es": "Hola, bienvenido a nuestro servicio!",
    "ja": "こんにちは、サービスへようこそ!",
    "hi": "नमस्ते, हमारी सेवा में आपका स्वागत है!",
    "ar": "مرحبا، مرحبا بكم في خدمتنا!"
}

for lang, text in languages.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "cosyvoice2",
        "language": lang,
        "format": "mp3"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"welcome_{lang}.mp3", "wb") as f:
        f.write(response.content)

কোন ভাষার জন্য মূল্য নির্ধারণ নেই

প্রত্যেক প্ল্যানে ৩০+ ভাষা অন্তর্ভুক্ত আছে। ইংরেজি ভাষার বাইরে অন্য ভাষার জন্য কোন অতিরিক্ত খরচ নেই।

মুক্ত স্তর

$0

সাইন আপ করার সময় ১৫,০০০ অক্ষর

  • MeloTTS বহুভাষিক (মুক্ত)
  • 6+ ভাষা মুক্ত স্তরে
  • সাবস্ক্রাইব করার প্রয়োজন নেই

স্টার্টার

$9

৫০০,০০০ অক্ষর/মাস

  • সব ৩০+ ভাষা
  • ক্রস-ভাষা ভয়েস ক্লোনিং
  • সকল বহুভাষিক মডেল

প্রফেসর

$29

২,০০০,০০০ অক্ষর/মাস

  • অগ্রাধিকার বহুভাষিক প্রসেসিং
  • ব্যাচ স্থানীয়করণ
  • এন্টারপ্রাইজ API ব্যবহার
সম্পূর্ণ মূল্য দেখুন

প্রায়শ জিজ্ঞাসিত প্রশ্ন

বহুভাষিক টেক্সট-টু-স্পিচ সম্পর্কে সাধারণ প্রশ্ন

TTS.ai ৩০+ ভাষা সমর্থন করে যার মধ্যে রয়েছে ইংরেজি, হিন্দি, জাপানি, স্প্যানিশ, চীনা (ম্যান্ডারিন), আরবি, কোরীয়, ফরাসি, জার্মান, রুশ, পর্তুগিজ, ইতালীয়, তুর্কি, পোলিশ, ডাচ, সুইডিশ, এবং আরো অনেক ভাষা। মডেলের উপর ভিত্তি করে সমর্থন পরিসীমা ভিন্ন হতে পারে।

বার্ক ভাল উচ্চারণ গুণমান সহ হিন্দি ভাষাকে সমর্থন করে। হিন্দি ভাষায় শব্দ ক্লোন করার জন্য, কোসিভয়েস ২ ক্রস- ভাষা সংশ্লেষণ প্রদান করে। পাইপার হিন্দি ভাষাও প্রদান করে যা সিপিইউ- এ উৎপাদন অ্যাপ্লিকেশনের জন্য দক্ষভাবে চলবে।

হ্যাঁ। Kokoro, MeloTTS, CosyVoice2, GPT-SoVITS, এবং VITS সকল জাপানি ভাষার উচ্চারণ সমর্থন করে। Kokoro এবং CosyVoice2সঠিক উচ্চারণ এবং উচ্চারণ প্যাটার্ন সহ উচ্চমানের জাপানি TTS প্রদান করে।

মডেলগুলি প্রশিক্ষিত স্থানীয় বক্তার তথ্যের উপর তাদের সমর্থিত ভাষাগুলির জন্য সঠিক উচ্চারণ তৈরি করে। Kokoro এবং CosyVoice2তাদের সমর্থিত ভাষাগুলিতে প্রায় স্থানীয় গুণমান অর্জন করে। সঠিকতা মডেল এবং ভাষার উপর নির্ভর করে ভিন্ন হতে পারে - সর্বোত্তম ফলাফল পেতে প্রতিটি মডেলের ভাষা তালিকা পরীক্ষা করুন।

হ্যাঁ, এটিকে বলা হয় ক্রস-লিঙ্গুইজ ভয়েস ক্লোনিং। CosyVoice2একটি ইংরেজি নমুনা থেকে একটি ভয়েস ক্লোন করতে পারে এবং চীনা, জাপানি, কোরীয় এবং অন্যান্য ৫টি ভাষায় কথা বলার জন্য তৈরি করতে পারে, অথচ বক্তার ভয়েস পরিচয় এবং বৈশিষ্ট্য সংরক্ষণ করে।

হ্যাঁ, আমাদের টেক্সট প্রসেসিং পাইপলাইন সঠিকভাবে আরটিএল স্ক্রিপ্ট পরিচালনা করে। আরবি, হিব্রু, উর্দু এবং ফার্সি টেক্সট সঠিকভাবে প্রক্রিয়াজাত করা হয় এবং সঠিক উচ্চারণের সাথে কথায় রূপান্তরিত হয়, যার মধ্যে ডায়াক্রিটিকস এবং সংযুক্ত অক্ষর ফর্মের ব্যবস্থাপনা অন্তর্ভুক্ত।

কিছু মডেল কোড-স্যুইচিং (ভাষা মিশ্রণ) স্বাভাবিকভাবে পরিচালনা করে। CosyVoice2এবং GPT-SoVITS প্রতিটি ভাষা সেগমেন্টের জন্য উপযুক্ত উচ্চারণ সহ দ্বিভাষিক টেক্সট পরিচালনা করতে পারে। সর্বোত্তম ফলাফল পেতে, প্রতিটি প্রজন্মকে একক ভাষায় রাখুন।

MeloTTS আমেরিকান, ব্রিটিশ, ভারতীয় এবং অস্ট্রেলিয়ান ইংরেজি উচ্চারণ প্রদান করে। অন্যান্য মডেল বিভিন্ন ইংরেজি উচ্চারণ অপশন বিভিন্ন ভয়েস নির্বাচনের মাধ্যমে প্রদান করে। পাইপার এর ১০০+ ভয়েস ক্যাটালগ এর মধ্যে ইংরেজি উচ্চারণ শব্দের সর্বাধিক বৈচিত্র্য আছে।

হ্যাঁ। বিনামূল্যে মডেল একাধিক ভাষা সমর্থন করে: কোকোরো (৯টি ভাষা), পাইপার (৩০+), মেলোটিটিএস (৬), এবং ভিটিএস (৪)। আপনি শূন্য খরচে একাধিক ভাষায় কথা বলতে পারবেন। প্রাইম মডেল অতিরিক্ত ভাষা এবং ক্রস-লিঙ্গুইস্টিক ক্লোনিং-এর মতো বৈশিষ্ট্য প্রদান করে।

একাধিক মডেল ম্যান্ডারিন চীনা সমর্থন করে: Kokoro, CosyVoice2, MeloTTS, GPT-SoVITS, Fish Speech, এবং Bark। CosyVoice2এবং GPT-SoVITS সঠিক টোন ব্যবস্থাপনার সাথে সর্বোত্তম ম্যান্ডারিন গুণমান প্রদান করে। চীনা টেক্সট পেস্ট করুন এবং একটি চীনা কণ্ঠ নির্বাচন করুন।

হ্যাঁ। Kokoro, CosyVoice2, MeloTTS, GPT-SoVITS, এবং VITS কোরীয় ভাষা সমর্থন করে। Kokoro কোরীয় TTS-এর জন্য গতি ও গুণমানের সর্বোত্তম ভারসাম্য প্রদান করে। CosyVoice2কোরীয় বিষয়বস্তুর জন্য ভয়েস ক্লোনিং ক্ষমতা যোগ করে।

আমাদের টেক্সট প্রসেসিং পাইপলাইন সংখ্যা, তারিখ, মুদ্রা, এবং সাধারণ সংক্ষিপ্তকরণ প্রতিটি ভাষার কনভেনশন অনুযায়ী স্বাভাবিক করে । উদাহরণস্বরূপ, "১, ০০০" ইংরেজি এবং জার্মান ভাষায় আলাদাভাবে উচ্চারিত হয় । সিস্টেম স্বয়ংক্রিয়ভাবে এই রূপান্তরগুলি নির্বাচিত ভাষার উপর ভিত্তি করে পরিচালনা করে ।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

AI এর সাহায্যে যে কোন ভাষায় কথা বলুন

৩০+ ভাষায় স্বাভাবিক কথাবার্তা তৈরি করুন। বিনামূল্যে স্তর বহুভাষিক মডেল অন্তর্ভুক্ত করে - কোন সাইন আপ প্রয়োজন নেই।