گزارش اشکال / درخواست ویژگی

Bark TTS

Suno's transformer-based text-to-audio model that generates speech plus laughter, sighs, music, and sound effects.

0/500 نویسه‌ها · براي 5000 نفر در هر نسل ثبت نام کنيد →

ثبت نام برای حد ۵۰۰۰ کاراکتر

حالت SSML (زبان نشانه‌گذاری ترکیب گفتار برای کنترل دقیق)

برای کنترل دقیق ، متن خود را در برچسبهای SSML بپیچید:

<speak><prosody rate="slow">Slow speech</prosody></speak>

برچسبهای احساس/ سبک

برچسبهایی که مدل برگزیده می‌فهمد — برای انداختن یکی در متن خود ، جایی که اتفاق می‌افتد ، کلیک کنید:

واژه‌نامه تلفظ

تعریف تلفظ سفارشی) کلمه = تلفظ (:

ارتفاع 0

-12 +12

مدل

صدا

زبان

قالب خروجی

سرعت 1.0x

0.5x 2.0x

آزاد با Piper, VITS, MeloTTS

صدای تولید شده شما در اینجا ظاهر خواهد شد. یک مدل را انتخاب کنید ، متن را وارد کنید ، و تولید را فشار دهید.

در مورد Bark

Bark comes from Suno and takes a different approach from most TTS systems: it is a GPT-style transformer trained as a text-to-audio model rather than a pure text-to-speech one. Because it generates raw audio tokens, it can produce nonverbal sounds — laughing, sighing, crying — as well as background music and sound effects alongside the spoken words. It ships with 100+ speaker presets and handles 13+ languages including English, Chinese, French, German, Hindi, Japanese, and Korean. The trade-off is speed and length: at 350M parameters it runs slowly (~15s per clip) and caps at 200 characters, so it shines for short, emotive, creative audio rather than long narration.

بهترین برای: Creative audio content, audiobooks with emotion, sound effects

مرور همۀ Bark صداها

يه نگاهي بنداز

توسعه‌دهنده: Suno
مجوز: MIT
حیوان: standard
سرعت: slow
شبیه‌سازی صدا: نه
زبانها: English, Chinese, French, German, Hindi, Italian, Japanese, Korean, Polish, Portuguese, Russian, Spanish, Turkish
بیشینه نویسه‌ها: 200

پیش‌فرض Neutral

Bark FAQ - پرسش و پاسخ

Yes. Bark is a text-to-audio model, so beyond speech it can generate nonverbal cues like laughing, sighing and crying, plus music and background sound effects — one of its defining capabilities.

Yes. Bark is MIT-licensed, which permits commercial use.

Bark caps at 200 characters per request and is on the slower side (around 15 seconds per clip), so it is best suited to short, expressive snippets rather than long-form audio. It does not support voice cloning.

← همه صداها

Bark TTS

دوست داريد TTS.ai؟ به دوستانتون بگو!

در مورد Bark

يه نگاهي بنداز

Bark صداها

Chinese Speaker 1

Chinese Speaker 2

English Female 1

English Female 2

English Female 3

English Female 4

English Male 1

English Male 2

English Male 3

English Male 4

English Male 5

English Male 6

French Speaker 1

French Speaker 2

German Speaker 1

German Speaker 2

Hindi Speaker 1

Italian Speaker 1

Japanese Speaker 1

Japanese Speaker 2

Korean Speaker 1

Korean Speaker 2

Polish Speaker 1

Portuguese Speaker 1

Russian Speaker 1

Spanish Speaker 1

Spanish Speaker 2

Turkish Speaker 1

Bark FAQ - پرسش و پاسخ

Can Bark make sound effects and laughter, not just speech?

Is Bark free to use commercially?

How long can a single Bark generation be?