ಫ್ರೀ AI ಮಾತಿನ ಪಠ್ಯ

82M ಪ್ರಮಿತಿಗಳು ಅತಿ ಹೆಚ್ಚು- ಪ್ರಕ್ಷೇಪಕ ಶ. ಪೂ. ಬಹುಮಾಧ್ಯಮ ಸ್ಟ್ರೀಮಿಂಗ್ ಬೆಂಬಲ

82M ದರ್ಪಕ ಕ್ರಮಬದ್ಧತೆಯ ಮಾದರಿ Strigi- bugt- fignative ಭಾಷಣವನ್ನು ಪ್ರದಾನಿಸುತ್ತದೆ.

ವೇಗ · 1.5GB VRAM ಪ್ರಯತ್ನಿಸಿ

Piper

CPU- ಸ್ನೇಹಪರ ಆಫ್‌ಲೈನ್‌ ಸಮರ್ಥವಾಗಿದೆ ೧೦+ ಧ್ವನಿಗಳು 35+ ಭಾಷೆಗಳುName SSML ಬೆಂಬಲ

ಭಾಷಣ ವ್ಯವಸ್ಥೆಗೆ ಒಂದು ತ್ವರಿತವಾದ, ಸ್ಥಳಿಕ ಮೆದುಳಿನ ಪಠ್ಯಪುಸ್ತಕವು ರಾಸ್ಪಾಬೆರ್‌ ಪಿ ಮತ್ತು ಹುದುಗಿದ್ದ ಸಾಧನಗಳಿಗೆ ಹೊಂದಿಕೆಯಾಗಿದೆ.

ವೇಗ · 0 (CPU only) VRAM ಪ್ರಯತ್ನಿಸಿ

VITS

ಶೀಘ್ರ- ಧ್ವನಿವಧ೯ಕ ನೈಸರ್ಗಿಕ ಪೂರಕ ವೇಗವಾಗಿ ಬಹು ಧ್ವನಿಕಾರಕಗಳು

ಆನುವಂಶಿಕವಾದ ಭಿನ್ನವಾದ ಸ್ವಾಭಾವಿಕ ಸಂಕೇತೀಕರಣ ಕೊನೆಯಿಂದ ಕೊನೆಯ ಪಠ್ಯಕ್ಕೆ ಕಲಿಯಲು ಕಲಿಯುವಿಕೆಗಾರಿಕೆ.

ವೇಗ · 1GB VRAM ಪ್ರಯತ್ನಿಸಿ

MeloTTS

CPU- ಆಯಾಮಿಸಲಾಗಿದೆ ಬಹುಮಾಧ್ಯಮ ಬಹು ಘಾತಚಿಹ್ನೆಗಳು ಅಡುಗೆ- ಸಿದ್ಧತಾ (dreview) ಕೆಳಮಟ್ಟದ (ಲೋಡನ್ಸಿ) Name

ಬಹುಭಾಷೀಯ ಪಠ್ಯ- ಧ್ವನಿಸುರುಳಿ CPU ನ ಮೇಲೆ ಸಂಕ್ಷೇಪಿಸುತ್ತಿರುವ ಸಂದಿಗ್ಧ ಸ್ಥಿತಿ. Name

ವೇಗ · 0.5GB (GPU optional) VRAM ಪ್ರಯತ್ನಿಸಿ

Bark

ಧ್ವನಿ ಪರಿಣಾಮಗಳು ನಸುನಗೆ/ಮುಖ್ಯ ಸಂಗೀತ ಉತ್ಪಾದನೆName 100+ ಭಾಷಣಕಾರರುName ಬಹುಮಾಧ್ಯಮ

ಅರ್ಥಗರ್ಭಿತವಾದ ಮಾತು, ಸಂಗೀತ ಮತ್ತು ಧ್ವನಿ ಪರಿಣಾಮಗಳನ್ನು ಉತ್ಪಾದಿಸುವ ಪಠ್ಯ- ಆಕ್ಷೇಪಣಾ ಮಾದರಿ. Name

ನಿಧಾನ · 5GB VRAM ಪ್ರಯತ್ನಿಸಿ

Bark Small

ತಿಳಿ ದರ ಪೂರ್ಣ ಬಾರ್ಕ್‌ಗಿಂತ ವೇಗ ಭಾವಾತ್ಮಕ ಮಾತು ಬಹುಮಾಧ್ಯಮ

ಕ್ಷಿಪ್ರಗತಿಯಲ್ಲಿ ಮತ್ತು ಕಡಿಮೆ ಸ್ಮೃತಿ ಬಳಕೆಯೊಂದಿಗೆ ಬಾರ್ಕ್ ನ ಹಗುರವಾದ ಆವೃತ್ತಿ.

ಮಧ್ಯಮ · 2GB VRAM ಪ್ರಯತ್ನಿಸಿ

CosyVoice 2

ಸ್ಟ್ರೀಮಿಂಗ್ ಶೂನ್ಯ- ಕಾಲುವೆ (zone- shoose) ಗೊಳಿಕೆ ಸೈಸ್- ಇಂಡೆಲಿಂಗ್ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಮಾನವ ವಿಶಿಷ್ಟ

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Dia TTS

ಬಹು- ಪ್ರಕ್ಷೇಪಕ ಸಂವಾದ ಉತ್ಪತ್ತಿComment ನೈಸರ್ಗಿಕ ಪರಿವರ್ತನೆ ಭಾವಾತ್ಮಕ ಅಭಿವ್ಯಕ್ತಿ ೧೮೦B ಪ್ರಮಿತಿಗಳು

ಬಹು- ಪ್ರಕ್ಷೇಪಕ ಸಂವಾದ ಉತ್ಪತ್ತಿ ಇದು ಭಾಷಣಗಾರರ ನಡುವಿನ ಸ್ವಾಭಾವಿಕ ಸಂಭಾಷಣೆಗಳನ್ನು ಹುಟ್ಟಿಸುತ್ತದೆ. Name

Parler TTS

ಧ್ವನಿ ವಿವರಣೆ ನೈಸರ್ಗಿಕ ಭಾಷೆ ನಿಯಂತ್ರಣ ರೂಪಾಂತರಿಸಬಹುದಾದ ಧ್ವನಿ ಸೃಷ್ಟಿಯು ಯಾವುದೆ ಮುಂಚಿತ ಧ್ವನಿಗಳ ಅಗತ್ಯವಿಲ್ಲ

ನೀವು ಸ್ವಾಭಾವಿಕ ಭಾಷೆಯಲ್ಲಿ ಮತ್ತು ಪ್ಯಾಲರ್‌ನಿಂದ ಬಯಸುವ ಸ್ವರವನ್ನು ವರ್ಣಿಸಿ.

Indic Parler TTS

11 ಭಾರತೀಯ ಭಾಷೆಗಳು ಧ್ವನಿ ವಿವರಣೆ ನೈಸರ್ಗಿಕ ಭಾಷೆ ನಿಯಂತ್ರಣ ಧೃಡೀಕರಣದ ಉಚ್ಚಾರಣೆಯು

ನಿಸರ್ಗದ ಧ್ವನಿ ನಿಯಂತ್ರಣದೊಂದಿಗೆ ೮+ ಭಾರತದ ಭಾಷೆಗಳಿಗೆ ದೊಡ್ಡದಾದ ಧ್ವನಿ ಭಾಷೆಯು. Name

ನಿಧಾನ · 8GB VRAM ಪ್ರಯತ್ನಿಸಿ

KhanomTan TTS

ಥಾಯ್‌ ಟಿಟ್ಸ್‌ ಬಹು ಧ್ವನಿಕಾರಕಗಳು ನಿಮ್ಮ ಐಡಿ ಎಸ್ ರಚನಾಕಾರName ವ್ಯಾಪಾರ - ಸುರಕ್ಷಿತ ಲೈಸನ್ಸ್

ಧ್ವನಿ ಧ್ವನಿಗಳ ಒಂದು ಆಯ್ಕೆಯನ್ನು ಮಾಡಿ ತಾಯ್- ಮೊದಲ ಪಠ್ಯ- ಪದಗಳನ್ನು- ಪದವೀಕ್ಷಕ.

ವೇಗ · 2GB VRAM ಪ್ರಯತ್ನಿಸಿ

IndexTTS-2

ಏಕವಣಾ ನಿಯಂತ್ರಣ ಶೂನ್ಯ- ಕಾಲುವೆ ಊರ್ಜಿತ ವೆಕ್ಟರುಗಳು ಭಾವಪ್ರಚೋದಕ ಮಾತುಗಳು ಉತ್ತಮ- ಸಿದ್ಧಗೊಂಡ ನಿಯಂತ್ರಣ

ಜೀರೋ-ಸ್ಫೋಟಿನ ತ್ರಿಜ್ಯವಾದ ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ ಮತ್ತು ಉಚ್ಚ ಧ್ವನಿಸುರುಳಿ.

Spark TTS

ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಶೈಲಿ ನಿಯಂತ್ರಣ ಆಕ್ಷೇಪಣೀಯ ೫- ಎರಡನೆ ಸೆಕೆಂಡು

ವಾಕ್‍ಸ್ವಾತಂತ್ರ್ಯದ ಮೂಲಕ ಮಾತಾಡಬಹುದಾದ ಭಾವೋದ್ರೇಕದೊಂದಿಗೆ ಸಂಗೀತದ ಟೆಟ್ಸ್‌ಗಳು.

GPT-SoVITS

೫- ಎರಡನೆ ಸೆಕೆಂಡು ಹಾಡುವ ಧ್ವನಿ ಅಲ್ಪ- ಟೊಪ್ಪಿ ಕಲಿಯುವಿಕೆName ಉಚ್ಚ ನಂಬಿಗಸ್ತಿಕೆ ಸೈಸ್- ಇಂಡೆಲಿಂಗ್

ಕೇವಲ 5 ಸೆಕೆಂಡುಗಳಿಂದ ಯಾವುದೇ ಧ್ವನಿಯನ್ನು ಹೊರಹೊಮ್ಮಿಸುವ ಕ್ಯೂನಿಫಾರಂ TTS.

ನಿಧಾನ · 6GB VRAM ಪ್ರಯತ್ನಿಸಿ

Orpheus

ಮಾನವ - ಮಟ್ಟದ ಭಾವ ೧೦K ಗಂಟೆಗಳ ತರಬೇತಿ ನೈಸರ್ಗಿಕ ಉತ್ಪಾದನೆ ಭಾವಪ್ರಚೋದಕ ಮಾತುಗಳು

ಮಾನವ ಮಟ್ಟದ ಭಾವಾತ್ಮಕ TTS ಮಾದರಿ 100K ಯ ಧ್ವನಿ ದತ್ತಾಂಶದಲ್ಲಿ ತರಬೇತಿಗೊಂಡಿತು.

Chatterbox

ಶೂನ್ಯ- ಕಾಲುವೆ (zone- shoose) ಗೊಳಿಕೆ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಉಚ್ಚ ನಂಬಿಗಸ್ತಿಕೆ ಶೈಲಿ ವರ್ಗಾವಣೆ ಒಂಟಿ ಮಾದರಿ ಗ್ರಾಹಕ

Resembel AI ನಿಂದ Stat-tata-shoo Show ಧ್ವನಿಯೊಂದಿಗೆ ಭಾವಾತ್ಮಕ ನಿಯಂತ್ರಣದೊಂದಿಗೆ.

Tortoise TTS

ಗರಿಷ್ಟ ಗುಣ ಬಹು- ಧ್ವನಿವಧ೯ಕ DALL- EE ಕಟ್ಟಡ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ತಾನಾಗಿಯೆ ಮರುಕಳಿಸುವಿಕೆ

ಬಹು- ಪ್ರಕ್ಷೇಪಕ (ಲಾಂಚ್) ಸಾಧನಗಳು ಸ್ವಇಚ್ಛಿಕ ಸಂರಚನಾ (ಇಂಟರ್ಫೇಸ್) ಸಹಿತ (multitring) ಗುಣಮಟ್ಟದ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ.

ನಿಧಾನ · 8GB VRAM ಪ್ರಯತ್ನಿಸಿ

StyleTTS 2

ಮಾನವ ಮಟ್ಟ ವೈಖರಿ ವಿಭಜನೆಯು (ಫಾಲ್ಟ್) Comment ಸಾಂಸ್ಕೃತಿಕ ತರಬೇತಿಯು ನೈಸರ್ಗಿಕ ವೈವಿಧ್ಯತೆ ಉಚ್ಚ ನಂಬಿಗಸ್ತಿಕೆ

ವೈಖರಿಯಲ್ಲಿ Diffacus ಹಾಗು ನಿರ್ವಹಣಾತ್ಮಕ ತರಬೇತಿಯ ಮೂಲಕ ಮಾನವ- ಮಟ್ಟದ ಪಠ್ಯವನ್ನು-ಖ್ಯಾತಗೊಳಿಸು.

OpenVoice

ತಕ್ಷಣದ ಕ್ಯೂನಿಫಾರಂ ಧ್ವನಿ ಪರಿವರ್ತನೆ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಸಹಭಾಗಿ (ಇಂಟರ್ಫೇಸ್) ನಿಯಂತ್ರಣ ಬಹುಮಾಧ್ಯಮ

ಆ ಕ್ಷಣದ ಧ್ವನಿಯು, ಶೈಲಿ, ಭಾವನೆಗಳು ಮತ್ತು ಉಚ್ಚಾರಣೆಯ ಮೇಲೆ ನಿಯಂತ್ರಣವನ್ನು ಹೊಂದಿದೆ.

Qwen3 TTS

9 ಮೊದಲಾದ ಧ್ವನಿಗಳು ಪಠ್ಯದಿಂದ ಧ್ವನಿ ವಿನ್ಯಾಸName ಏಕವಣಾ ನಿಯಂತ್ರಣ 10 ಭಾಷೆಗಳಲ್ಲಿ

ಅಲಿಬಾಬಾದ ಬಹುಭಾಷೆ TTS

ಮಧ್ಯಮ · 7GB VRAM ಪ್ರಯತ್ನಿಸಿ

VieNeu-TTS-v2

7 ಮುಂಭಾಗದ ಧ್ವನಿಗಳು (NOT + ದಕ್ಷಿಣ ಉತ್ಪಾದನೆಗಳು) ಎನ್ಎನ್‌ವಿ ಸಂಜ್ಞೆ ಧ್ವನಿ ವ್ಯವಸ್ಥ್ಯಾ (೩- 5) ಉಲ್ಲೇಖ (ಉದಾಹರಣೆ) ಸ್ಟ್ರೀಟ್ / ಬಹು ಪ್ರಕ್ಷೇಪಕದ ಬೆಂಬಲ CPU- ಮಾತ್ರ (GPU) ಅಗತ್ಯವಿಲ್ಲ

ವಿಯೆಟ್ನಾಮ್‌ + ಇಂಗ್ಲೀಷ್ ಕೋಡ್‌- ಮಿನುಗುವ TTS ಮೊದಲೆ ಗಾತ್ರದ ಧ್ವನಿಗಳು ಹಾಗು ಶೂನ್ಯ ವ್ಯವಸ್ಥ್ಯಾ ಶಬ್ಧ. CPU- ಮಾತ್ರ, ಅಗತ್ಯವಿಲ್ಲ.

ವೇಗ · CPU VRAM ಪ್ರಯತ್ನಿಸಿ

Sesame CSM

ಸಂಭಾಷಣೆ ನೈಸರ್ಗಿಕ ಸಮಯ ಮೀರುವಿಕೆ ಹೊರನಡೆ ಹಿಂದಕ್ಕೆ channel ೧ಬಿಅಷ್ಟಕಗಳು

ಸ್ವರವನ್ನು ಸರಿಯಾದ ಸಮಯದಲ್ಲಿ ಮತ್ತು ಭಾವೋದ್ರೇಕದಿಂದ ಮಾತಾಡುವುದು ಸ್ವಾಭಾವಿಕ.

ನಿಧಾನ · 8GB VRAM ಪ್ರಯತ್ನಿಸಿ

Chatterbox Turbo

ಉಪ- ೨೦೦೦ ನಿಮಿಷಗಳ ಆರಂಭಿಕ ವರ್ಣಮಾಲೆಯ ಟ್ಯಾಗ್‌ಗಳು ೬x ನಿಜವಾದ ಸಮಯ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ನೀರಿನ ಸೂಚನಾ

ಕ್ಷಿಪ್ರಗತಿಯ ದಿನಚರಿ ಚೌಕ

ವೇಗ · 2GB VRAM ಪ್ರಯತ್ನಿಸಿ

VoxCPM

44,khz ಆಡಿಯೊ ಟೋಕನ್ಜರ್- ಫ್ರೀ ಕ್ರಾಸ್- ಏಕರೂಪವಾದ ಕ್ಯೂನಿಫಾರಂ ಸನ್ನಿವೇಶ- ಪರಿಚಯವಿರುವ LORA ಸುವರ್ಣಗೊಳಿಕೆ

Thenser- ಮುಕ್ತ TTS ಯು ಸನ್ನಿವೇಶ- ಪರಿಚಯಿತ ಪ್ಯಾರಾ ಸಹಿತ 44.1kHz ಆಡಿಯೊವನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.

ವೇಗ · 4GB VRAM ಪ್ರಯತ್ನಿಸಿ

Kani TTS 2

3GB ವೈರಮ್‌ ಅತಿ ಹೆಚ್ಚು- ಪ್ರಕ್ಷೇಪಕ ತಿಳಿ ದರ ನಾನೋಕೋಡೆಕ್ ಉಚಿತ

ಅಲ್ಟ್ರಾ-ಲೈಟ್ 400M ಇಂಗ್ಲೀಷ್ TTS ಮಾದರಿ ಕೇವಲ 3GB VRAM ನಲ್ಲಿ ಚಾಲನೆಗೊಳ್ಳುತ್ತದೆ.

ವೇಗ · 3GB VRAM ಪ್ರಯತ್ನಿಸಿ

OuteTTS

CPU ಸುಪ್ರಸನ್ನತೆ ವೀಕ್ಷಕವು ಕಾರ್ಯನಿರ್ವಹಿಸಿದೆ ಬಹು ಬ್ಯಾಕೆಂಡ್‌ಗಳು ಧ್ವನಿಕಾರ ಪ್ರೊಫೈಲ್‌ಗಳು

CPU, GPU ನಲ್ಲಿ ಚಾಲ್ತಿಯಲ್ಲಿರುವ, ಅಥವಾ Lamap.cp. javas.javas.

ನಿಧಾನ · 2GB VRAM ಪ್ರಯತ್ನಿಸಿ

VibeVoice

ಬಹು- ಪ್ರಕ್ಷೇಪಕ ಪ್ರತಿ 90 ನಿಮಿಷ ಪೋಡಿಟ್ ಉತ್ಪತ್ತಿ ಧ್ವನಿವರ್ಧಕ (ಸರ್ವರ್) NAME OF TRANSLATORS 200mms ಪ್ರವತ

ಮೈಕ್ರೋಸಾಫ್ಟ್ ಮೆಡಿಕಲ್ ಬಹುಮಾಧ್ಯಮ ವಿದ್ಯುತ್ಕೋಶಗಳು ಹಾಗು ಆಡಿಯೋ ಪುಸ್ತಕಗಳಂತಹ (ಪೋರ್ಟ್-ಸ್ಫೋರ್ಟ್) ಒಳಪಿಡಿಗಳಿಗೆ (multi- ಧ್ವನಿಸಾಧನ).

ವೇಗ · 4GB VRAM ಪ್ರಯತ್ನಿಸಿ

Pocket TTS

೧೦೦M ಪ್ರಮಿತಿಗಳು CPU ಸುಪ್ರಸನ್ನತೆ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ಏಕ-ಸಂಪಾದಕ ಅಂಚು- ಸಿದ್ಧ

ಒಂದು ನಮೂನೆಯಿಂದ ಕ್ಯೂನಿಫಾರಂ ಅನ್ನು ಹೊಂದಿರುವ Kuutili, evolution ನಿಂದ ಕಡಿಮೆಯ ೦೦M ಕ್ರಮದ ಮಾದರಿ.

ವೇಗ · 1GB VRAM ಪ್ರಯತ್ನಿಸಿ

Kitten TTS

CPU- ಮಾತ್ರ ಸುರುಳು 80MB ದ ಕೆಳಗೆ ಮಾದರಿ ಗಾತ್ರ 8 ವಿನ್ಯಾಸಿಸಲಾದ ಧ್ವನಿಗಳು ವೇಗ ನಿಯಂತ್ರಣ ONX- ಆಕ್ಷೇಪಣೀಯ 24kHz ಔಟ್‌ಪುಟ್

80MB ಅಡಿಯಲ್ಲಿ ಅತಿ ಹಗುರವಾದ TTS. GPU ಇಲ್ಲದೇ CPU ನ ಚಲಾಯಿಸುತ್ತದೆ.

ವೇಗ · 0GB VRAM ಪ್ರಯತ್ನಿಸಿ

CosyVoice3

ದ್ವಿಗುಣಿತ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ವೇಗ/ವಾಲ್ಯೂಮ್ ಕಂಟ್ರೋಲ್ ಈ ಕೆಳಗಿನ ಸೂಚನೆಗಳು:

ಮುಂದಿನ ಪೀಳಿಗೆಯ ಬಹುಭಾಷೀಯ TTS, ಎರಡು- ಪಥ, ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ ಮತ್ತು ಶೂನ್ಯ ವ್ಯವಸ್ಥ್ಯಾ ಶ್ರೇಣಿಯೊಂದಿಗೆ.

ವೇಗ · 4GB VRAM ಪ್ರಯತ್ನಿಸಿ

NAMAA Saudi TTS

ಸೌದಿಯ ಅರೇಬಿಕ್ ಭಾಷೆName ಆಧುನಿಕ ಸ್ಟ್ಯಾಂಡರ್ಡ್‌ ಅರೇಬಿಕ್‌ ಶೂನ್ಯ- ಟೊಪ್ಪಿ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಸ್ಥಳೀಯ ಉಚ್ಚಾರಣೆಯು

ಮೊದಲ ಬಾರಿ ತೆರೆಯಲಾದ ಸೌದಿ- ಅರೇಬಿಕ್ ಟಿಟ್ಸ್. ಚತುರಚಚೌಕ- ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ.

ಮಧ್ಯಮ · 6GB VRAM ಪ್ರಯತ್ನಿಸಿ

Darwin TTS

ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ಸೈಸ್- ಇಂಡೆಲಿಂಗ್ FFN- ಉತ್ಪತ್ತಿಗೊಳಿಸಲಾದQuery 4 ಮುಖ್ಯ ಭಾಷೆಗಳು ಕ್ಯುವೆನ್ 3 ಬೆಟ್Comment

Cros- ಮಾಡಲ್ ಕ್ವೆನ್ ಕ್ವೆನ್-TTS FFN ತೂಕಗಳೊಂದಿಗೆ ಸಂಯೋಜಿಸಲಾದ QWn3- 1. 7B ಭಾಷೆ ಮಾದರಿಯು ಸ್ಫುಟವಾದ ಬಹುಭಾಷೀಯ ಕಾಲ್ಪನಿಕ ಪರಿಶಿಷ್ಟದಲ್ಲಿದೆ.

ಮಧ್ಯಮ · 7GB VRAM ಪ್ರಯತ್ನಿಸಿ

MOSS-TTSD

ಬಹು- ಪ್ರಕ್ಷೇಪಕದ ಸಂವಾದ 5 ಭಾಷಣಕರ್ತರು 60 ಮಿಲಿತಾನ್ವಯಿತ ಆಡಿಯೊ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ಬ್ರಿಟ್ಯಾಪ್‌-ಪ್ರೇಷಕ

ಬಹು- ಪ್ರೇಷಕ ಸಂವಾದ ಒಗ್ಗೂಡಿಸುವ ನಮೂನೆ —⁠ ಪೋರ್ಟ್- ಶೈಲಿಯ ಸಂಭಾಷಣೆಗಳನ್ನು 5 ಭಾಷಣಕಾರರೊಂದಿಗೆ ಮತ್ತು 60 ನಿಮಿಷಗಳ ಕಾಂಪ್ಲೇಟರ್ ಆಡಿಯೋವಿನ 60 ನಿಮಿಷಗಳ ಸಂಭಾಷಣೆಗಳನ್ನು ಉತ್ಪಾದಿಸಿ.

ಮಧ್ಯಮ · 12GB VRAM ಪ್ರಯತ್ನಿಸಿ

Ming-Omni TTS

44,1kHz ಔಟ್‌ಪುಟ್ ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ ಏಕವಣಾ ನಿಯಂತ್ರಣ ಡ್ಯಾಲಿಕ್ ಕಂಟ್ರೋಲ್ ಬಿಜಿಎಮ್ ಉತ್ಪತ್ತಿName Compact CRLB

Compact 0. 5B ನಿಘಟಕದ (mumbny- module) ಉಪಘಟಕವು user- fifidedefault 44. 1kHz ಉತ್ಪತ್ತಿಯೊಂದಿಗೆ ಮತ್ತು ಶೂನ್ಯ- shooct metrus commans.

ಮಧ್ಯಮ · 3GB VRAM ಪ್ರಯತ್ನಿಸಿ

MOSS-TTS Nano