ಫ್ರೀ AI ಮಾತಿನ ಪಠ್ಯ
33+ ತೆರೆದ-ಸಂಪಾದಕ, 273+ ಧ್ವನಿಗಳು, 33+ ಭಾಷೆಗಳು. ಯಾವುದೆ ಖಾತೆಯ ಅಗತ್ಯವಿದೆ.
[ ಪುಟ 12ರಲ್ಲಿರುವ ಚಿತ್ರ]
೩೦+ ಸಲಕರಣೆಗಳು ಓಪನ್ ಜೆಎಲ್ ಎಐ ಸಾಧನಗಳುName
33+ AI ಧ್ವನಿ ಮಾದರಿಗಳು
ಒಂದು ಪ್ಲಾಟ್ಫಾರ್ಮ್ನಲ್ಲಿ ತೆರೆಯಲಾದ TTS ಮಾದರಿಗಳ ಅತಿ ವಿಸ್ತರಣಾ ಸಂಗ್ರಹ
Kokoro ಉಚಿತ
ಕೋಕೋರೋ ೨೦೦೦ ಮಿಲಿಯಷ್ಟು ಪ್ರಮಾಣದ ಅಕ್ಷರಮಾಲೆಯ ಮಾದರಿ. ಇದು ಅದರ ತೂಕದ ವರ್ಗಕ್ಕಿಂತ ಚೆನ್ನಾಗಿ ಅಚ್ಚೊತ್ತುತ್ತದೆ. ಇದು ಗಣಿತ ಗಾತ್ರದಷ್ಟಾದರೂ, ಗಣನೀಯವಾಗಿ ಸ್ವಾಭಾವಿಕವಾದ ಹಾಗೂ ಲಘುಭಾಷೆಯ ನುಡಿಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಕೋಕೋರೋ, ಚೀನೀ, ಚೀನೀ ಮತ್ತು ಕೊರಿಯನ್ ಭಾಷೆಗಳನ್ನೂ ನಾನಾ ರೀತಿಯ ಧ್ವನಿ ಧ್ವನಿ ಧ್ವನಿ ಶಬ್ದಗಳೊಂದಿಗೆ ಅನುಭೋಗಿಸುತ್ತದೆ. ವಿಸ್ಮಯಕರವಾಗಿ, ಒಂದು GPU- ಸಮಯಕ್ಕಿಂತ ೨೦೦ ಕ್ಕೆ ಹೆಚ್ಚು ವೇಗವಾಗಿ ಚಲಾಯಿಸುತ್ತದೆ. ಇದು GPU ಯಲ್ಲಿ ಚಾಲನೆಯಷ್ಟು ವೇಗವಾಗಿ ಚಲಾಯಿಸುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಅಲ್ಪಾವಧಿಯ, ತದ್ರೂಪುಗೊಳಿಸುವಂಥ ಅನ್ವಯಗಳನ್ನೊಳಗೊಂಡ ಗಾಢವಾದ TTS
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
Piper ಉಚಿತ
Piper ಒಂದು ಹಗುರವಾದ ಪಠ್ಯ- Lactpi ಹಾಗು Lynx ಕಟ್ಟಡಗಳನ್ನು ರಚಿಸುವ ರೋಸಾಪ್. ಇದು ಸಂಪೂರ್ಣವಾಗಿ CPU ನ ಮೇಲೆ ಚಲನೆಗೊಳ್ಳುತ್ತದೆ, ಇದು ವಾರ್ಡ್ ಸಾಧನಗಳು, ಹೋಮ್ ಮೆದುಸು, ಮತ್ತು ಅನ್ವಯಗಳಿಗೆ ಆನ್ಲೈನ್ TTS ಅಗತ್ಯವಾಗಿರುವಂತಹ ಸಾಧನಗಳಿಗೆ ಸೂಕ್ತವಾಗಿದೆ. ೧೦೦ ಕ್ಕಿಂತ ಹೆಚ್ಚು ಬಾರಿ ಧ್ವನಿಗಳೊಂದಿಗೆ, ಒಂದು ರಸ್ಪೆರಿ- ಟೈಪ್ ಪ್ಲಗರ್ ಪ್ಲಗರ್ 4 ರಲ್ಲಿ ಸಹ ವೀಕ್ಷಣಾ ವೇಗದಲ್ಲಿ ಪಾರದರ್ಶಕ ಧ್ವನಿ ಪ್ರಸ್ತುತಪಡಿಸುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಶೀಘ್ರ ಮುನ್ನೋಟಗಳು, ನಿಲುಕಣೆ (ಆಕ್ಸೆಸಿಬಿಲಿಟಿ) ಮತ್ತು ಅಡಕಗೊಳಿಸಲಾದ ಅನ್ವಯಗಳು
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
VITS ಉಚಿತ
VITS (ಸಂಪೂರ್ಣ-ಸಂಘಟನೆ-ಸಂಘಟನೆಯಿಂದ ಕೊನೆಯ ಪಠ್ಯ- ವಾಚಕವನ್ನು ಕಲಿಯುವುದರೊಂದಿಗೆ) ಸಮಾನವಾದ ಅಂತ್ಯದ TTS ವಿಧಾನವು ಇದು ಪ್ರಸಕ್ತ ಎರಡು ಬಿಂದುಗಳಿಗಿಂತಲೂ ಹೆಚ್ಚು ನೈಸರ್ಗಿಕ ಧ್ವನಿ ವ್ಯವಸ್ಥೆಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಇದು ಪರಿವರ್ತನೆಯೊಂದಿಗೆ ವಿಶಿಷ್ಟವಾದ ಮತ್ತು ವಿಶಿಷ್ಟವಾದ ತರಹದ ತರಹದ ತರಬೇತಿಯ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಹೊಂದುತ್ತದೆ, ಸ್ವಾಭಾವದಲ್ಲಿ ಗಮನಾರ್ಹವಾದ ಪ್ರಗತಿಯನ್ನು ಸಾಧಿಸುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ನೈಸರ್ಗಿಕ ಪ್ರೊಗ್ರಾಂನಲ್ಲಿನ ಪಠ್ಯ- ಪ್ರೊಗ್ರಾಮ್ ಅನ್ನು ಓದುಗೊಳಿಕೆ
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
MeloTTS ಉಚಿತ
Metlotts: my shelli ಒಂದು ಬಹುಭಾಷೀಯ TTS ಲೈಬ್ರರಿಯು ಇಂಗ್ಲೀಷ್, ಬ್ರಿಟಿಷ್, ಆಸ್ಟ್ರೇಲಿಯ, ಫ್ರೆಂಚ್, ಚೈನೀಸ್, ಮತ್ತು ಕೊರಿಯನ್ ಬೆಂಬಲಿಸುವ ಬಹುತೇಕ ಟಿಟ್ಸ್ ಆಗಿದೆ. ಇದು ಬಹಳ ವೇಗವಾಗಿ, ಚೈನೀಸ್, ಚೀನೀ, ಮತ್ತು ಕೊರಿಯನ್. ಇದು ಸಿಪಿಯು ಮಾತ್ರ ಇರುವ ನಿಜವಾದ ಸಮಯ ವೇಗಕ್ಕೆ ಹತ್ತಿರವಾಗಿರುವ ಪಠ್ಯವನ್ನು ಚುರುಕುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಶೀಘ್ರ, ಬಹುಭಾಷೀಯ TTS ಒದಗಿಬಂದ ಅನ್ವಯಗಳನ್ನು ತಯಾರಿಸಲು
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
Kani TTS 2 ಉಚಿತ
CanyTS-2 ಒಂದು ಅತಿ ಹಗುರವಾದ ತೆಳ್ಳಗಿನ AIFM2 ಕ್ರಮ ಮಾದರಿ. ಅದು NVIITIA NOCTAP ಗೆ ನಿರ್ಮಿಸಲಾದ ಕೇವಲ 3GRAM ನಲ್ಲಿ ಚಲಾಯಿಸುತ್ತದೆ ಮತ್ತು ಒಂದು ೧೦೦ ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಭಾಷಣವನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ (RTF2). ಪ್ರಸ್ತುತ ಸಾರ್ವಜನಿಕ ಬಿಡುಗಡೆ ಮಾಡಿದ ಕೇವಲ ರೋಟೆಕ್- ರೂಟೇಬಲ್ ರೂಟ್- ೨೦ ಸೆಕೆಂಡುಗಳು (RTF- ೨), ಮತ್ತು ಧ್ವನಿಕಾರಕದ ಅಗತ್ಯವನ್ನು ಶಬ್ಧಗೊಳಿಸುವುದಿಲ್ಲ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಕೆಳಮಟ್ಟದ VRAM ಯಂತ್ರಾಂಶದಲ್ಲಿನ ವೇಗವಾದ ಇಂಗ್ಲಿಷ್ ಉತ್ಪಾದನೆಗಳು
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
OuteTTS ಉಚಿತ
ಹೊರೆಟೆಟ್ಗಳು, ಮೂಲ ವಿನ್ಯಾಸವನ್ನು ಉಳಿಸುವಾಗ ಪಠ್ಯದಿಂದ ಉಪ- ಉಪ- ಧ್ವನಿ ಸಾಮರ್ಥ್ಯಗಳೊಂದಿಗೆ ದೊಡ್ಡ ಮಾದರಿಗಳನ್ನು ವಿಸ್ತರಿಸುತ್ತವೆ. ಇದು Lama. CcUP (CPU), ಸುಕ್ಕು ಮುಖ ಪರಿವರ್ತನೆಗಾರರು, ಎಕ್ಸಲಾವಿ2, VLM ಅನ್ನು ಬದಲಾಯಿಸುವವರು. JZ ಸವಿವರಗಳ ಮೂಲಕ ಜಾಲಬಂಧಗಳನ್ನು ಉಳಿಸಿ ಮೂಲಕ ಜಾಲತಾಣವನ್ನು ಸಹ ಬೆಂಬಲಿಸುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಆದಾನ (ಇನ್ ಪುಟ್) ಆಬ್ಜೆಕ್ಟ್, ವೀಕ್ಷಕ- ಆಧಾರಿತ TTS, ಕೆಳಮಟ್ಟದ (ರೆಸೆನ್ಸರ್) ಪರಿಸರಗಳುName
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
Pocket TTS ಉಚಿತ
Kicotia ಗೆ (mishi) ಪೋಕೆಟ್ TS ಎಂದೆದ್ದು (ಮಾಧ್ಯಮ- TS) ಒಂದು ಕಾಂಪ್ಲೆಟ್- ನೋಂದಣಿ ಪಠ್ಯದ ನಮೂನೆ. ಇದು ಸಿಪಿಯು ತನ್ನ ತೂಕಕ್ಕಿಂತ ಹೆಚ್ಚಾಗಿ ಮಿಣುಕಿಸುತ್ತದೆ, ಇದು CPU ನ ಮೂಲಕ ಚುಕ್ಕಿಹೊಡೆಯುತ್ತದೆ, ಒಂದು ಆಡಿಯೊ ನಮೂನೆಯಿಂದ പൂജ್ವತ್ರಿಕ ಶಬ್ಧಕವನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ, ಹಾಗು ಸ್ವಾಭಾವಿಕವಾಗಿ ಧ್ವನಿಸುವಿಕೆಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ. ಸಣ್ಣ ಮಾದರಿ ಗಾತ್ರವು ಅದನ್ನು ಅಂಚಿನ ಒಳಭಾಗ ಮತ್ತು ಕೆಳಮಟ್ಟದ ಪರಿಸರಕ್ಕೆ ಅನುಗುಣವಾಗಿ ಮಾಡುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಕ್ಷಿಪ್ರಗತಿಯ ಹೊರವಿನ್ಯಾಸ, CPU- ಮಾತ್ರ ಪರಿಸರ, ಕ್ಷಿಪ್ರಗತಿಯ ವ್ಯವಸ್ಥ್ಯಾ
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
Kitten TTS ಉಚಿತ
KetenmmL ನಿಂದ KetenTS ರವರು ಒಂದು ಅತಿ ಹಗುರವಾದ ಲೈಟ್ ಪಠ್ಯ- ಕ್ರಮ ONX ನಲ್ಲಿ ನಿರ್ಮಿಸಲಾದಂತಹ. frees (25M- 80 ರ ಮುದ್ರಿತ ಕ್ರಮ), ಇದು GPU ಗೆ ಅಗತ್ಯವಿರುವ ಹೊರತು ಕ್ಷಿಪ್ರಮಾಣದಲ್ಲಿ ಬಹು-ಸಂಸ್ಕವಾದ ಧ್ವನಿಗಳನ್ನು ಸಂಸ್ಕರಿಸುತ್ತದೆ, GPU ಯನ್ನು ಸರಿಪಡಿಸುವ ಅಗತ್ಯವಿರುವುದಿಲ್ಲ. ಯಂತ್ರದ ವೇಗ, ಮತ್ತು ಸಂವೇದಕಗಳು ಸಂವೇದಕ, ಸಂಖ್ಯಾಶೀಲತೆ, ಮತ್ತು ಸಂಖ್ಯಾ ಅನ್ವಯಗಳಿಗೆ ಅನುಕ್ರಮಣೆ (merics).
ಇದಕ್ಕೆ ಉತ್ತಮ: ಚುರುಕಾದ TTS, ಆವರ್ತನೀಯತೆ, ಕೆಳಮಟ್ಟದ ಅನ್ವಯಗಳು
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
Ming-Omni TTS ಉಚಿತ
Mings- stans- 0. 5B ರವರು Complet- base- by mody With With WithM- by WithM- base- patch ಚಾಲನೆಯೊಂದಿಗೆ ನಿರ್ಮಿಸಲಾದ ಒಂದು ಒಪ್ಪಂದವಾದ ಭಾಷಣದ ಹಿಂಭಾಗವಾಗಿದೆ. ಮರುಸಂಘಟನೆ (plat- password) 44. Dof- password ಪ್ರೊಗ್ರಾಮ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡುತ್ತದೆ (ಆರನ್- Postring), evaler (ಆರನ್ CD- by), 3++- basesmocripts (- by) ನ user) ನ ಸುಧಾರಣಾ ಸೂಚನೆಗಳನ್ನು (shoult- base), ಮತ್ತು JBMATH- bystongracks (cling). JAdmandsmand us. JAdmandmank-mandmandmank-my). use.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಹೈಲೈಡಲ್ ಕಾಂಪ್ಯಾಕ್ಟ್ಸ್, ಭಾವಾತ್ಮಕ- ನಿಯಂತ್ರಣಿತ ಧ್ವನಿ ಕಾರ್ಯಕ್ಷಮತೆ, ಚೈನೀಸ್ ಆಡಿಯೊ ಬುಕ್ ಒಳಪಿಡಿಯು
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
MOSS-TTS Nano ಉಚಿತ
MOS-TS- neno-100MOS ಕಾಂಪ್ಯಾಕ್ಟ್ರೆಂಟ್ ನ್ಯಾವಹೋ ನ್ಯಾವಹೋ ನ್ಯಾವಹೋ ನ್ಯಾವಿಗೇಟ್, MOSMM-parent ವರ್ಗದ, ವಿಳಂಬ-trans ನ ರಚನಾ ರಚನಾಕ್ರಮವನ್ನು ಹಂಚಿಕೊಳ್ಳುತ್ತದೆ. ವಾಸ್ತುಶಿಶಕದ 8B ಮಾಪಕದ ಪ್ರತಿರೋಧಕದ ಪ್ರತಿಸ್ಪರ್ಧಕವನ್ನು ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ವ್ಯಾಪಾರವು, ~80x-ಅತ್ಯತ್ಯವಾದ VRAM ನ ಶ್ವಾರ್ಟ್ಮೈನ್ ಅದನ್ನು ಉಚಿತವಾಗಿ ಮತ್ತು ಉಚ್ಚ ಪ್ರೊಗ್ರಾಮಕ್ಕೆ ಸೂಕ್ತವಾಗಿ ಮಾಡುತ್ತದೆ.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಸ್ವಯಂ- സ്വതന്ത്ര TTS, ಉಚ್ಚ- ಪ್ರದಾನ (ವಾಲ್ಯೂಲಿಂಗ್), ಕೆಳಮಟ್ಟದ ಆವರ್ತಾತ್ಮಕ ಬಳಕೆ
ಮುಕ್ತಪ್ರಯತ್ನಿಸಿ
Bark ಶಿಷ್ಟ
ಅರ್ಥಗರ್ಭಿತವಾದ ಮಾತು, ಸಂಗೀತ ಮತ್ತು ಧ್ವನಿ ಪರಿಣಾಮಗಳನ್ನು ಉತ್ಪಾದಿಸುವ ಪಠ್ಯ- ಆಕ್ಷೇಪಣಾ ಮಾದರಿ. Name
ವಿಕಾಸಕ: Suno · ಪರವಾನಗಿ: MIT
ಪ್ರಯತ್ನಿಸಿ
Bark Small ಶಿಷ್ಟ
ಕ್ಷಿಪ್ರಗತಿಯಲ್ಲಿ ಮತ್ತು ಕಡಿಮೆ ಸ್ಮೃತಿ ಬಳಕೆಯೊಂದಿಗೆ ಬಾರ್ಕ್ ನ ಹಗುರವಾದ ಆವೃತ್ತಿ.
ವಿಕಾಸಕ: Suno · ಪರವಾನಗಿ: MIT
ಪ್ರಯತ್ನಿಸಿ
CosyVoice 2 ಶಿಷ್ಟ
ಅಲಿಬಾಬಾನವರ ಸ್ಫುಟವಾದ TTS ನ ಪ್ರಕೃತಿ ಮತ್ತು ಹತ್ತಿರದಲ್ಲಿ 'au-auginy'sahtba(ttts) ಗಳ ಸವಲತ್ತು.
ವಿಕಾಸಕ: Alibaba (Tongyi Lab) · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
Dia TTS ಶಿಷ್ಟ
ಬಹು- ಪ್ರಕ್ಷೇಪಕ ಸಂವಾದ ಉತ್ಪತ್ತಿ ಇದು ಭಾಷಣಗಾರರ ನಡುವಿನ ಸ್ವಾಭಾವಿಕ ಸಂಭಾಷಣೆಗಳನ್ನು ಹುಟ್ಟಿಸುತ್ತದೆ. Name
ವಿಕಾಸಕ: Nari Labs · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
Parler TTS ಶಿಷ್ಟ
ನೀವು ಸ್ವಾಭಾವಿಕ ಭಾಷೆಯಲ್ಲಿ ಮತ್ತು ಪ್ಯಾಲರ್ನಿಂದ ಬಯಸುವ ಸ್ವರವನ್ನು ವರ್ಣಿಸಿ.
ವಿಕಾಸಕ: Hugging Face · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
IndexTTS-2 ಶಿಷ್ಟ
ಜೀರೋ-ಸ್ಫೋಟಿನ ತ್ರಿಜ್ಯವಾದ ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ ಮತ್ತು ಉಚ್ಚ ಧ್ವನಿಸುರುಳಿ.
ವಿಕಾಸಕ: Index Team · ಪರವಾನಗಿ: Bilibili Model License
ಪ್ರಯತ್ನಿಸಿ
Spark TTS ಶಿಷ್ಟ
ವಾಕ್ಸ್ವಾತಂತ್ರ್ಯದ ಮೂಲಕ ಮಾತಾಡಬಹುದಾದ ಭಾವೋದ್ರೇಕದೊಂದಿಗೆ ಸಂಗೀತದ ಟೆಟ್ಸ್ಗಳು.
ವಿಕಾಸಕ: SparkAudio · ಪರವಾನಗಿ: CC BY-NC-SA 4.0
ಪ್ರಯತ್ನಿಸಿ
GPT-SoVITS ಶಿಷ್ಟ
ಕೇವಲ 5 ಸೆಕೆಂಡುಗಳಿಂದ ಯಾವುದೇ ಧ್ವನಿಯನ್ನು ಹೊರಹೊಮ್ಮಿಸುವ ಕ್ಯೂನಿಫಾರಂ TTS.
ವಿಕಾಸಕ: RVC-Boss · ಪರವಾನಗಿ: MIT
ಪ್ರಯತ್ನಿಸಿ
Orpheus ಶಿಷ್ಟ
ಮಾನವ ಮಟ್ಟದ ಭಾವಾತ್ಮಕ TTS ಮಾದರಿ 100K ಯ ಧ್ವನಿ ದತ್ತಾಂಶದಲ್ಲಿ ತರಬೇತಿಗೊಂಡಿತು.
ವಿಕಾಸಕ: Canopy Labs · ಪರವಾನಗಿ: Llama 3.2 Community
ಪ್ರಯತ್ನಿಸಿ
VieNeu-TTS-v2 ಶಿಷ್ಟ
ವಿಯೆಟ್ನಾಮ್ + ಇಂಗ್ಲೀಷ್ ಕೋಡ್- ಮಿನುಗುವ TTS ಮೊದಲೆ ಗಾತ್ರದ ಧ್ವನಿಗಳು ಹಾಗು ಶೂನ್ಯ ವ್ಯವಸ್ಥ್ಯಾ ಶಬ್ಧ. CPU- ಮಾತ್ರ, ಅಗತ್ಯವಿಲ್ಲ.
ವಿಕಾಸಕ: Phạm Nguyễn Ngọc Bảo · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
VoxCPM ಶಿಷ್ಟ
Thenser- ಮುಕ್ತ TTS ಯು ಸನ್ನಿವೇಶ- ಪರಿಚಯಿತ ಪ್ಯಾರಾ ಸಹಿತ 44.1kHz ಆಡಿಯೊವನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.
ವಿಕಾಸಕ: OpenBMB · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
VibeVoice ಶಿಷ್ಟ
ಮೈಕ್ರೋಸಾಫ್ಟ್ ಮೆಡಿಕಲ್ ಬಹುಮಾಧ್ಯಮ ವಿದ್ಯುತ್ಕೋಶಗಳು ಹಾಗು ಆಡಿಯೋ ಪುಸ್ತಕಗಳಂತಹ (ಪೋರ್ಟ್-ಸ್ಫೋರ್ಟ್) ಒಳಪಿಡಿಗಳಿಗೆ (multi- ಧ್ವನಿಸಾಧನ).
ವಿಕಾಸಕ: Microsoft · ಪರವಾನಗಿ: MIT
ಪ್ರಯತ್ನಿಸಿ
CosyVoice3 ಶಿಷ್ಟ
ಮುಂದಿನ ಪೀಳಿಗೆಯ ಬಹುಭಾಷೀಯ TTS, ಎರಡು- ಪಥ, ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ ಮತ್ತು ಶೂನ್ಯ ವ್ಯವಸ್ಥ್ಯಾ ಶ್ರೇಣಿಯೊಂದಿಗೆ.
ವಿಕಾಸಕ: Alibaba (FunAudioLLM) · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
NAMAA Saudi TTS ಶಿಷ್ಟ
ಮೊದಲ ಬಾರಿ ತೆರೆಯಲಾದ ಸೌದಿ- ಅರೇಬಿಕ್ ಟಿಟ್ಸ್. ಚತುರಚಚೌಕ- ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ.
ವಿಕಾಸಕ: NAMAA Space · ಪರವಾನಗಿ: MIT
ಪ್ರಯತ್ನಿಸಿ
Darwin TTS ಶಿಷ್ಟ
Cros- ಮಾಡಲ್ ಕ್ವೆನ್ ಕ್ವೆನ್-TTS FFN ತೂಕಗಳೊಂದಿಗೆ ಸಂಯೋಜಿಸಲಾದ QWn3- 1. 7B ಭಾಷೆ ಮಾದರಿಯು ಸ್ಫುಟವಾದ ಬಹುಭಾಷೀಯ ಕಾಲ್ಪನಿಕ ಪರಿಶಿಷ್ಟದಲ್ಲಿದೆ.
ವಿಕಾಸಕ: FINAL-Bench · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
MOSS-TTSD ಶಿಷ್ಟ
ಬಹು- ಪ್ರೇಷಕ ಸಂವಾದ ಒಗ್ಗೂಡಿಸುವ ನಮೂನೆ — ಪೋರ್ಟ್- ಶೈಲಿಯ ಸಂಭಾಷಣೆಗಳನ್ನು 5 ಭಾಷಣಕಾರರೊಂದಿಗೆ ಮತ್ತು 60 ನಿಮಿಷಗಳ ಕಾಂಪ್ಲೇಟರ್ ಆಡಿಯೋವಿನ 60 ನಿಮಿಷಗಳ ಸಂಭಾಷಣೆಗಳನ್ನು ಉತ್ಪಾದಿಸಿ.
ವಿಕಾಸಕ: OpenMOSS · ಪರವಾನಗಿ: Apache 2.0
ಪ್ರಯತ್ನಿಸಿ
CosyVoice 2
ಅಲಿಬಾಬಾನವರ ಸ್ಫುಟವಾದ TTS ನ ಪ್ರಕೃತಿ ಮತ್ತು ಹತ್ತಿರದಲ್ಲಿ 'au-auginy'sahtba(ttts) ಗಳ ಸವಲತ್ತು.
ಭಾಷೆಗಳು: en, zh, ja, ko, fr, de, it, es
ಓಲಾಡುವ ಧ್ವನಿಯು
IndexTTS-2
ಜೀರೋ-ಸ್ಫೋಟಿನ ತ್ರಿಜ್ಯವಾದ ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ ಮತ್ತು ಉಚ್ಚ ಧ್ವನಿಸುರುಳಿ.
ಭಾಷೆಗಳು: en, zh
ಓಲಾಡುವ ಧ್ವನಿಯು
Spark TTS
ವಾಕ್ಸ್ವಾತಂತ್ರ್ಯದ ಮೂಲಕ ಮಾತಾಡಬಹುದಾದ ಭಾವೋದ್ರೇಕದೊಂದಿಗೆ ಸಂಗೀತದ ಟೆಟ್ಸ್ಗಳು.
ಭಾಷೆಗಳು: en, zh
ಓಲಾಡುವ ಧ್ವನಿಯು
GPT-SoVITS
ಕೇವಲ 5 ಸೆಕೆಂಡುಗಳಿಂದ ಯಾವುದೇ ಧ್ವನಿಯನ್ನು ಹೊರಹೊಮ್ಮಿಸುವ ಕ್ಯೂನಿಫಾರಂ TTS.
ಭಾಷೆಗಳು: en, zh, ja, ko
ಓಲಾಡುವ ಧ್ವನಿಯು
Chatterbox
Resembel AI ನಿಂದ Stat-tata-shoo Show ಧ್ವನಿಯೊಂದಿಗೆ ಭಾವಾತ್ಮಕ ನಿಯಂತ್ರಣದೊಂದಿಗೆ.
ಭಾಷೆಗಳು: en
ಓಲಾಡುವ ಧ್ವನಿಯು
Tortoise TTS
ಬಹು- ಪ್ರಕ್ಷೇಪಕ (ಲಾಂಚ್) ಸಾಧನಗಳು ಸ್ವಇಚ್ಛಿಕ ಸಂರಚನಾ (ಇಂಟರ್ಫೇಸ್) ಸಹಿತ (multitring) ಗುಣಮಟ್ಟದ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತವೆ.
ಭಾಷೆಗಳು: en
ಓಲಾಡುವ ಧ್ವನಿಯು
OpenVoice
ಆ ಕ್ಷಣದ ಧ್ವನಿಯು, ಶೈಲಿ, ಭಾವನೆಗಳು ಮತ್ತು ಉಚ್ಚಾರಣೆಯ ಮೇಲೆ ನಿಯಂತ್ರಣವನ್ನು ಹೊಂದಿದೆ.
ಭಾಷೆಗಳು: en, zh, ja, ko, fr, es
ಓಲಾಡುವ ಧ್ವನಿಯು
VieNeu-TTS-v2
ವಿಯೆಟ್ನಾಮ್ + ಇಂಗ್ಲೀಷ್ ಕೋಡ್- ಮಿನುಗುವ TTS ಮೊದಲೆ ಗಾತ್ರದ ಧ್ವನಿಗಳು ಹಾಗು ಶೂನ್ಯ ವ್ಯವಸ್ಥ್ಯಾ ಶಬ್ಧ. CPU- ಮಾತ್ರ, ಅಗತ್ಯವಿಲ್ಲ.
ಭಾಷೆಗಳು: vi, en
ಓಲಾಡುವ ಧ್ವನಿಯು
VoxCPM
Thenser- ಮುಕ್ತ TTS ಯು ಸನ್ನಿವೇಶ- ಪರಿಚಯಿತ ಪ್ಯಾರಾ ಸಹಿತ 44.1kHz ಆಡಿಯೊವನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.
ಭಾಷೆಗಳು: en, zh
ಓಲಾಡುವ ಧ್ವನಿಯು
Pocket TTS
ಒಂದು ನಮೂನೆಯಿಂದ ಕ್ಯೂನಿಫಾರಂ ಅನ್ನು ಹೊಂದಿರುವ Kuutili, evolution ನಿಂದ ಕಡಿಮೆಯ ೦೦M ಕ್ರಮದ ಮಾದರಿ.
ಭಾಷೆಗಳು: en, fr
ಓಲಾಡುವ ಧ್ವನಿಯು
CosyVoice3
ಮುಂದಿನ ಪೀಳಿಗೆಯ ಬಹುಭಾಷೀಯ TTS, ಎರಡು- ಪಥ, ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ ಮತ್ತು ಶೂನ್ಯ ವ್ಯವಸ್ಥ್ಯಾ ಶ್ರೇಣಿಯೊಂದಿಗೆ.
ಭಾಷೆಗಳು: en, zh, ja, ko, de, es, fr, it, ru
ಓಲಾಡುವ ಧ್ವನಿಯು
NAMAA Saudi TTS
ಮೊದಲ ಬಾರಿ ತೆರೆಯಲಾದ ಸೌದಿ- ಅರೇಬಿಕ್ ಟಿಟ್ಸ್. ಚತುರಚಚೌಕ- ಧ್ವನಿ ಕ್ಯೂನಿಫಾರಂ.
ಭಾಷೆಗಳು: ar
ಓಲಾಡುವ ಧ್ವನಿಯು
Darwin TTS
Cros- ಮಾಡಲ್ ಕ್ವೆನ್ ಕ್ವೆನ್-TTS FFN ತೂಕಗಳೊಂದಿಗೆ ಸಂಯೋಜಿಸಲಾದ QWn3- 1. 7B ಭಾಷೆ ಮಾದರಿಯು ಸ್ಫುಟವಾದ ಬಹುಭಾಷೀಯ ಕಾಲ್ಪನಿಕ ಪರಿಶಿಷ್ಟದಲ್ಲಿದೆ.
ಭಾಷೆಗಳು: en, ko, ja, zh
ಓಲಾಡುವ ಧ್ವನಿಯು
MOSS-TTSD
ಬಹು- ಪ್ರೇಷಕ ಸಂವಾದ ಒಗ್ಗೂಡಿಸುವ ನಮೂನೆ — ಪೋರ್ಟ್- ಶೈಲಿಯ ಸಂಭಾಷಣೆಗಳನ್ನು 5 ಭಾಷಣಕಾರರೊಂದಿಗೆ ಮತ್ತು 60 ನಿಮಿಷಗಳ ಕಾಂಪ್ಲೇಟರ್ ಆಡಿಯೋವಿನ 60 ನಿಮಿಷಗಳ ಸಂಭಾಷಣೆಗಳನ್ನು ಉತ್ಪಾದಿಸಿ.
ಭಾಷೆಗಳು: en, zh
ಓಲಾಡುವ ಧ್ವನಿಯು
Ming-Omni TTS
Compact 0. 5B ನಿಘಟಕದ (mumbny- module) ಉಪಘಟಕವು user- fifidedefault 44. 1kHz ಉತ್ಪತ್ತಿಯೊಂದಿಗೆ ಮತ್ತು ಶೂನ್ಯ- shooct metrus commans.
ಭಾಷೆಗಳು: en, zh
ಓಲಾಡುವ ಧ್ವನಿಯು
MOSS-TTS Nano
ಸಣ್ಣ ೧೦೦M MOS-TS ವರ್ಗ. ಒಂದೇ ಕಟ್ಟಡ, 80x ಚಿಕ್ಕ, ಉಚಿತ- ಆರಂಭಿಕ.
ಭಾಷೆಗಳು: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
ಓಲಾಡುವ ಧ್ವನಿಯುವಿಕಾಸಕ- ಮೊದಲ API
OpenAI- ಸಹವರ್ತನೀಯ RPI. ಒಂದು ಕೊನೆಯ ಬಿಂದು, 22+ ಮಾದರಿ. ನಿಜವಾದ ಸಮಯ ಅನ್ವಯಗಳಿಗೆ ಬೆಂಬಲ ನೀಡಲಾಗುತ್ತಿದೆ.
- ಓಪನ್ ಜೆಎಐ-ಹೊಂದುವ ವಿನ್ಯಾಸ
- ರಿಯಲ್ಟೈಮ್ ಸಮಯ ಅನ್ವಯಗಳಿಗೆ TTS ಅನ್ನು ಹರಿಸಲಾಗುತ್ತಿದೆName
- ದೊಡ್ಡ ಕೆಲಸಗಳಿಗಾಗಿ ಬ್ಯಾಕ್ಟೀರಿಯಗಳನ್ನು ತಯಾರಿಸಲಾಗುತ್ತದೆ
- ಜಾಲ ತಂಬ್ ಸೂಚನೆಗಳು
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ಸರಳ, ಪಾರದರ್ಶಕ ಪ್ರಕ್ಷೇಪಣೆName
ನೀವು ಬೆಳೆಯುತ್ತಾ ಹೋದಂತೆ ಅಳತೆಯ ಗಾತ್ರವನ್ನು ಬದಲಾಯಿಸಿರಿ.
ಉಚಿತ
15,000 ಅಕ್ಷರಗಳು + 5,000/ ದಿನ
- 7 ಕೋಕೋರೋ ನಂತಹ ಉಚಿತ ಮಾದರಿಗಳು
- ಪೀಳಿಗೆಗೆ 5,000 ಎಕ್ಸ್ಪ್ರೆಸ್ಗಳು
- API ನಿಲುಕಣೆ (application) ಒಳಗೊಂಡಿದೆ
ಆರಂಭಿಸು
500 ರದ್ದುಗಳು/ ತಿಂಗಳು
- ಎಲ್ಲಾ 22+ ಮಾದರಿಗಳು
- ಪೀಳಿಗೆಗೆ 1,00,000 ಲಿಪಿಶೈಲಿಗಳು
- ಧ್ವನಿ ಕೆರಳುವಿಕೆ
ಪ್ರಾಥಮಿಕName
2,000 ರತ್ನಗಳು/ ತಿಂಗಳು
- ಎಲ್ಲವನ್ನೂ ಆರಂಭಿಸು@ action: inmenu Tools
- API ನಿಲುಕಣೆ
- ಆದ್ಯತೆಯ ಪ್ರಕ್ರಿಯೆ
ವ್ಯಾಪಾರ
10,000 ರದ್ದುಗಳು/ ತಿಂಗಳಿಗೆ
- ಪ್ರೋಟೋರಿಯಲ್ಲಿ ಎಲ್ಲವೂ
- ಒಟ್ಟು API
- ಆದ್ಯತೆ ಅನುಕ್ರಮ
ಅನೇಕವೇಳೆ ಪ್ರಶ್ನೆಗಳು
ನೀವೇನು ಉತ್ತರ ಕೊಡುವಿರಿ?
ಇಂದು ಎI ಧ್ವನಿಯನ್ನು ಬಳಸುತ್ತಾ ಆರಂಭಿಸು
TTS.ai ಅನ್ನು ಬಳಸುವ ನಿರ್ಮಾಣಿಕ, ವಿಕಾಸಗಾರರ ಮತ್ತು ವ್ಯಾಪಾರಿಗಳೊಂದಿಗೆ ಜೊತೆಗೂಡಿ