ರಿಯಲ್ ಟೈಮ್ ಶಬ್ದ ಕ್ಲೋಲಿಂಗ್ - ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಯಾವುದೇ ಧ್ವನಿಯಿರಲಿ ಸೆಕೆಂಡುಗಳಲ್ಲಿ
ರೆಫರೆನ್ಸ್ ಆಡಿಯೋವಿನ ಕೇವಲ 5 ಸೆಕೆಂಡುಗಳಂತಹ ಯಾವುದೇ ಧ್ವನಿಯನ್ನು ಆಯ್ಕೆಮಾಡಿ. ಚಾಟ್ಟರ್ಬಾಕ್ಸ್, ಕಾಸಿಓಸ್ 2, GVIVIS, ಮತ್ತು ಓಪ್ವಿಸ್ಟಸ್. ಯಾವುದೇ ತರಬೇತಿಯಿಲ್ಲದ ಜೀರೋ-ಸ್ ಸ್ಟಾಕ್ ಕ್ಲಾಫ್ ಕ್ಲಾಫ್ ಫೌಂಡೇಷನ್, ಒಂದು ಮಾದರಿ ಹಾಗು ಸಂಸ್ಕರಕವನ್ನು ತಕ್ಷಣ ಲೋಡ್ ಮಾಡಿ. ಎಲ್ಲಾ ಮಾದರಿಗಳು ಜಾಹೀರಾತು ಲೈಸನ್ಸ್ ಆಗಿರುತ್ತವೆ.
ನಿಜವಾದ- ಕಾಲಂ ಕ್ಲೋಲಿಂಗ್ ವೈಶಿಷ್ಟ್ಯಗಳು
ತತ್ಕ್ಷಣವೇ SINE-Status AI — ತರಬೇತಿ, ದತ್ತಸಂಚಯಗಳಿಲ್ಲ, ಕಾಯುತ್ತಿಲ್ಲ
ಜೀರೋ- ಸ್ಟಾಟ್ ಕ್ಲಲಿಂಗ್
ಯಾವುದೇ ತರಬೇತು ಇಲ್ಲ, ಸುಪ್ರಕಾಶಿಸಲಾದ, ದತ್ತಸಂಚಯದ ಸಂಗ್ರಹವಿಲ್ಲ. ಆಡಿಯೋ 5 ಸೆಕೆಂಡುಗಳ ನೌಕಾಡನ್ನು ಉತ್ಥಾಪಿಸಿ ನಂತರ ಒಂದು ನೋಡ್ಪಡೆಯ ಧ್ವನಿ ಪಡೆಯಿ. AI ಯು ಭಾಷಣಕಾರ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನಿಜವಾದ ಸಮಯ ದಲ್ಲಿ ತೆಗೆದು ಹಾಕುತ್ತದೆ.
9 ಕ್ಲಿಂಗಿಂಗ್ ಮಾದರಿಗಳು
ಚ್ಯಾಟ್ಬಾಕ್ಸ್, ಕಾಸಿವಿಸ್ ೨, GPTOS, OpenVOS, SparkTS, GTS- 2, GLM-TTS, ಮತ್ತು ಕ್ವೀನ್-TTS ಮತ್ತು ಡಾರ್ಟೋಸ್. ಪ್ರತಿಯೊಂದು ನಮೂನೆಗೆ ಗುಣಮಟ್ಟ, ವೇಗ, ಮತ್ತು ಭಾಷೆಗೆ ಬೇರೆ ಬೇರೆ ಬಲಗಳಿವೆ.
ಸಾರ್ವತ್ರಿಕ ಕ್ಲಲಿಂಗ್
ಚೀನೀ, ಜಪಾನೀ, ಕೊರಿಯ, ಮತ್ತು ಇನ್ನೂ ಹೆಚ್ಚಿನ ಭಾಷೆಗಳಲ್ಲಿ ಒಂದು ಧ್ವನಿಯನ್ನು ಹೊರಸೂಸಿರಿ. CCSVVoice 2 ಮತ್ತು QVN3-Tests ಸ್ವರವನ್ನು 17+ ಭಾಷೆಗಳಾದ್ಯಂತ ಸಂರಕ್ಷಿಸುತ್ತದೆ. Name
ಏಕವಣಾ ನಿಯಂತ್ರಣ
ಚಾಲ್ಟರ್ ಬಾಕ್ಸ್, ಓಪನ್ ವಿವೋಸ್, ಮತ್ತು GLMTS ಸಹ ಭಾವಾತ್ಮಕ ಪೀಳಿಗೆಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಅದೇ ಪಠ್ಯವನ್ನು ವಿವಿಧ ಭಾವೋದ್ರೇಕಗಳೊಂದಿಗೆ, ಸಂತೋಷ, ದುಃಖ, ಕೋಪ, ಚಾಲನೆಯಲ್ಲಿಡುವ ಧ್ವನಿಯನ್ನು ಇಟ್ಟುಕೊಂಡು ಹಾಗೆಯೇ ತಯಾರಿಸು.
ಆಕರವನ್ನು ತೆರೆ & ಮಾರಾಟಗಾರ
ಪ್ರತಿಯೊಂದು ಕ್ಯೂನಿಫಾರಂ ಮಾದರಿ MIT ಅಥವಾ ಅಪ್ಪ - 2.0 ಲೈಸನ್ಸ್ಗಳ ಕೆಳಗೆ ತೆರೆದಿರುತ್ತದೆ.
ಕ್ಲಿಂಗ್ API
ಪ್ರೋಗ್ರಾಂನಲ್ಲಿ (ಪ್ರೋಗ್ರಾಂ) ಪ್ರೊಗ್ರಾಂ aPI ಗೆ ಪರಿಶೀಲಿಸು. ರೆಫರೆನ್ಸ್ ಆಡಿಯೊ, ಪಠ್ಯವನ್ನು ಸೂಚಿಸಿ, ಆನ್ಲೈನ್ ಭಾಷಣವನ್ನು ಸ್ವೀಕರಿಸು. ಪೈಥಾನ್ ಹಾಗು JavaScript ನ SDKs. ಹೆಚ್ಚು ಪ್ರದಕ್ಷಿಣ ಕೆಲಸಗಳಿಗೆ ಕನ್ಸೋಲ್ ಕನ್ಸೋಸ್.
ಕ್ಲೋಲಿಂಗ್ ಮಾದರಿಗಳು
ಪ್ರತಿಯೊಂದು ಕ್ಯೂನಿಫಾರಂ ಅನ್ನು ಬಳಸುವ ಕೇಸ್ಗಾಗಿ 9 ಓಪನ್- ದೂರಸ್ಥ (source) ಮಾದರಿಗಳು
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಉತ್ತಮ ಗುಣಮಟ್ಟ — ೫- ಎರಡನೆ ಸಾಲು, ಭಾವನೆಗಳ ನಿಯಂತ್ರಣ, MIT ಲೈಸನ್ಸ್ ಮಾಡಲಾಗಿದೆ
ಪ್ರಯತ್ನಿಸಿ Chatterbox
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಅತ್ಯುತ್ತಮ ಬಹುಭಾಷೀಯ ಕಾಲ್ಪೋರ್ಟರ್ ಚೀನೀ, ಇಂಗ್ಲಿಷ್, ಜಪಾನ್, ಕೊರಿಯನ್ ದೇಶಗಳಾದ್ಯಂತ ಧ್ವನಿಯನ್ನು ಉಳಿಸುತ್ತದೆ
ಪ್ರಯತ್ನಿಸಿ CosyVoice 2
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಸ್ಫೂರ್ತಿ ಬಣ್ಣದ ಪರಿವರ್ತನೆಗೆ ಭಾವ ಮತ್ತು ಶೈಲಿಯ ವರ್ಗಾವಣೆName
ಪ್ರಯತ್ನಿಸಿ OpenVoice
Spark TTS
Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಅತಿ ವೇಗವಾದ ಕ್ಯೂನಿಫಾರಂ ಮಾದರಿ — ಇದು ~12 ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಫಲಿಸುತ್ತದೆ
ಪ್ರಯತ್ನಿಸಿ Spark TTS
IndexTTS-2
Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಉತ್ತಮ ಚೀನೀ- ಇಂಡಿಯನ್ ಕ್ಯೂನಿಫಾರಂ ಸುವರ್ಣೀಯತೆName
ಪ್ರಯತ್ನಿಸಿ IndexTTS-2
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
ಇದಕ್ಕೆ ಉತ್ತಮ: ಶ್ರವ್ಯಾಂಶ (ಆಡಿಯೋ) ಫಲಿತಾಂಶಗಳು
ಪ್ರಯತ್ನಿಸಿ Tortoise TTSಎಷ್ಟು ನಿಜವಾದ ಕಾಲಂನ ಚಲನೆ ಕೆಲಸಗಳು
ಒಂದು ಚಿಕ್ಕ ಶಬ್ಧಕೋಶದಿಂದ ಅನಿಮಲಗೊಳಿಸಲಾದ ಭಾಷಣಕ್ಕೆ ಮಾದರಿName
ರೆಫರೆನ್ಸ್ ಶ್ರವ್ಯಾಂಶ (ರೆಫರೆನ್ಸ್) ಆಡಿಯೊವನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುNAME OF TRANSLATORS
FV, MP3, ಅಥವಾ ನಿಮ್ಮ ವೀಕ್ಷಕದಲ್ಲಿ ನೇರವಾಗಿ ದಾಖಲಿಸು. NAME OF TRANSLATORS
ಕ್ಲಾನ್ಸಿಂಗ್ ಮಾದರಿ ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಿ
ನಿಮ್ಮ ಅಗತ್ಯಗಳಿಗೆ ಸರಿಹೊಂದುವ ನಮೂನೆಯನ್ನು ಆರಿಸಿಕೊಳ್ಳಿ.
ಪಠ್ಯವನ್ನು ನಮೂದಿಸು
ನೀವು ಬಯಸುವ ಪಠ್ಯವನ್ನು ತುಲನಾತ್ಮಕ ಧ್ವನಿಯಲ್ಲಿ ಸೂಚಿಸಿ ಅಥವಾ ಅಂಟಿಸಿ. ಮಾದರಿ ಕೆಲಸಗಳಿಂದ ಬೆಂಬಲಿಸಲಾಗುವ ಯಾವುದೇ ಭಾಷೆಯನ್ನು ಟೈಪ್ ಮಾಡಿ.
ನಕಲಿಳಿಸು( O)
ನಿಮ್ಮ ಕ್ಲಿನ್ನಿಂಗ್ ಅನ್ನು 10- 25 ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಉತ್ಥಾಪಿಸಿ ಕೇಳಿಸಿಕೊಳ್ಳಿ. ತಕ್ಷಣ ಬಳಸಲು WAV ಅಥವ MP3 ಅನ್ನು ನಕಲಿಳಿಸಿ.
Shoo- hot Seating ಕೆಲಸಗಳು ಎಷ್ಟು?
ಯಾವುದೇ ಶ್ವೇತಿಂಗ್, ದತ್ತಸಂಚಯ ಸಂಗ್ರಹವಿಲ್ಲ — ಕೇವಲ ನಕಲೇರಿಸುವಿಕೆ ಹಾಗು ಕ್ಲೋಲೋನ್ ಮಾತ್ರ
ಧ್ವನಿಕಾರ (ಎಂಬೆಡಿಂಗ್) ಅಡಚಣೆ ಮಾಡುವಿಕೆ
AI ನಿಮ್ಮ ರೆಫರೆನ್ಸ್ ಆಯಾಮಿಂಗ್ ರೆಕಾರ್ಡಿಂಗ್ ಅನ್ನು ವಿಶ್ಲೇಷಿಸುವ ನಿಮ್ಮ ರೆಫರೆನ್ಸ್ ಡಿಜಿಟಲ್ ವಿಶ್ಲೇಷನ ವಿಶಿಷ್ಟವಾದ ಗಣಿತೀಯ ವೈಶಿಷ್ಟ್ಯಗಳಾದ ಆರ್ಗ್ಯುಮೆಂಟ್ಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುತ್ತದೆ. ರೆಕಾರ್ಡಿಂಗ್, ರಿಂಗ್, ಧ್ವನಿ ಸವಲತೆ, ಮತ್ತು ಧ್ವನಿ ರಚನೆಯಂತಹ ವಿಶಿಷ್ಟವಾದ ಗಣಿತವಾದ ಗಣಿತದ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಸೇರಿಸಿ. ಇದು ೧ ಸೆಕೆಂಡಿನೊಳಗೆ ಸಂಭವಿಸುತ್ತದೆ.
- ಆಡಿಯೊದ 5 ಸೆಕೆಂಡುಗಳಷ್ಟು ದೊಡ್ಡದಾದ ಕೆಲಸಗಳು
- ಸೆರೆಹಿಡಿಯುವಿಕೆಗಳು, ವೈಖರಿ, ಮತ್ತು ಮಾತಾಡುವ ಶೈಲಿ
- ಯಾವುದೆ ತರಬೇತಿ ಅಥವಾ ಸುಧಾರಕ ಅಗತ್ಯವಿಲ್ಲ
- ಆಡಿಯೊವನ್ನು ಎಂದಿಗೂ ಶಾಶ್ವತವಾಗಿ ಶೇಖರಿಸಿಡಲಾಗಿಲ್ಲ
ನಿಯೋಜಿತ ಮಾತು ಸಂಯುಕ್ತಿ
TTS ಮಾದರಿ ಭಾಷಣಕರ್ತ ನೆಂಬೇಡ್ನಲ್ಲಿ ಹೊಸ ಭಾಷಣದ ವ್ಯವಸ್ಥೆಯನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ. ಇದರ ಪರಿಣಾಮವು, ನಿಮ್ಮ ಪಠ್ಯವನ್ನು ಅಂದರೆ ಸ್ವಾಭಾವಿಕವಾದ ಸ್ವಾಭಾವಿಕವಾದ ಸ್ವಾಭಾವಿಕವಾದ, ಸೂಕ್ತವಾದ ಒತ್ತುನೀಡುವ ಮತ್ತು ಮೂಲ ವಾಣಿಯ ಪಾತ್ರವು ಯಾವುದೇ ಭಾಷೆಯಾಗಲಿ ಒಳವಿಷಯವಾಗಲಿ ಇರದಿರುವಂತೆ ಇರುತ್ತದೆ.
- ಒಂದೇ ನಮೂನೆಯಿಂದ ನಿಗದಿಪಡಿಸಲಾಗದ ಮಾತನ್ನು ರಚಿಸಿ
- ಸೀಸ್- ವ್ಯವಸ್ಥ್ಯಾ ಯಂತ್ರ (ಉದಾಹರಣೆ ಮಾಡದ) (ಭಾಷಾಗಳಲ್ಲಿ ಮಾತಾಡು)
- ಓಪನ್ ಜೆಎಲ್ ಮತ್ತು ಶೈಲಿ ವರ್ಗಾವಣೆName
- 10-25 ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಫಲಿತಾಂಶಗಳು
ಕ್ಲಾನ್ಸಿಂಗ್ ಮಾದರಿಗೆ ಹೋಲುವ ಧ್ವನಿ
ನಿಮ್ಮ ಕನ್ಸೋಲ್ ಬಳಕೆ ಕೇಸ್ಗೆ ಬಲ மாதிரிವನ್ನು ಆಯ್ಕೆ ಮಾಡಿName
| ಮಾದರಿ | ಅನುವಾದ | ವೇಗ | ಗುಣಮಟ್ಟ | ಭಾಷೆಗಳುName | ಎಮುಲೇಶನ್ | ಪರವಾನಗಿ |
|---|---|---|---|---|---|---|
| Chatterbox | 5s | ~21s | ಉತ್ತಮ | EN | MIT | |
| CosyVoice 2 | 5s | ~20s | ಉತ್ತಮ | CN, ಇಂಗ್, ಜೆಪಿ, KO+Name | Apache 2.0 | |
| GPT-SoVITS | 5s | ~16s | ಉತ್ತಮ | CN, ಇಂಗ್, ಜೆಪಿ, KO | MIT | |
| OpenVoice | 5s | ~15s | ಒಳ್ಳೇ | ಎಮ್, ಎನ್, ಇ. ಎಸ್, FR+Name | MIT | |
| Spark TTS | 5s | ~12s | ಒಳ್ಳೇ | ಸಿ ಎನ್. | Apache 2.0 | |
| IndexTTS-2 | 5s | ~18s | ಉತ್ತಮ | ಸಿ ಎನ್. | Apache 2.0 | |
| GLM-TTS | 5s | ~25s | ಉತ್ತಮ | ಸಿ ಎನ್. | Apache 2.0 | |
| Qwen3-TTS | 5s | ~16s | ಉತ್ತಮ | CN, ಇಂಗ್, ಜೆಪಿ, KO+Name | Apache 2.0 | |
| Tortoise | 15s | ~60s | ಸ್ಟುಡಿಯೊName | EN | Apache 2.0 |
ಜನರು ನಿಜವಾದ ಸಮಯ ಮೀರಿದ ಕೆರಳುವಿಕೆಗಾಗಿ ಏನು ಬಳಸುತ್ತಾರೆ
ಕಲಿಕೆಯ ಒಳಪದರದಿಂದ ನಿಲುಕಣೆಗೆ — ಸ್ವರದಲ್ಲಿ ಅಂತ್ಯವಿಲ್ಲದ ಅನ್ವಯಗಳಿವೆ
ಶ್ರವ್ಯಾಂಶ (ಆಡಿಯೋ) ಪುಸ್ತಕ ನಾಡಿಂಗ್
ಕತೃಗಳು ತಮ್ಮ ಸ್ವಂತ ಧ್ವನಿಯನ್ನು ಹೊರತೆಗೆಯುತ್ತಾರೆ ಮತ್ತು ರೆಕಾರ್ಡಿಂಗ್ ಅನ್ನು ಬಳಸದೆ ಇಡೀ ಆಡಿಯೊ ಪುಸ್ತಕಗಳನ್ನು ರಚಿಸುತ್ತಾರೆ. ಪುನರಾವರ್ತಿಸುವ ಬದಲು ಒಂದೇ ವಾಕ್ಯಗಳನ್ನು ವಿಕಸಿಸುವ ಮೂಲಕ ತಪ್ಪನ್ನು ತಿದ್ದಿಕೊಳ್ಳಿ.
ದೃಷ್ಯಾಂಶ (ವಿಡಿಯೋ) ಡಬ್ಲಿಂಗ್Name
ಮೂಲ ಭಾಷಣಕಾರನ ಧ್ವನಿಯನ್ನು ಇಟ್ಟುಕೊಂಡು ಬೇರೆ ಭಾಷೆಗಳಿಗೆ ಡ್ಯೂಪ್ ಮಾಡಿ. ಚೀನೀ, ಇಂಗ್ಲಿಷ್, ಜಪಾನೀ ಮತ್ತು ಕೊರಿಯದಾದ್ಯಂತ ಧ್ವನಿಯ ಗುರುತನ್ನು ಉಳಿಸುವ ಕೋಸಿವಿಸ್ 2 ಮತ್ತು ಕ್ವೆನ್-ಟಿಸ್.
ವಿಷಯರಚನೆ
ಯುಡಿಟ್ಗಳು, ಪೋರ್ಚುಗೀಟರ್ಗಳು, ಮತ್ತು ಟಿಕ್ ಟೋಕ್ ನಿರ್ಮಾಣಕಾರರು ಈ ಸ್ವರವನ್ನು ಹೊಂದಿಕೆಯಾಗಿ ಸಂರಚಿಸುತ್ತಾರೆ. ರೆಕಾರ್ಡಿಂಗ್ ಮಾಡದೆ ಹೊಸ ವಿಷಯಗಳನ್ನು ಹುಡುಕಲು, ಅಥವ ಪ್ರಸಕ್ತ ವಿಡಿಯೋಗಳ ಪರ್ಯಾಯ ಅನುಕ್ರಮ ರೂಪಗಳನ್ನು ನಿರ್ಮಿಸಿ.
ಸುಲಭ ಲಭ್ಯತೆ (ಅಕ್ಸೆಸಿಬಲಿಟಿ)
ಕಾಯಿಲೆ ಅಥವಾ ಶಸ್ತ್ರಚಿಕಿತ್ಸೆಯಿಂದ ತಮ್ಮ ಧ್ವನಿಯನ್ನು ಕಳೆದುಕೊಂಡಿರುವ ಜನರು ಅದನ್ನು ಹಳೆಯ ರೆಕಾರ್ಡಿಂಗ್ಗಳಿಂದ ಕ್ಯೂನಿಫಾರಂ ಮಾಡಬಹುದು ಅವರು ತಮ್ಮ ಸ್ವಂತ ಸ್ವರದಲ್ಲಿ ಪಠ್ಯ- ಲಿಪ್ಗೆ ಸಂವಾದ ಮಾಡಲು ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತಾರೆ.
ಆಟ ವಿಕಸನName
ಸ್ಲೈನ್ ವೀಕ್ಷಕರು ಮತ್ತು ಲೆಕ್ಕವಿಲ್ಲದಷ್ಟು ಸಂವಾದ ವ್ಯತ್ಯಾಸಗಳನ್ನು ಸೃಷ್ಟಿಸಲಾಗಿದೆ ಅನುಕ್ರಮವಿಲ್ಲದ ಸ್ಟೈಲಿ ಸ್ಟೂಡಿಯೋ ಸಮಯ ಇಲ್ಲದೇ. ಎಲ್ಲಾ ಸಾಲುಗಳಲ್ಲಿ ಪುನರ್ನಿರ್ಮಾಣ ಮಾಡಲಾಗದೆ ಇರುವ ಇತ್ಯಾದಿ ಗೇಮ್ಸ್, ಮೋಡ್, ಮೋಡ್ಡಿಸ್ ಮತ್ತು ವೀಕ್ಷಣೆಗೊಳಕ್ಕೆ ಪರಿಪೂರ್ಣವಾಗಿಲ್ಲ.
IVR ಮತ್ತು ದೂರವಾಣಿ ವ್ಯವಸ್ಥೆಗಳುName
ನಿಮ್ಮ ಕಂಪೆನಿಯ ಸೂಚಿಯ ಅನುಕ್ರಮವನ್ನು (ಫೋಟೋ ಮೆನುಗಳು) ಹಾಗು ಮೆಸೆಜ್) ಪ್ರತ್ಯುತ್ತರಗಳಿಗಾಗಿ ಮರುಕಳಿಸಿರಿ. ಧ್ವನಿ ವೀಕ್ಷಕವನ್ನು ತೆಗೆಯದೆ IVR ಉಪಕರಣವನ್ನು ಅಪ್ಡೇಟ್ ಮಾಡು. ಕೇವಲ ಹೊಸ ಪಠ್ಯವನ್ನು ಹಾಗು ಆನ್ಲೈನ್ ಅನ್ನು ಟೈಪ್ ಮಾಡು.
TTS.ai vs Other Voice Cloning Solutions
ಏಕೆ 9 ಮಾದರಿಗಳು ಒಂದು ಅನ್ವಯ-ಸಂಪರ್ಕವನ್ನು ಚುರುಕುಗೊಳಿಸುತ್ತದೆ
| ವೈಶಿಷ್ಟ್ಯ | TTS.ai | SV2TTS | ElevenLabs | Resemble AI |
|---|---|---|---|---|
| ಕ್ಲಿಂಗಿಂಗ್ ಮಾದರಿಗಳು | 9 | 1 | 1 | 1 |
| Min. ರೆಫರೆನ್ಸ್ ಶ್ರೇಣಿ ಶ್ರವ್ಯಾಂಶ (ಆಡಿಯೋ) | 5 sec | 5 sec | 30 sec | 3 min |
| ತರಬೇತಿಯ ಅಗತ್ಯವಿದೆ | ಇಲ್ಲ | ಇಲ್ಲ | ಇಲ್ಲ | ಹೌದು |
| ಧ್ವನಿ ಗುಣಮಟ್ಟ (2025) | ಸ್ಟುಡಿಯೊ- ಗ್ರೇಡ್ | ದಿನಾಂಕ ನೀಡಲಾದ | ಉತ್ತಮ | ಉತ್ತಮ |
| ಏಕವಣಾ ನಿಯಂತ್ರಣ | ||||
| ಸಾರ್ವತ್ರಿಕ ಕ್ಲಲಿಂಗ್ | ||||
| ಓಪನ್ ಜೆಎಲ್ ಆಕರ | ||||
| GPU ಅಗತ್ಯ | ಮೋಡಗಳು | ಹೌದು | ಮೋಡಗಳು | ಮೋಡಗಳು |
| API ನಿಲುಕಣೆ | ||||
| ಫ್ರೀ ಟಿಟರ್Query | 15,000 ಅಕ್ಷರಗಳು | ಸ್ವಯಂ- ಸರ್ವರ್ | ಮಿತಿಗೊಳಗೊಂಡ |
ಕ್ಲಿನ್ನಿಂಗ್ API
ನಮ್ಮ ಗ್ರಿಟ್ APIನೊಂದಿಗೆ ವಿಶೇಷವಾದ ಧ್ವನಿ ಪ್ರೋಗ್ರಾಮ್ ಪ್ರೋಗ್ರಾಮ್
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-...")
# Clone a voice from a 5-second sample
result = client.clone_voice(
name="My Cloned Voice",
file="reference.wav", # 5-30 seconds of clear speech
model="chatterbox", # or cosyvoice2, openvoice, spark...
text="Hello! This is my cloned voice speaking new text.",
)
# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
f.write(audio)
curl -X POST https://api.tts.ai/v1/voice-clone \
-H "Authorization: Bearer sk-tts-YOUR_KEY" \
-F "reference=@voice_sample.wav" \
-F "text=This is my cloned voice." \
-F "model=chatterbox"
ಅತ್ಯುತ್ತಮ ಸ್ವರದ ಸುಳಿವು
ಈ ರೆಕಾರ್ಡು ಮಾಡುವ ನೇತೃತ್ವಗಳೊಂದಿಗೆ ಅತ್ಯಂತ ನಿಷ್ಕೃಷ್ಟ ಧ್ವನಿ ಕ್ಲೈನ್ ಅನ್ನು ಪಡೆದುಕೊಳ್ಳಿ
ಶಾಂತ ಪರಿಸರ
ಒಂದು ಪ್ರಶಾಂತವಾದ ಕೋಣೆಯಲ್ಲಿ ತೀರ ಕಡಿಮೆ ಹಿನ್ನೆಲೆಯ ಶಬ್ದದೊಂದಿಗೆ ರೆಕಾರ್ಡ್ಮಾಡಿರಿ.
10- 30 ಸೆಕಂಡುಗಳು
5 ಸೆಕೆಂಡುಗಳು ಕೆಲಸ ಮಾಡುತ್ತಿರುವಾಗ, 10-30 ಸೆಕೆಂಡುಗಳು ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ಕೊಡುತ್ತವೆ. ಎಷ್ಟು ಸ್ವಾಭಾವಿಕವಾಗಿ AI ಕೇಳುತ್ತದೋ ಅಷ್ಟೇ ನಿಷ್ಕೃಷ್ಟವಾಗಿ ಕ್ಲೋನ್ ಅನ್ನು ಹೊರಬರುತ್ತದೆ.
ಸ್ವಾಭಾವಿಕ ಮಾತು
ಒಂದು ಶಬ್ದಕೋಶದಲ್ಲಿ ಮಾತ್ರ ನೀವು ಮಾತಾಡುವುದಿಲ್ಲ, ಬದಲಾಗಿ ಆ ಭಾಷೆಯನ್ನಾಡಿರಿ.
ಒಂಟಿ ಧ್ವನಿಕಾರ
ಕೇವಲ ಒಬ್ಬ ವ್ಯಕ್ತಿಯೊಂದಿಗೆ ಮಾತ್ರ ಮಾತಾಡುವಂಥ ನಮೂನೆಯನ್ನು ಉಪಯೋಗಿಸಿರಿ.
ಇಂದು ಕುಣಿದಾಡುವ ಸ್ವರವನ್ನು ಆರಂಭಿಸಿ
೫ ಸೆಕೆಂಡುಗಳನ್ನು ಆಡಿಯೊ ಲೋಡ್ ಮಾಡಿ ಮತ್ತು 30 ಸೆಕೆಂಡುಗಳಿಗೆ ಕಡಿಮೆ ನಿಮ್ಮ ಕ್ಲೋವ್ಡಿಂಗ್ ಧ್ವನಿಯನ್ನು ಕೇಳಿಸಿಕೊಳ್ಳಿ. ಪ್ರಯತ್ನಿಸಿ.
ಈಗ ಧ್ವನಿಯೊಂದನ್ನು ಹೊರತೆಗೆದುಕೊಳ್ಳಿ API ದಸ್ತಾವೇಜೀಕರಣಅನೇಕವೇಳೆ ಪ್ರಶ್ನೆಗಳು
ರಿಯಲ್ಟೈಮ್ ಶಬ್ದ ಕ್ಯೂನಿಫಾರಂ ಬಗ್ಗೆ ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೆಗಳು
ನೀವೇನು ಉತ್ತರ ಕೊಡುವಿರಿ?
ಸೆಕೆಂಡುಗಳಲ್ಲಿ ಯಾವುದೇ ಧ್ವನಿಯನ್ನು ಕತ್ತರಿಸಿ
9 ತೆರೆದಿರುವ ಮುಚ್ಚುಮರೆಯಿಲ್ಲದ ನ್ಯಾವಹೋಲ್ಡರ್ ಮಾದರಿ. ಯಾವುದೇ ಎಕ್ಸ್ಪ್ರೆಶನ್ ಅಗತ್ಯವಿರುವುದಿಲ್ಲ. ಇದನ್ನು ಉಚಿತವಾಗಿ ಪ್ರಯತ್ನಿಸಿ — ನಿಮ್ಮ ಆಡಿಯೊ ಅನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡಿ ಮತ್ತು ಕ್ಲೋಲೋಡ್ ಅನ್ನು ತಕ್ಷಣ ಕೇಳಿ.