Report Bug / Feature Request

உண்மையான நேர குரல் படிமமாக்கல் — நொடிகளில் எந்த குரலையும் படிமமாக்கவும்

எந்த குரலையும்5விநாடிகள் மட்டுமே உள்ள ஒலியைக் கொண்டு ஒப்பிடு.9திறந்த மூல குரல் ஒப்பிடு மாதிரிகள், அதில் சாட்டர்பாக்ஸ், கோசிவாயஸ்2, ஜிபிடி-சோவிட்ஸ், மற்றும் ஓபன்வாயஸ் உள்ளன. பயிற்சி தேவையில்லாத சுழல்-சூட் ஒப்பிடு — ஒரு மாதிரியை ஏற்றி உடனடியாக உரையை உருவாக்கவும். அனைத்து மாதிரிகளும் வர்த்தக ரீதியாக அனுமதிக்கப்பட்டவை.

உண்மையான நேரம் 5- நொடி மாதிரிகள் 9 மாதிரிகளைக் குளோனிங் செய் திறந்த மூலங்கள் 17+ மொழிகள் உணர்வு கட்டுப்பாடு

உண்மையான நேர குரல் ஒத்தமைப்பு வசதிகள்

தற்காலிகமாக குரல்களை குளோன் செய்க state-of-the-art AI - பயிற்சி இல்லை, தரவுத்தளங்கள் இல்லை, காத்திருக்க வேண்டாம்

சுழல்- சுட்டுக் குறுக்கீடு

பயிற்சி இல்லை, நுட்பமான திருத்தங்கள் இல்லை, தரவுத்தொகுப்பு இல்லை.5விநாடிகள் ஒலியை பதிவேற்றவும் உடனடியாக ஒரு மாதிரி குரலை பெறவும். AI உண்மையான நேரத்தில் ஒலியாளர் குணங்களை எடுத்துக் கொள்கிறது.

9 மாதிரிகளைக் குளோனிங் செய்

Chatterbox, CosyVoice2, GPT-SoVITS, OpenVoice, Spark, IndexTTS-2, GLM-TTS, Qwen3-TTS, மற்றும் Tortoise ஆகியவற்றில் இருந்து தேர்வு செய்யவும். ஒவ்வொரு மாதிரியும் தரம், வேகம் மற்றும் மொழிக்கு வேறுபட்ட பலம் கொண்டது.

மொழியியல் ஒத்திசைவு

ஆங்கிலத்தில் ஒரு குரலைக் குளோன் செய்து சீன, ஜப்பானிய, கொரிய மற்றும் பல மொழிகளில் பேசவும். காசிவாயஸ்2மற்றும் க்வென்3-டிடிஎஸ் 17+ மொழிகளில் குரல் அடையாளத்தைப் பாதுகாக்கின்றன.

உணர்வு கட்டுப்பாடு

Chatterbox, OpenVoice, மற்றும் GLM-TTS உணர்வு-நிலைப்படுத்தப்பட்ட உருவாக்கத்திற்கு ஆதரவு. வெவ்வேறு உணர்வுகளுடன் ஒரே உரை உருவாக்கவும் - மகிழ்ச்சி, துக்கம், கோபம், குரல் - ஒத்த குரலை வைத்திருக்கவும்.

திறந்த மூல & வணிக

ஒவ்வொரு மாதிரியும் MIT அல்லது Apache 2.0உரிமத்தின் கீழ் திறந்த மூலமாக உள்ளது. உள்ளடக்கங்கள், பொருட்கள் மற்றும் பயன்பாடுகளுக்கு வணிக ரீதியாக மாதிரியான குரல்களை பயன்படுத்தவும்.

API யைக் குளோனிங் செய்

நிரல் குரல் ஒத்தமைப்பிற்கு REST API. குறிப்பு ஒலியை ஏற்றவும், உரை குறிப்பிடவும், ஒத்த குரலை பெறவும். பைத்தான் மற்றும் ஜாவாஸ்கிரிப்ட் SDKகள். அதிக அளவு பணிப் பாய்வுகளுக்கு தொகுப்பு ஒத்தமைப்பு.

குரல் ஒத்த மாதிரிகள்

ஒவ்வொரு மாதிரியீட்டு பயன்பாட்டு வழக்குகளுக்கான9திறந்த மூல மாதிரிகள்

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 குரல் படிமம்Name

சிறந்த: சிறந்த மொத்த தரம் -5விநாடி மாதிரிகள், உணர்வு கட்டுப்பாடு, MIT அனுமதி

முயற்சி Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 குரல் படிமம்Name

சிறந்த: சிறந்த பல மொழிக் குறியீடு — சீன, ஆங்கில, ஜப்பானிய, கொரிய மொழிகளில் குரலைப் பாதுகாக்கிறது

முயற்சி CosyVoice 2

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 குரல் படிமம்Name

சிறந்த: உணர்வு மற்றும் பாணி மாற்றத்துடன் வேகமான நிற மாற்றம்

முயற்சி OpenVoice

Spark TTSSpark TTS

Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Medium 4/5 குரல் படிமம்Name

சிறந்த: வேகமான மாதிரியை உருவாக்குதல் — ~12 விநாடிகளில் முடிவுகள்

முயற்சி Spark TTS

IndexTTS-2IndexTTS-2

Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Medium 4/5 குரல் படிமம்Name

சிறந்த: சிறந்த சீன- ஆங்கில ஒற்றுமை கொண்ட ஒற்றைப்படுத்தல்Name

முயற்சி IndexTTS-2

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 குரல் படிமம்Name

சிறந்த: ஸ்டுடியோ தரமான முடிவுகள் - ஒலிப்புத்தகங்களுக்கும் சிறந்த உரையாடலுக்கும் சிறந்தது

முயற்சி Tortoise TTS

உண்மையான நேர குரல் ஒப்புமை எப்படி வேலை செய்கிறது

ஒரு குறுகிய ஒலி மாதிரியிலிருந்து வரையறுக்கப்படாத மாதிரிப்படுத்தப்பட்ட பேச்சிற்கு

1

குறிப்பு ஒலியை ஏற்றுக

நீங்கள் ஒத்தெடுக்க விரும்பும் குரலிலிருந்து 5-30 விநாடிகள் தெளிவான உரையை பதிவு செய்யவும் அல்லது பதிவேற்றவும். WAV, MP3, அல்லது உங்கள் உலாவியில் நேரடியாக பதிவு செய்யவும்.

2

ஒரு மாதிரியை தேர்ந்தெடு

உங்கள் தேவைகளுக்கு ஏற்ற மாதிரியை தேர்ந்தெடுக்கவும் - தரத்திற்கான சாட்டர்பாக்ஸ், வேகத்திற்கான ஸ்பார்க், பல மொழிகளுக்கான கோசிவாயஸ்2.

3

உங்களின் உரையை உள்ளிடு

நீங்கள் விரும்பும் உரையை உரையாடப்பட்ட குரலில் உள்ளிடவும் அல்லது ஒட்டவும். மாதிரி ஆதரிக்கும் எந்த மொழியும் வேலை செய்கிறது.

4

உருவாக்கு & பதிவிறக்கு

10-25 விநாடிகளில் உங்கள் ஒத்த குரலை கேட்க உருவாக்க க்ளிக் செய்யவும். WAV அல்லது MP3 ஆக பதிவிறக்கவும் உடனடி பயன்பாட்டிற்கு.

Zero-Shot குரல் ஒப்புமை எப்படி வேலை செய்கிறது

சிறிய- சீர்திருத்தங்கள் இல்லை, தரவுத்தொகுப்பு இல்லை - ஏற்றவும், மாதிரியிடவும்

ஒலிப்பேழை உட்பொதித்தல்

AI உங்கள் குறிப்பு ஒலியை ஒரு ஒலிப்பேச்சு உட்பொதிவை வெளியேற்ற ஆய்வு செய்கிறது - ஒலியின் தனித்துவமான குணாதிசயங்கள், டைம்பர், பேசும் ரிதம் மற்றும் குரல் நுட்பம் உள்ளிட்ட ஒரு நெருக்கமான கணிதக் காட்சி. இது 1 விநாடிக்கு கீழே நடக்கிறது.

  • 5 விநாடிகள் ஒலியுடன் மட்டுமே வேலை செய்கிறது
  • பிட், டிம்பர் மற்றும் பேசும் பாணியை பதிவு செய்கிறது
  • பயிற்சி அல்லது சிறிய- சீர்திருத்தங்கள் தேவையில்லை
  • ஒலி எப்போதும் நிரந்தரமாக சேமிக்கப்படாது

நிலையான பேச்சு சேர்த்தல்Name

TTS மாதிரி புதிய உரையை உருவாக்குகிறது. அதன் விளைவு உங்கள் உரையை கூறும் குறிப்பு உரையாசிரியரைப் போலவே இருக்கும் - இயற்கையான குரல், சரியான உறுதிப்படுத்தல் மற்றும் எந்த மொழி அல்லது உள்ளடக்கத்திலும் பாதுகாக்கப்பட்டுள்ள மூல குரல்.

  • ஒற்றை மாதிரியிலிருந்து வரம்பு இல்லாத உரையை உருவாக்கு
  • மொழிக்குறிப்புகளை ஒத்த மொழிகள் (குறிப்பு செய்யாத மொழிகளில் பேசு)
  • உணர்வு மற்றும் பாணி மாற்றம்
  • 10- 25 விநாடிகளில் முடிவுகள்

குரல் ஒத்த மாதிரி ஒப்பீடு

உங்கள் மாதிரியை பயன்படுத்துவதற்கு சரியான மாதிரியை தேர்ந்தெடுக்கவும்

மாதிரி குறைந்தபட்ச குறிப்பு வேகம் தரம் மொழிகள் உணர்வு உரிமம்
Chatterbox 5s ~21s சிறந்த EN MIT
CosyVoice 2 5s ~20s சிறந்த CN, EN, JP, KO+ Apache 2.0
GPT-SoVITS 5s ~16s சிறந்த சீனா, இங்கிலாந்து, ஜப்பான், கொரியா MIT
OpenVoice 5s ~15s நல்ல EN, CN, ES, FR+ MIT
Spark TTS 5s ~12s நல்ல சிஎன், என் Apache 2.0
IndexTTS-2 5s ~18s சிறந்த சிஎன், என் Apache 2.0
GLM-TTS 5s ~25s சிறந்த சிஎன், என் Apache 2.0
Qwen3-TTS 5s ~16s சிறந்த CN, EN, JP, KO+ Apache 2.0
Tortoise 15s ~60s ஸ்டூடியோ EN Apache 2.0

மக்கள் உண்மையான நேர குரல் மாதிரியை எதற்காக பயன்படுத்துகிறார்கள்

உள்ளடக்க உருவாக்கம் முதல் அணுகல் வரை - குரல் ஒப்புமைக்கு முடிவில்லாத பயன்பாடுகள் உள்ளன

ஒலிப்புத்தக உரையாடல்

எழுத்தாளர்கள் தங்கள் சொந்த குரலைக் குளோன் செய்து முழுமையான ஒலிப்புத்தகங்களை உருவாக்குகிறார்கள். பதிவு செய்யும் அறையில் மணிநேரம் செலவிடாமல். மீண்டும் பதிவு செய்யாமல் ஒற்றை வாக்கியங்களை மீண்டும் உருவாக்குவதன் மூலம் பிழைகளை திருத்துங்கள்.

வீடியோ ஒலி மாற்றம்

மற்ற மொழிகளில் வீடியோக்களை ஒலிக்கச் செய்கிறது. பேசுபவரின் உண்மையான குரலைக் காப்பாற்றுகிறது. கோசிவாயஸ்2மற்றும் க்வென்3-டிடிஎஸ் போன்ற மொழிகள் குரல் அடையாளத்தை சீன, ஆங்கிலம், ஜப்பானியம் மற்றும் கொரிய மொழிகளில் காப்பாற்றுகின்றன.

உள்ளடக்க உருவாக்கம்

யூடியூபர், போட்காஸ்டர், மற்றும் டிக்கோக் உருவாக்குநர்கள் தங்கள் குரலை ஒரே மாதிரியான பிராண்டிங்க்காக மாதிரிப்படுத்துகின்றனர். பதிவு செய்யாமல் புதிய உள்ளடக்கத்திற்கான குரல்களை உருவாக்கவும், அல்லது ஏற்கனவே உள்ள வீடியோக்களின் மாற்று மொழி பதிப்புகளை உருவாக்கவும்.

அணுகக்கூடிய

நோய் அல்லது அறுவை சிகிச்சை காரணமாக தங்கள் குரலை இழந்தவர்கள் பழைய பதிவுகளைக் கொண்டு ஒத்த குரலை உருவாக்கி அதைப் பாதுகாக்க முடியும். ஒத்த குரல் உரை- இருந்து- பேச்சாக மாற்றுவதன் மூலம் தங்கள் குரலில் தொடர்பு கொள்ள அனுமதிக்கிறது.

விளையாட்டு உருவாக்கம்

குரல் நடிகர்களைக் குளோன் செய்து, ஸ்டூடியோ நேரத்தை திட்டமிடாமல், வரம்பு இல்லாத உரையாடல் மாறுபாடுகளை உருவாக்கவும். ஒவ்வொரு வரியும் மீண்டும் பதிவு செய்ய இயலாத இண்டி விளையாட்டுகள், மோடுகள் மற்றும் மாதிரிகளை உருவாக்கவும் இது மிகவும் பொருத்தமானது.

தொலைபேசி அமைப்புகள்

தொலைபேசி பட்டியல்களுக்கும் தானாகவே பதில்களுக்கும் உங்கள் நிறுவனத்தின் பேச்சாளர் குரலைக் குரோல் செய்யவும். ஒரு குரல் நடிகரை முன்பதிவு செய்யாமல் IVR வினவலை உடனடியாக புதுப்பிக்கவும் - புதிய உரையை டைப் செய்து உருவாக்கவும்.

TTS.ai vs மற்ற குரல் ஒத்த தீர்வுகள்

ஏன்9மாடல்கள் ஒரே ஒரு திறந்த மூல திட்டத்தை வென்றது

& பண்புக்கூறுகள் TTS.ai SV2TTS ElevenLabs Resemble AI
மாதிரிகளைக் குளோனிங் செய் 9 1 1 1
குறைந்தபட்சம். குறிப்பு ஒலி 5 sec 5 sec 30 sec 3 min
பயிற்சி தேவை இல்லை இல்லை இல்லை ஆம்
ஒலி தரம் (2025) ஸ்டுடியோ தரம் தேதி சிறந்த சிறந்த
உணர்வு கட்டுப்பாடு
மொழியியல் ஒத்திசைவு
திறந்த மூலங்கள்
GPU தேவை மேகம் ஆம் மேகம் மேகம்
API அணுகல்
இலவச நிலை 15,000 எழுத்துக்கள் தன்-தலைப்பு தடைசெய்யப்பட்ட

குரல் ஒத்த API

எங்கள் REST API ஐப் பயன்படுத்தி நிரல்முறையாக குரல்களைக் குளோன் செய்க

பைத்தான் - குரல் ஒத்தமைப்பு REST API
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")

# Clone a voice from a 5-second sample
result = client.clone_voice(
    name="My Cloned Voice",
    file="reference.wav",       # 5-30 seconds of clear speech
    model="chatterbox",         # or cosyvoice2, openvoice, spark...
    text="Hello! This is my cloned voice speaking new text.",
)

# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
    f.write(audio)
cURL — குரல் ஒத்திசைவு REST API
curl -X POST https://api.tts.ai/v1/voice-clone \
  -H "Authorization: Bearer sk-tts-YOUR_KEY" \
  -F "reference=@voice_sample.wav" \
  -F "text=This is my cloned voice." \
  -F "model=chatterbox"

சிறந்த குரல் ஒத்தமைப்பு முடிவுகளுக்கு உதவிகள்

இந்த பதிவு வழிகாட்டுதல்களுடன் மிகவும் சரியான குரல் மாதிரியைப் பெறுக

அமைதியான சூழல்

அமைதியான அறையில் குறைந்த பின்னணி இரைச்சலுடன் பதிவு செய்யவும். AI சுத்தமான ஒலியிலிருந்து குரல் அம்சங்களை சரியாக பிரிக்கிறது.

10- 30 நொடிகள்

5 விநாடிகள் வேலை செய்யும் போது, 10- 30 விநாடிகள் மிகவும் நல்ல முடிவுகளைத் தருகிறது. AI எவ்வளவு இயற்கையான உரையைக் கேட்கிறது, அவ்வளவு சரியாகக் குளோன் செய்யப்படுகிறது.

இயற்கை உரையாடல்

இயல்பாக பேசு, ஒரே மாதிரியாக அல்ல. மாறுபட்ட உச்சரிப்பு மற்றும் வேகத்தை சேர்க்கவும். AI உங்கள் இயல்பான பேசும் பாணியை, இடைவெளிகள் மற்றும் வலியுறுத்தல் உள்ளிட்டவைகளைக் கைப்பற்றுகிறது.

ஒற்றை ஒலிபெருக்கி

ஒருவர் பேசும் மாதிரியை மட்டுமே பயன்படுத்தவும். பல குரல்கள் ஒலிப்பதிவை குழப்பமாக மாற்றி கலந்த முடிவுகளை உருவாக்கும்.

இன்று ஒத்த குரல்களைத் தொடங்கு

5 விநாடிகள் ஒலியை ஏற்றவும் மற்றும் உங்கள் மாதிரி குரலை 30 விநாடிகளில் கேட்கவும். முயற்சி செய்ய இலவசம்.

குரலை இப்போது படியெடு API ஆவணமாக்கல்

அடிக்கடி கேட்கப்படும் கேள்விகள்

உண்மையான நேர குரல் படிமமாக்கல் பற்றிய பொதுவான கேள்விகள்

உண்மையான நேர குரல் ஒத்தமைப்பு என்பது ஒரு மனிதனின் குரலை ஒரு குறுகிய ஒலி மாதிரியிலிருந்து -5விநாடிகள் - எந்த பயிற்சியோ அல்லது நுணுக்கமான ஒழுங்கமைப்போ இல்லாமல் ஒத்தமைக்கக்கூடிய AI தொழில்நுட்பம். நீங்கள் ஒரு மாதிரியை பதிவேற்ற, AI அந்த மனிதனைப் போலவே ஒலிக்கும் புதிய உரையை உருவாக்குகிறது. TTS.ai9வேறுபட்ட குரல் ஒத்தமைப்பு மாதிரிகளை வழங்குகிறது, ஒவ்வொருவற்றுக்கும் தரம், வேகம் மற்றும் மொழி ஆதரவுக்கான வேறுபட்ட பலம் உள்ளது.

பெரும்பாலான மாதிரிகளுடனான5விநாடிகள் மட்டுமே வேலை செய்கிறது (ச்சட்டர்பாக்ஸ், கோசிவாயஸ்2, ஸ்பார்க், ஜிபிடி-சோவிட்ஸ், ஓபன்வாயஸ்). சிறந்த முடிவுகளுக்கு 15+ விநாடிகள் தேவை. அனைத்து மாதிரிகளுடனான சிறந்த தரத்திற்காக, 10-30 விநாடிகள் தெளிவான ஒற்றை ஒலியெழுப்பி ஒலி பரிந்துரைக்கப்படுகிறது. ஒலி பின்னணி இரைச்சல் மற்றும் இசை இல்லாமல் இருக்க வேண்டும்.

குரல் ஒத்தமைப்பு தொழில்நுட்பம் சட்டப்படி உள்ளது. எனினும், நீங்கள் பயன்படுத்த அனுமதி பெற்ற குரல்களை மட்டுமே ஒத்தமைக்க வேண்டும் - உங்கள் சொந்த குரல், உங்களுக்கு தெளிவான அனுமதி உள்ள குரல்கள், அல்லது பொது இடத்தில் உள்ள குரல்கள். அனுமதி இல்லாமல் யாரையாவது மயக்க, மோசடி செய்வது, அல்லது தவறான உள்ளடக்கத்தை உருவாக்க குரல் ஒத்தமைப்பை பயன்படுத்துவது பெரும்பாலான நீதிமன்றங்களில் சட்டவிரோதமாகும். TTS.ai இன் விதிமுறைகள் நீங்கள் ஒத்தமைக்கும் எந்த குரலுக்கும் உரிமைகள் இருக்க வேண்டும் என்று கூறுகின்றன.

இது உங்கள் பயன்பாட்டை பொறுத்து இருக்கும். சாட்டர்பாக்ஸ் உணர்வு கட்டுப்பாட்டுடன் உயர்ந்த தரமான ஆங்கில மாதிரிகளை உருவாக்குகிறது. காசிவாயஸ்2பல மொழி மாதிரிகளுக்கு சிறந்தது (சீன, ஆங்கில, ஜப்பானிய, கொரிய). ஸ்பார்க் ~12 விநாடிகளில் மிகவும் வேகமாக உள்ளது. டார்டாய்ஸ் ஸ்டுடியோ தரமான முடிவுகளை உருவாக்குகிறது ஆனால் மெதுவாக உள்ளது. ஜிபிடி- சோவிட்ஸ் சீன குரல் மாதிரிகளில் சிறந்தது. உங்கள் குரலுக்கு சிறந்த பொருத்தத்தைக் கண்டுபிடிக்க பல மாதிரிகளை முயற்சிக்கவும்.

ஆம் - இது மொழிகள் பெயர்ந்த குரல் ஒத்திசைவு எனப்படும். காசிவாயஸ்2, க்வென்3- TTS, மற்றும் ஓபன்வாயஸ் இதை ஆதரிக்கின்றன. உதாரணமாக, நீங்கள் ஒரு ஆங்கில குரல் மாதிரியை ஏற்றலாம் மற்றும் சீன, ஜப்பானிய அல்லது கொரிய மொழிகளில் பேசுவதன் மூலம் பேசுபவரின் குரல் குணங்களை பாதுகாக்கலாம். தரம் மாதிரி மற்றும் மொழி ஜோடிகளுக்கு ஏற்ப மாறுபடுகிறது.

CorentinJ/Real-Time-Voice-Cloning GitHub திட்டம் (60K+ நட்சத்திரங்கள்) SV2TTS, ஒரு 2019 கட்டமைப்பை பயன்படுத்துகிறது. அதே நேரத்தில், Chatterbox, CosyVoice2மற்றும் GPT-SoVITS போன்ற நவீன மாதிரிகள் சிறந்த ஒலி தரத்துடன் சிறந்த ஒலிப்பேச்சாளர் ஒற்றுமையை உருவாக்குகின்றன. TTS.ai9அமைதி-ஆன்-தி-ஆர்ட் மாதிரிகளை இயக்குகிறது (VS SV2TTS's one) மற்றும் GPU அமைப்பு தேவையில்லை - ஏற்றவும் மற்றும் மாதிரியாகவும்.

ஆம். TTS.ai குரல் ஒத்தமைப்பிற்கு ஒரு REST API யை வழங்குகிறது. குறிப்பு ஒலி மற்றும் உரைகளை ஏற்றவும், மாதிரியை தேர்ந்தெடுக்கவும், ஒத்தப்படுத்தப்பட்ட உரையை பெறவும். பைத்தான் SDK (`pip install ttsai`), ஜாவாஸ்கிரிப்ட் SDK (`npm install @ttsainpm/ttsai`), அல்லது நேரடி HTTP கோரிக்கைகள் மூலம் கிடைக்கும். ஒரே மாதிரியான குரலுடன் பல உரைகளை செயலாக்க தொகுப்பு ஒத்தமைப்பிற்கு ஆதரவு.

ஆம். படியெடுத்த பிறகு, உங்கள் கணக்கில் குரலை சேமித்து, குறிப்பு ஒலியை மீண்டும் பதிவிறக்காமல், அவற்றை எண்ணற்ற தலைமுறைகளுக்கு மீண்டும் பயன்படுத்தலாம். சேமிக்கப்பட்ட குரல்கள் உங்கள் குரல் நூலகத்தில் குரல் படியெடுப்பு பக்கத்தில் தோன்றும் மற்றும் API மூலம் அணுகலாம்.

WAV, MP3, OGG, FLAC, மற்றும் WebM ஆகியவை அனைத்தும் ஆதரிக்கப்படுகின்றன. நீங்கள் உள்நுழைந்த மைக்ரோபோன் பதிவிறக்கத்தை பயன்படுத்தி உங்கள் உலாவியில் நேரடியாக பதிவு செய்யலாம். சிறந்த முடிவுகளுக்கு, 16kHz அல்லது அதற்கு மேல் இழப்பில்லாத WAV வடிவத்தை பயன்படுத்தவும். AI தானாகவே உள்ளீட்டு வடிவம் எதுவாக இருந்தாலும் ஒலியை முன்செய்கிறது (மறு மாதிரியீடு, இரைச்சல் வடிகட்டி).

உருவாக்கும் நேரம் மாதிரிக்கு ஏற்ப மாறுபடும்: ஸ்பார்க் ~12 விநாடிகளில் மிகவும் வேகமாக, ஓபன்வாயஸ் ~15 விநாடிகளில், ஜிபிடி-சோவிட்ஸ் ~16 விநாடிகளில், கோசிவாயஸ்2~20 விநாடிகளில், சாட்டர்பாக்ஸ் ~21 விநாடிகளில், மற்றும் டார்டாய்ஸ் ~60 விநாடிகளில். இந்த நேரங்கள் வழக்கமான வாக்கிய நீள உரைகளுக்கு. நீண்ட உரைகளுக்கு அளவுக்கு அதிகமாக நேரம் எடுக்கும்.

ஆம். TTS.aiல் உள்ள அனைத்து9நகலாக்க மாதிரிகளும் திறந்த மூல உரிமங்களைப் பயன்படுத்துகின்றன (MIT அல்லது அபாச்சி 2.0) இது வர்த்தக பயன்பாட்டிற்கு அனுமதிக்கிறது. நீங்கள் நகலெடுக்கப்பட்ட ஒலியை யூடியூப் வீடியோக்களில், பட்காட்களில், ஒலி புத்தகங்களில், பயன்பாடுகளில், விளையாட்டுகளில், தொலைபேசி அமைப்புகளில் மற்றும் வேறு எந்த வர்த்தக பயன்பாட்டிலும் பயன்படுத்தலாம் - உங்களுக்கு மூல குரலுக்கு உரிமைகள் இருந்தால் மட்டுமே.

ஆம். நாம் இயக்கும் ஒவ்வொரு மாதிரியும் திறந்த மூலமாகும் மற்றும் GitHub/HuggingFace இல் கிடைக்கும். நீங்கள் உங்கள் GPU சேவையகத்தில் Chatterbox, CosyVoice2, GPT-SoVITS, OpenVoice, Spark, IndexTTS-2, GLM-TTS, Qwen3-TTS, அல்லது Tortoise ஐ தனியாக நிர்வகிக்கலாம். பெரும்பாலான மாதிரிகளுக்கு 4-24GB VRAM உடன் NVIDIA GPU தேவைப்படுகிறது. TTS.ai அனைத்து கட்டமைப்புகளையும் கையாளுகிறது, எனவே நீங்கள் செய்ய வேண்டியதில்லை.
5.0/5 (1)

நாம் என்ன மேம்படுத்த முடியும்? உங்கள் கருத்துகள் பிரச்சினைகளை சரிசெய்ய உதவுகிறது.

நொடிகளில் எந்த குரலையும் படியெடு

9 திறந்த மூல குரல் ஒத்த மாதிரிகள்.5விநாடி மாதிரிகள். பயிற்சி தேவையில்லை. இலவசமாக முயற்சிக்கவும் - உங்கள் ஒலியை பதிவேற்றவும் உடனடியாக ஒத்த மாதிரியை கேட்கவும்.