திறந்த மூல உரை-இன்-பேச்சு மாதிரிகள்

எங்கள் தளத்தில் உள்ள ஒவ்வொரு TTS மாதிரியும் வர்த்தக ரீதியான அனுமதிகளுடன் திறந்த மூலமாகும். MIT, Apache 2.0 - எந்த சொந்த உரிமை குறிக்கோளும் இல்லை, பயன்பாட்டு கட்டுப்பாடுகள் இல்லை, அனுமதி கட்டணம் இல்லை. அவற்றை எங்கள் ஹோஸ்டிங் API மூலம் பயன்படுத்தவும், அல்லது முழு கட்டுப்பாட்டுடன் உங்கள் சொந்த கட்டமைப்பில் அவற்றை தாங்களே ஹோஸ்டிங் செய்யவும்.

திறந்த மூலங்கள் MIT உரிமம் அப்பாச்சி 2.0 தன்னியக்கமாக நிறுவக்கூடிய கிட்ஹப்

இப்போது முயற்சிக்கவும்

கோகோரோ, பைப்ரர், VITS, MeloTTS உடன் இலவசமாகName
உங்கள் உருவாக்கப்பட்ட ஒலி இங்கே தோன்றும்
உருவாக்கப்பட்டது
பதிவிறக்கங்கள்
TTS.ai ஐ நேசிக்கிறீர்களா? உங்கள் நண்பர்களுக்குச் சொல்லுங்கள்!

திறந்த மூல TTS நன்மைகள்

ஏன் திறந்த மூல மாதிரிகள் உங்கள் திட்டங்களுக்கு முக்கியமானவை

அனைத்தும் திறந்த மூல உரிமம்

TTS.ai ல் உள்ள ஒவ்வொரு மாதிரியும் அனுமதிக்கப்பட்ட திறந்த மூல உரிமத்தைப் பயன்படுத்துகிறது. தனியுரிமை கொண்ட கருப்பு பெட்டிகள் இல்லை, விற்பனையாளரின் திறப்பு இல்லை, எதிர்பாராத உரிம கட்டணங்கள் இல்லை.

அப்பாச்சி

மாதிரிகள் MIT அல்லது அப்பாச்சி 2.0, மிகவும் அனுமதிக்கக்கூடிய திறந்த மூல உரிமங்கள் கீழ் உரிமம் பெற்றுள்ளன. வணிக ரீதியாக பயன்படுத்தவும், மாற்றவும், மீண்டும் பகிரவும் - எந்த கட்டுப்பாடுகளும் இல்லை.

தன்னியக்கமாக நிறுவக்கூடிய

எந்த மாதிரியை பதிவிறக்கம் செய்து உங்கள் வன்பொருளில் இயக்கவும். உங்கள் தரவு, தாமதம் மற்றும் கட்டமைப்பு மீது முழு கட்டுப்பாட்டை பெறவும். மேகத்தின் மீது எந்த நம்பிக்கையும் தேவையில்லை.

GPU சிறந்த

CUDA ஆதரவுடன் NVIDIA GPUs க்கு மாதிரிகள் சிறந்தவை. Piper CPU யில் மட்டுமே இயங்குகிறது. பெரும்பாலான மாதிரிகளுக்கு 2-8GB VRAM தேவைப்படுகிறது.

சமூக மேம்படுத்தல்

இந்த மாதிரிகளை செயல்படும் திறந்த மூல சமூகங்கள் பராமரித்து மேம்படுத்துகின்றன. பங்களிப்புகள் வரவேற்கப்படுகின்றன - பிழைகளை, மேம்பாடுகளை, மற்றும் புதிய குரல்களை கிட்ஹப்-ல் சமர்பிக்கவும்.

வணிக பயன்பாடு சரி

அனைத்து மாதிரிகளும் தங்களது உரிமங்களின் கீழ் வர்த்தக பயன்பாட்டை அனுமதிக்கின்றன. உற்பத்திகளை உருவாக்கவும், சேவைகளை விற்கவும், வர்த்தக உள்ளடக்கங்களை உருவாக்கவும் ரோயலிட்டி அல்லது பயன்பாட்டு கட்டணங்கள் இல்லாமல்.

எங்கள் திறந்த மூல மாதிரி பட்டியல்

ஒவ்வொரு மாதிரி, அதன் உரிமம், மற்றும் அது சிறந்த என்ன

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

சிறந்த: அப்பாச்சி 2. 0- சிறந்த தரமான இலவச மாதிரி, 82 மில்லியன் அளவுருக்கள், எளிதாகத் தானே நிர்வகிக்கலாம்

முயற்சி Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

சிறந்த: MIT — CPU- only, முனை சாதனங்களுக்கும் உட்பொதிந்த தன்- வசதிக்கும் பொருத்தமானது

முயற்சி Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

சிறந்த: MIT — பல கீழ்நோக்கி மாதிரிகள் பயன்படுத்தும் அடிப்படை கட்டமைப்பு

முயற்சி VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

சிறந்த: MIT — தரமான TTS க்கு அப்பால் தனித்துவமான ஒலி உருவாக்க திறன்கள்

முயற்சி Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 குரல் படிமம்Name

சிறந்த: அப்பாச்சி 2.0- அதிகபட்ச தரம், விரிவாக ஆராய்ந்த குறிப்பு செயல்படுத்தல்

முயற்சி Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 குரல் படிமம்Name

சிறந்த: MIT — திறந்த மூல குரல் ஒத்தமைப்பு, கிரானலர் பாணி கட்டுப்பாடு

முயற்சி OpenVoice

திறந்த மூல TTS யை எப்படிப் பயன்படுத்துவது

எங்கள் விருந்தினர் API ஐப் பயன்படுத்தவும் அல்லது நீங்கள் தாங்களே மாதிரிகளை இயக்கவும்

1

திறந்த மூல மாதிரிகளை ஆராயவும்

20+ திறந்த மூல TTS மாதிரிகளின் எங்கள் பட்டியலை உலாவவும். ஒவ்வொரு மாதிரி பக்கமும் அனுமதி, கட்டமைப்பு, திறன்கள் மற்றும் தனித்தனியே சேமிக்கும் தேவைகளைக் காட்டுகிறது.

2

உங்களின் உலாவியில் முயற்சிக்கவும்

எந்த மாதிரியை நேரடியாக TTS.ai ல் ஏதும் நிறுவாமல் சோதிக்கவும். எங்கள் GPU சேவையகங்கள் செயலாக்கத்தை கையாளுகின்றன, எனவே நீங்கள் தன்னை-தொடர்பதற்கு முன் தரத்தை மதிப்பீடு செய்யலாம்.

3

தானே-அமை அல்லது எங்கள் API யைப் பயன்படுத்து

கிட்ஹப்-லிருந்து மாதிரி ரிசப்ஷன்களைக் குளோன் செய்து உள்ளே இயக்கவும், அல்லது உற்பத்திக்காக எங்கள் ஹோஸ்டிங் API ஐப் பயன்படுத்தவும். தானே ஹோஸ்டிங் முழு கட்டுப்பாட்டை அளிக்கிறது; எங்கள் API நிர்வகிக்கப்பட்ட கட்டமைப்பை வழங்குகிறது.

4

உங்கள் பயன்பாட்டை உருவாக்கவும்

TTS ஐ உங்கள் தயாரிப்புக்குள் ஒருங்கிணைக்க, தனியாக சேமிக்கப்பட்ட மாதிரிகளை அல்லது எங்கள் REST API ஐ பயன்படுத்தவும். அனைத்து மாதிரிகளும் அனுமதி கட்டணம் அல்லது ரோயல்ட்டி இல்லாமல் வர்த்தக ரீதியாக பயன்படுத்தக்கூடியவை.

உரிமம் ஒப்பீடு

TTS.ai ல் உள்ள அனைத்து மாதிரிகளும் வணிக ரீதியாக நட்பு திறந்த மூல உரிமங்களைப் பயன்படுத்துகின்றன

மாதிரி உரிமம் வணிக பயன்பாடு மாற்றம் தன்-தலைப்பு பங்கு
Kokoro Apache 2.0 தேவையான
Piper MIT விருப்பத்தேர்வு
VITS MIT விருப்பத்தேர்வு
MeloTTS MIT விருப்பத்தேர்வு
Chatterbox MIT விருப்பத்தேர்வு
Tortoise TTS Apache 2.0 தேவையான
StyleTTS 2 MIT விருப்பத்தேர்வு
OpenVoice MIT விருப்பத்தேர்வு
Sesame CSM Apache 2.0 தேவையான
Orpheus Llama 3.2 "Built with Llama"

தனித்தனியே சேமித்தல் vs சேமிக்கப்பட்ட API

மாதிரிகளை நீங்களே இயக்கவும் அல்லது உள்கட்டமைப்பை நாங்கள் கவனிக்கலாம்

உங்கள் வன்பொருளில் தானே- புரவலன்

TTS.ai ல் உள்ள ஒவ்வொரு மாதிரியும் GitHub அல்லது Hugging Face இல் திறந்த மூல திட்டமாக கிடைக்கும். எடைகளை பதிவிறக்கவும், சார்புகளை நிறுவவும், உங்கள் GPU களில் கண்டுபிடிப்புகளை இயக்கவும். நீங்கள் முழுமையான கட்டுப்பாட்டை இடைவெளி, தனியுரிமை மற்றும் அளவீடு மீது வைத்திருக்கலாம்.

  • முழுமையான தரவு தனியுரிமை - ஒலி உங்கள் சேவையகத்தை விட்டு வெளியேறாது
  • ஆரம்ப அமைப்பிற்குப் பிறகு கோரிக்கை வாரியாக செலவு இல்லை
  • உங்கள் தகவலில் தனிப்பயன் சிறிய- சீர்திருத்தங்கள்
  • GPU வன்பொருள் தேவைப்படுகிறது (என்விடியா பரிந்துரைக்கப்படுகிறது)
  • நீங்கள் புதுப்பிப்புகள், அளவீடுகள் மற்றும் சார்புகளை நிர்வகிக்கலாம்

TTS.ai ஐ நிறுவப்பட்ட API யை பயன்படுத்து

ஒரே REST API மூலம் அனைத்து 20+ மாதிரிகளுக்கும் உடனடி அணுகலைப் பெறுங்கள். GPU வழங்குதல், மாதிரி புதுப்பிப்புகள், வரிசை மேலாண்மை மற்றும் அளவீடு ஆகியவற்றை நாங்கள் கையாளுகிறோம். ஒரே API விசை ஒவ்வொரு மாதிரிக்கும் அணுகலை வழங்குகிறது - தனித்தனியாக நிறுவுதல்களை மேலாண்மை செய்ய தேவையில்லை.

  • GPU வன்பொருள் தேவையில்லை
  • ஒரு API மூலம் அனைத்து 20+ மாதிரிகள்
  • தானாகவே மாதிரி புதுப்பிப்புகள் மற்றும் மேம்பாடுகள்
  • 99.9% செயல்திறன்
  • நீங்கள் பயன்படுத்துவதிற்கு மட்டுமே செலுத்தவும்

விரைவு துவக்கம்: API அல்லது தனி- புரவலன்

எங்கள் விருந்தினர் API ஐப் பயன்படுத்தவும் அல்லது கோகோரோவை நிமிடங்களில் உள்ளமைவாக நிறுவவும்

விருப்பம் 1: TTS.ai புரவலன் API எளிதான
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
விருப்பம் 2: pip உடன் தனி- கணினி முழு கட்டுப்பாடு
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

திறந்த மூலங்கள், குறைந்த விலை

எங்கள் ஹோஸ்டிங் API திறந்த மூல TTS ஐ GPU களை நிர்வகிக்காமல் அணுகக்கூடியதாக ஆக்குகிறது.

இலவச நிலை

$0

பதிவு செய்தல்

  • 4 திறந்த மூல மாதிரிகள் இலவசமாக
  • அடிப்படை பயன்பாட்டிற்கு பதிவு இல்லை
  • வணிகப் பயன்பாடு அனுமதிக்கப்பட்டுள்ளது

துவக்குதல்

$9

500,000 எழுத்துக்கள்/மாதத்தில்

  • அனைத்து 20+ திறந்த மூல மாதிரிகள்
  • குரல் ஒப்புமை
  • API அணுகல்

புரொ

$29

2,000,000 எழுத்துக்கள்/மாதத்தில்

  • முன்னுரிமை GPU செயலாக்கம்
  • அனைத்து பிரீமியம் மாதிரிகள்
  • நிறுவன ஆதரவு
முழு விலையை பார்க்கவும்

அடிக்கடி கேட்கப்படும் கேள்விகள்

திறந்த மூல உரையிலிருந்து பேச்சிற்கு பொதுவான கேள்விகள்

ஆம். TTS.aiல் உள்ள ஒவ்வொரு மாதிரியும் MIT அல்லது அப்பாச்சி 2.0 போன்ற அனுமதிக்கக்கூடிய திறந்த மூல உரிமத்தைப் பயன்படுத்துகிறது. தடைசெய்யப்பட்ட உரிமங்களைக் கொண்ட மாதிரிகளை நாங்கள் குறிப்பாக தவிர்க்கிறோம் (Coqui's CPML அல்லது வணிகமற்ற CC-BY-NC போன்றவை). நீங்கள் ஒவ்வொரு மாதிரியின் உரிமத்தையும் அதன் GitHub கிடங்கில் சரிபார்க்கலாம்.

இரண்டும் வணிக பயன்பாடு, மாற்றம் மற்றும் மறுவிநியோகத்திற்கு அனுமதிக்கும் அனுமதிப்பத்திரங்கள். அப்பாச்சி 2.0தெளிவான பன்னாட்டு உரிமங்களை சேர்க்கிறது மற்றும் நீங்கள் குறியீட்டை மாற்றினால் மாற்றங்களை குறிப்பிட வேண்டும். MIT எளிமையானது குறைவான தேவைகளுடன். இரண்டும் வணிக நட்பு.

ஆம். ஒவ்வொரு மாதிரியும் தன்னைத்தானே நிறுவ முடியும். GitHub இல் இருந்து மாதிரிக் கிடங்கை மாதிரியாக உருவாக்கவும், சார்புகளை நிறுவவும், மாதிரி எடைகளை பதிவிறக்கவும், மற்றும் முடிவுகளை இயக்கவும். ஒவ்வொரு மாதிரியின் தன்னைத்தானே நிறுவ வேண்டிய தேவைகளுக்கு GPU, RAM, மற்றும் பைத்தான் பதிப்பு உள்ளிட்ட ஆவணங்களை நாங்கள் வழங்குகிறோம்.

தேவைகள் மாடலுக்கு ஏற்ப மாறுபடும். Piperக்கு GPU தேவையில்லை (CPU மட்டுமே). Kokoro மற்றும் MeloTTS க்கு 1-2GB VRAM தேவை. பெரும்பாலான தரநிலை மாடல்களுக்கு 4GB VRAM தேவை. Tortoise மற்றும் Sesame CSM க்கு 8GB தேவை. ஒரு NVIDIA RTX 3060 (12GB) பெரும்பாலான மாடல்களை எளிதாக இயக்க முடியும்.

ஆம். திறந்த மூல உரிமங்கள் திருத்தங்களை அனுமதிக்கின்றன. GPT-SoVITS மற்றும் Bark போன்ற மாதிரிகள் திருத்தப்பட்ட எழுத்துருக்களை வழங்குகின்றன. நீங்கள் உங்கள் சொந்த குரல் தரவுகளில் மாதிரிகளை பயிற்சி செய்யலாம், தனிப்பட்ட குரல்களை உருவாக்கலாம் அல்லது குறிப்பிட்ட மொழிகளுக்கு செயல்திறனை மேம்படுத்தலாம்.

சிறந்த திறந்த மூல மாதிரிகள் (கோகோரோ, ஸ்டைல் டிடிஎஸ்2, சாட்டர்பாக்ஸ்) இப்போது எலெவன்லாப்ஸ் மற்றும் கூகுள் டிடிஎஸ் போன்ற வணிக சேவைகளை தரத்தின் அடிப்படையில் ஒப்பிட அல்லது மீறுகின்றன. வணிக சேவைகளின் முக்கியமான நன்மை நிர்வகிக்கப்பட்ட கட்டமைப்பு மற்றும் ஆதரவு, ஒலி தரம் அல்ல.

நாம் ஏற்கனவே அவற்றை நீக்கிவிட்டோம். XTTS/XTTS-v2 (Coqui's CPML — வணிகமற்றது), F5-TTS (CC-BY-NC — வணிகமற்றது), மற்றும் Higgs-v2 (போசன் உரிமம் — கட்டுப்பாடு) ஆகியவை அனைத்தும் நீக்கப்பட்டன. TTS.ai இல் உள்ள ஒவ்வொரு மாதிரியும் வணிக-பயன்பாட்டு பாதுகாப்பாக உறுதிப்படுத்தப்பட்டுள்ளது.

ஆம். பெரும்பாலான மாதிரிகள் GitHub மூலம் சமூக பங்களிப்பை ஏற்றுக் கொள்கின்றன. நீங்கள் பிழை அறிக்கைகளை, புதிய மொழிகளுக்கான குரல் பதிவுகளை, குறியீட்டு மேம்பாடுகளை, ஆவணங்களை சமர்ப்பிக்கலாம். ஒவ்வொரு மாதிரியின் GitHub கிடங்கையும் பங்களிப்பு வழிகாட்டுதல்கள் மற்றும் செயல்படும் பிரச்சினைகள் குறித்து சரிபார்க்கவும்.

தேவைப்பட்டால் மாதிரிகளை ஏற்றவும், செயல் இழந்தால் அவற்றை இறக்கவும், GPU நினைவகத்தை பகிர்ந்து கொள்ளவும். எங்கள் GPU சேவையகம் 20+ மாதிரிகளை 4x Tesla P40 (96GB மொத்த VRAM) யில் இயக்குகிறது, இது இயக்குதிறன் ஏற்றத்தை பயன்படுத்துகிறது. தனியாக சேமிப்பதற்கு, ஒரே 24GB GPU 3-5 மாதிரிகளை ஒரே நேரத்தில் சேவை செய்ய முடியும்.

பல மாதிரிகள் அதிகாரப்பூர்வ டக்கர் பிம்பங்களை அல்லது டக்கர் கோப்புகளை வழங்குகின்றன. பல மாதிரிகளை இயக்க, நீங்கள் என்விடியா கேன்டீனர் ட்யூல்கிட் மூலம் ஒரு தனிப்பயன் டக்கர் அமைப்பை உருவாக்கலாம் GPU அணுகலுக்கு. எங்கள் API சேவையக கட்டமைப்பு ஒரு குறிப்பு செயல்படுத்தல் ஆக சேவை செய்யலாம்.

பெரும்பாலான மாதிரிகளுக்கு பைத்தான் 3.10-3.12 தேவைப்படுகிறது. கோகுய் டிடிஎஸ் (VITS) குறிப்பாக பைத்தான் 3.11 தேவைப்படுகிறது. பெரும்பாலான மாதிரிகளுக்கு பைத்தான் 3.12 தேவைப்படுகிறது. ஒவ்வொரு மாதிரியின் requirements.txt ஐ சரியான பதிப்பு ஒத்துப்போக சரிபார்க்கவும்.

ஆம். MIT மற்றும் அப்பாச்சி 2.0 உரிமங்கள் வர்த்தக பயன்பாட்டிற்கு அனுமதிக்கின்றன. நீங்கள் SaaS பொருட்கள், கைபேசி பயன்பாடுகள், விளையாட்டுகள் மற்றும் சேவைகளை இந்த மாதிரிகளை பயன்படுத்தி உரிம கட்டணம், ரியோடிட்டி அல்லது குறிப்பிடுதல் தேவைகள் இல்லாமல் உருவாக்கலாம் (குறிப்பிடுதல் மதிக்கப்படுகிறது).
5.0/5 (1)

நாம் என்ன மேம்படுத்த முடியும்? உங்கள் கருத்துகள் பிரச்சினைகளை சரிசெய்ய உதவுகிறது.

திறந்த மூல TTS இன்றைய தினம் முயற்சிக்கவும்

20+ திறந்த மூல மாதிரிகள், அனைத்தும் வணிக-உரிமம். எங்கள் API அல்லது தானாகவே-அமைப்பாளர் பயன்படுத்தவும் - தேர்வு உன்னுடையது.