විවෘත මූලාශ්‍ර පෙළ සිට කථාව ආකෘති

අපගේ වේදිකාව මත සෑම TTS ආකෘතිය වාණිජමය-හිතකාමී බලපත්ර සමග විවෘත මූලාශ්රය වේ. MIT, Apache 2.0 - කිසිදු අයිතිවාසිකම් අගුලු, කිසිදු භාවිතය සීමා, කිසිදු පුදුම බලපත්ර ගාස්තු. අපගේ සත්කාරක API හරහා ඔවුන් භාවිතා කරන්න, හෝ පූර්ණ පාලනය සමඟ ඔබේම යටිතල පහසුකම් මත ඔවුන් ස්වයං-සත්කාරක.

විවෘත මූලාශ්‍ර MIT බලපත්‍රය අපාචි 2. 0 ස්වයංක්‍රීයව සත්කාරකත්වය සපයන්න ජිට් හබ්

දැන් උත්සාහ කරන්න

Kokoro සමග නිදහස්, Piper, VITS, MeloTTS
ඔබගේ ජනනය කරන ලද ශ්‍රව්‍ය මෙතනින් දිස්වේ
ජනනය කලේ
බාගත කිරීම්
TTS.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

විවෘත මූලාශ්රය TTS ප්රතිලාභ

විවෘත මූලාශ්රය ආකෘති ඔබේ ව්යාපෘති සඳහා වැදගත් වන්නේ ඇයි

සියලු විවෘත මූලාශ්රය බලපත්ර

TTS.ai මත සෑම ආකෘතියකම ඉඩ දෙන විවෘත මූලාශ්රය බලපත්රයක් භාවිතා කරයි. කිසිදු අයිතිවාසිකම් කළු පෙට්ටි, කිසිදු සැපයුම්කරු අගුළු, කිසිදු බලාපොරොත්තු නොවූ බලපත්ර ගාස්තු.

MIT / අපාචේ 2.0

ආකෘති MIT හෝ Apache 2.0 යටතේ බලපත්ර ලබා දී ඇත, වඩාත් ඉඩ විවෘත මූලාශ්රය බලපත්ර. වාණිජමය භාවිතය, වෙනස්, නැවත බෙදා හැරීම - කිසිදු සීමාවන්.

ස්වයංක්‍රීයව සත්කාරකත්වය සපයන්න

ඕනෑම ආකෘතිය බාගත කර ඔබේම දෘඩාංග මත එය ධාවනය කරන්න. ඔබේ දත්ත, ප්රමාද සහ යටිතල පහසුකම් මත සම්පූර්ණ පාලනය. වලාකුළු මත රඳා නොපවතී.

GPU උපරිමකරණය

ආකෘති CUDA සහාය සහිත NVIDIA GPUs සඳහා ප්රශස්තකරණය කර ඇත. Piper CPU මත පමණක් ක්රියාත්මක වේ. බොහෝ ආකෘති කාර්යක්ෂම නිගමනය සඳහා 2-8GB VRAM අවශ්ය වේ.

ප්රජාව නඩත්තු

ක්රියාකාරී විවෘත මූලාශ්රය ප්රජාවන් පවත්වාගෙන යාම හා මෙම ආකෘති වැඩි දියුණු. දායකත්වය සාදරයෙන් පිළිගනිමු - දෝෂ ඉදිරිපත්, වැඩි දියුණු කිරීම්, සහ GitHub මත නව හඬ.

වාණිජ භාවිතය OK

සියළුම ආකෘති ඔවුන්ගේ බලපත්ර යටතේ වාණිජ භාවිතය ඉඩ. නිෂ්පාදන ගොඩනැගීමට, සේවා අලෙවි, හා කිසිදු රාජ්ය හෝ භාවිතය ගාස්තු සමග වාණිජ අන්තර්ගතය නිර්මාණය.

අපගේ විවෘත මූලාශ්රය ආකෘතිය නාමාවලිය

සෑම ආකෘතිය, එහි බලපත්රය, සහ එය හොඳම කරන්නේ කුමක්ද

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

සඳහා හොඳම: Apache 2.0 — හොඳම ගුණාත්මක නිදහස් ආකෘතිය, 82M params, ස්වයං-සත්කාරක පහසු

උත්සහ කරන්න Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

සඳහා හොඳම: MIT - CPU පමණක්, අගල් උපාංග සහ embedded ස්වයං-සත්කාරකත්වය සඳහා පරිපූර්ණ

උත්සහ කරන්න Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

සඳහා හොඳම: MIT - බොහෝ පහළ ආකෘති විසින් භාවිතා මූලික ගෘහ නිර්මාණ ශිල්පය

උත්සහ කරන්න VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

සඳහා හොඳම: MIT - සම්මත TTS ඉක්මවා අද්විතීය ශ්රව්ය ජනනය හැකියාවන්

උත්සහ කරන්න Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: Apache 2.0 — උපරිම ගුණාත්මක, පුළුල් ලෙස අධ්යයනය උපුටා දැක්වීම ක්රියාත්මක

උත්සහ කරන්න Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: MIT - කැටිති ශෛලිය පාලනය සමග විවෘත මූලාශ්රය හඬ ක්ලෝන

උත්සහ කරන්න OpenVoice

විවෘත මූලාශ්රය TTS භාවිතා කරන ආකාරය

අපගේ සත්කාරක API භාවිතා කරන්න හෝ ඔබම ආකෘති ධාවනය කරන්න

1

විවෘත මූලාශ්ර ආකෘති ගවේෂණය කරන්න

20+ විවෘත මූලාශ්රය TTS ආකෘති අපගේ නාමාවලිය ගවේෂණය කරන්න. එක් එක් ආකෘති පිටුව බලපත්රය, ගෘහ නිර්මාණ ශිල්පය, හැකියාවන් සහ ස්වයං-සත්කාරක අවශ්යතා පෙන්වයි.

2

ඔබේ බ්රවුසරයේ උත්සාහ කරන්න

කිසිවක් ස්ථාපනය කිරීමකින් තොරව TTS.ai මත සෘජුවම ඕනෑම ආකෘතියක් පරීක්ෂා කරන්න. අපගේ GPU සේවාදායක සැකසීම කළමනාකරණය කරයි, එබැවින් ඔබ ස්වයං-සත්කාරකත්වයට කැප වීමට පෙර ගුණාත්මකභාවය ඇගයිය හැකිය.

3

ස්වයං-සත්කාරක හෝ අපගේ API භාවිතා කරන්න

GitHub සිට ක්ලෝන් ආකෘතිය repos හා දේශීයව ධාවනය, හෝ නිෂ්පාදනය සඳහා අපගේ සත්කාරක API භාවිතා කරන්න. ස්වයං-සත්කාරක පූර්ණ පාලනය ලබා දෙයි; අපගේ API කළමනාකරණය යටිතල පහසුකම් සපයයි.

4

ඔබේ යෙදුම ගොඩනඟන්න

ස්වයං-සත්කාරක ආකෘති හෝ අපගේ REST API භාවිතා කරමින් ඔබේ නිෂ්පාදනයට TTS ඒකාබද්ධ කරන්න. සියලු ආකෘති කිසිදු බලපත්ර ගාස්තු හෝ රාජ්ය නොවන අයවැය සමඟ වාණිජමය භාවිතයට ගත හැකිය.

බලපත්‍ර සංසන්දනය

TTS.ai මත සියලුම ආකෘති වාණිජමය-හිතකාමී විවෘත මූලාශ්රය බලපත්ර භාවිතා

ආකෘතිය බලපත්‍රය වාණිජමය භාවිතය වෙනස් කිරීම ස්ව- ධාරකය අයිතිය
Kokoro Apache 2.0 අවශ්ය
Piper MIT විකල්ප
VITS MIT විකල්ප
MeloTTS MIT විකල්ප
Chatterbox MIT විකල්ප
Tortoise TTS Apache 2.0 අවශ්ය
StyleTTS 2 MIT විකල්ප
OpenVoice MIT විකල්ප
Sesame CSM Apache 2.0 අවශ්ය
Orpheus Llama 3.2 "Built with Llama"

ස්වයං-සත්කාරක vs සත්කාරක API

ඔබම ආකෘති ධාවනය කරන්න හෝ අපට යටිතල පහසුකම් හැසිරවීමට ඉඩ දෙන්න

ඔබේ දෘඩාංග මත ස්වයං-සත්කාරක

TTS.ai හි සෑම ආකෘතියක්ම GitHub හෝ Hugging Face හි විවෘත මූලාශ් රය ව් යාපෘතියක් ලෙස ලබා ගත හැකිය. බර බාගත කරන්න, අනුරූපතා ස්ථාපනය කරන්න, ඔබේම GPUs මත නිගමනය ධාවනය කරන්න. ඔබට ප් රමාදය, පෞද්ගලිකත්වය සහ පරිමාණය කිරීම පිළිබඳ පූර්ණ පාලනයක් ඇත.

  • සම්පූර්ණ දත්ත පෞද්ගලිකත්වය - ශ්රව්ය ඔබේ සේවාදායකය අත්හැර කවදාවත්
  • ආරම්භක ස්ථාපනය කිරීමෙන් පසු කිසිදු ඉල්ලුම් පිරිවැයක් නැත
  • ඔබේම දත්ත මත අභිරුචි මනා-කැඩපත
  • GPU දෘඩාංග අවශ්ය වේ (NVIDIA නිර්දේශිත)
  • ඔබ යාවත්කාලීන කළමනාකරණය, පරිමාණය, හා රඳා පවතී

TTS.ai සත්කාරක API භාවිතා කරන්න

තනි REST API හරහා සියලුම 20+ ආකෘති වලට ක්ෂණිකව පිවිසෙන්න. අපි GPU සැපයීම, ආකෘති යාවත්කාලීන කිරීම්, පෝලිම් කළමනාකරණය සහ පරිමාණය කිරීම පාලනය කරමු. එක් API යතුරක් සෑම ආකෘතියකටම ඔබට ප්රවේශය ලබා දෙයි - වෙනම යෙදවුම් කළමනාකරණය කිරීමට අවශ්ය නැත.

  • GPU දෘඩාංග අවශ්ය නොවේ
  • එක් API හරහා සියලු 20+ ආකෘති
  • ස්වයංක්රීය ආකෘති යාවත්කාලීන සහ වැඩි දියුණු
  • 99.9% අවශ්යතා යටිතල පහසුකම් සමඟ
  • ඔබ භාවිතා කරන දේ සඳහා පමණක් ගෙවන්න

ක්ෂණික ආරම්භය: API හෝ ස්වයං-සත්කාරක

අපගේ සත්කාරක API භාවිතා කරන්න, හෝ විනාඩි Kokoro දේශීය ස්ථාපනය

විකල්පය 1: TTS.ai සත්කාරක API ලේසිම
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
විකල්පය 2: pip සමග ස්වයං-සත්කාරක සම්පූර්ණ පාලනය
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

විවෘත මූලාශ්රය, ලාභදායී මිල ගණන්

අපගේ සත්කාරක API GPUs කළමනාකරණය නොකර විවෘත මූලාශ්රය TTS ප්රවේශ විය හැක.

නිදහස් ස්ථරය

$0

15 ලියාපදිංචි මත ණය

  • 4 විවෘත මූලාශ්රය ආකෘති නිදහස්
  • මූලික භාවිතය සඳහා ලියාපදිංචිය අවශ්‍ය නොවේ
  • වාණිජ භාවිතය සඳහා අවසර

ආරම්භකයා

$9

500 ණය / මාස

  • සියලු 20+ විවෘත මූලාශ්රය ආකෘති
  • හඬ ක්ලෝන කිරීම
  • API පිවිසුම

ප්‍රො

$29

අක්ෂර 2,000,000 / මාසයක්

  • GPU සැකසුම් ප්‍රමුඛතාව
  • සියලුම වාරික ආකෘති
  • ව්යාපාර සහාය
සම්පූර්ණ මිල දර්ශනය

නිතර අසන ප්රශ්න

විවෘත මූලාශ්රය පෙළ කථාව ගැන පොදු ප්රශ්න

ඔව්. TTS.ai මත සෑම ආකෘතියකම අවසර සහිත විවෘත මූලාශ්ර බලපත්රයක් භාවිතා කරයි - MIT හෝ Apache 2.0 එකක්. අපි විශේෂයෙන් සීමා සහිත බලපත්ර සහිත ආකෘති ඉවත් කරමු (Coqui ගේ CPML හෝ වාණිජ නොවන CC-BY-NC වැනි). ඔබට එහි GitHub කෞතුකාගාරයේ එක් එක් ආකෘතියක බලපත්රය තහවුරු කළ හැකිය.

දෙකම වාණිජ භාවිතය, වෙනස් කිරීම, සහ නැවත බෙදාහැරීම ඉඩ දෙන අවසර විවෘත මූලාශ්රය බලපත්ර වේ. Apache 2.0 පැහැදිලි පේටන්ට් බලපත්ර සහතික එකතු හා ඔබ කේතය වෙනස් නම් වෙනස්කම් සඳහන් කිරීමට අවශ්ය. MIT අවශ්යතා අඩු සරල වේ. දෙකම ව්යාපාර-හිතකාමී වේ.

ඔව්. සෑම ආකෘතියක්ම ස්වයං-සත්කාරක විය හැකිය. GitHub හි සිට ආකෘති කෞතුකාගාරය ක්ලෝන් කරන්න, අනුරූපතා ස්ථාපනය කරන්න, ආකෘති බර බාගත කරන්න, සහ නිගමනය ධාවනය කරන්න. අපි GPU, RAM සහ Python අනුවාදය ඇතුළු එක් එක් ආකෘතියක ස්වයං-සත්කාරක අවශ්යතා සඳහා ලේඛන ලබා දෙමු.

අවශ්යතා ආකෘතිය අනුව වෙනස් වේ. Piper GPU අවශ්ය නැත (CPU පමණක්). Kokoro සහ MeloTTS 1-2GB VRAM අවශ්ය. බොහෝ සම්මත ආකෘති 4GB VRAM අවශ්ය. Tortoise සහ Sesame CSM 8GB අවශ්ය. NVIDIA RTX 3060 (12GB) බොහෝ ආකෘති පහසුවෙන් ධාවනය කළ හැකිය.

ඔව්. විවෘත මූලාශ්රය බලපත්ර fine-tuning ඇතුළු වෙනස්කම් ඉඩ. GPT-SoVITS හා බර්ක් වැනි ආකෘති fine-tuning ස්ක්රිප්ට් ලබා. ඔබ අභිරුචි හඬ නිර්මාණය කිරීමට හෝ විශේෂිත භාෂා සඳහා කාර්ය සාධනය වැඩි දියුණු කිරීම සඳහා ඔබේම හඬ දත්ත මත ආකෘති පුහුණු කළ හැකිය.

ඉහළ විවෘත මූලාශ්රය ආකෘති (Kokoro, StyleTTS 2, Chatterbox) දැන් ගුණාත්මක සම්මතයන් ElevenLabs හා ගූගල් TTS වැනි වාණිජ සේවා ගැලපෙන හෝ ඉක්මවා යයි. වාණිජ සේවා ප්රධාන වාසිය කළමනාකරණය යටිතල පහසුකම් සහ සහාය, ශ්රව්ය ගුණාත්මක නොවේ.

අපි දැනටමත් ඔවුන් ඉවත් කර ඇත. XTTS / XTTS-v2 (Coqui ගේ CPML - වාණිජ නොවන), F5-TTS (CC-BY-NC - වාණිජ නොවන), හා හිග්ස්-v2 (බෝසෝන බලපත්රය - සීමාකාරී) සියල්ල ඉවත් කරන ලදී. TTS.ai සෑම ආකෘතිය වාණිජ-විශේෂයෙන් ආරක්ෂිත සත්යය වේ.

ඔව්. බොහෝ ආකෘති GitHub හරහා ප්රජා දායකත්වය පිළිගනී. ඔබ දෝෂ වාර්තා ඉදිරිපත් කළ හැකිය, නව භාෂා සඳහා හඬ පටිගත, කේත වැඩි දියුණු කිරීම්, සහ ලේඛන. දායකත්වය මාර්ගෝපදේශ සහ සක්‍රීය ගැටළු සඳහා එක් එක් ආකෘතිය GitHub කෞතුකාගාරය පරීක්ෂා කරන්න.

අපගේ GPU සේවාදායකය 4x ටෙස්ලා P40 (96GB මුළු VRAM) භාවිතා කරමින් 20+ ආකෘති ධාවනය කරයි. ස්වයං-සත්කාරකත්වය සඳහා, තනි 24GB GPU එකවර 3-5 ආකෘති සේවය කළ හැකිය.

බොහෝ ආකෘති නිල Docker පින්තූර හෝ Dockerfiles සපයයි. බහු ආකෘති ධාවනය කිරීම සඳහා, ඔබට GPU ප්රවේශය සඳහා NVIDIA Container Toolkit සමඟ අභිරුචි Docker ස්ථාපනය කළ හැකිය. අපගේ API සේවාදායක ගෘහ නිර්මාණ ශිල්පය උපුටා දැක්වීමක් ලෙස සේවය කළ හැකිය.

බොහෝ ආකෘති සඳහා Python 3.10-3.12 අවශ්ය වේ. Coqui TTS (VITS) විශේෂයෙන් Python 3.11 අවශ්ය වේ. අපි බොහෝ ආකෘති සඳහා Python 3.12 නිර්දේශ කරමු. නිවැරදි අනුවාද අනුකූලතාව සඳහා එක් එක් ආකෘතියක requirements.txt පරීක්ෂා කරන්න.

ඔව්. MIT සහ Apache 2.0 බලපත්ර පැහැදිලිව වාණිජමය භාවිතය සඳහා ඉඩ ලබා දෙයි. ඔබට SaaS නිෂ්පාදන, ජංගම යෙදුම්, ක්රීඩා සහ සේවා කිසිදු බලපත්ර ගාස්තු, රාජ්ය, හෝ හිමිකම් අවශ්යතා සමඟ මෙම ආකෘති භාවිතා කරමින් ගොඩනැගීම කළ හැකිය (නමුත් හිමිකම් අගය කරනු ලැබේ).
5.0/5 (1)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

අද විවෘත මූලාශ්රය TTS උත්සාහ කරන්න

20+ විවෘත මූලාශ්රය ආකෘති, සියලු වාණිජමය බලපත්ර. අපගේ API හෝ ස්වයං-සත්කාරක භාවිතා කරන්න - තේරීම ඔබගේ ය.