Gjeneratori i zërit AI për transmetimin në kohë reale

Ngrite nivelin e Twitch, YouTube dhe Kick streams me zërin e mbështetur nga AI. Krijo njoftime të personalizuara donacionesh TTS, bashkë-hostë të AI që bashkëveprojnë me chat, chat-to-voice në kohë reale dhe mbishkrime profesionale të stream me tregim dinamik.

Twitch TTS YouTube Chat me zë Alarmimi i drejtpërdrejtë AI Cohost

Provoje tani

Pa pagesë me Kokoro, Piper, VITS, MeloTTS
Zëri juaj i gjeneruar do të shfaqet këtu
Gjenerat
Shkarko
Të pëlqen TTS.ai?

Funksionet e zërit të AI për Streamers

Instrumente të projektuara për rrjedhat e punës me transmetim të drejtpërdrejtë

Paralajmërimet e personalizuara të donacioneve

Zërat natyrorë të AI zëvendësojnë TTS robotik për njoftimet e donacioneve. Assign zëra të ndryshëm për nivele të ndryshme për një përvojë premium shikues.

Chat-to-Voice

Lexo mesazhet e bisedës me zëra të AI. Zëra të ndryshëm për shikues, zëra premium vetëm për abonues, filtrim i profanitetit.

AI Cohost

Ndërto një personalitet AI që bashkë-prit stream-in tënd. Përgjigjet në biseda, reagon ndaj ngjarjeve të lojës dhe angazhon audiencën tënde me një zë të personalizuar.

Latency e ulët

Modelet e shpejtë gjenerojnë audio në më pak se 2 sekonda. Kokoro dhe MeloTTS janë optimizuar për aplikime të transmetimit në kohë reale.

Paralajmërime shumëgjuhëshe

Mbështetje për shikues ndërkombëtarë me paralajmërime në më shumë se 30 gjuhë. Klonimi i zërit ndërgjuhësor ruan zërin e markave tuaja në çdo gjuhë.

Kufizimi i shpejtësisë dhe filtrimi

Kufizimi i ndërtuar i shpejtësisë dhe filtrimi i përmbajtjes për integrimin e sigurt të rrjetit. Parandalo automatikisht spam-in dhe përmbajtjen e papërshtatshme.

Modelet më të mira të zërit të AI për streaming

Modele të shpejta, me tingull natyror, të përsosura për përmbajtje të drejtpërdrejtë

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Më i miri për: Më i miri për streaming — i shpejtë, cilësi e lartë, zëra të shumtë

Provo Kokoro

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

Më i miri për: I lirë, shumëgjuhësh, i përshtatshëm për CPU për rregullimet e buxhetit të rrjetit

Provo MeloTTS

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Më i miri për: I lirë, ultra-i shpejtë për biseda me volum të lartë TTS pa vonesë

Provo Piper

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Klonimi i zërit

Më i miri për: Paralajmërimet Premium me klonim zëri dhe kontroll emocionesh

Provo CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Më i miri për: Fjalëshkrimi natyror i bisedave për aplikacionet e bashkë-hostimit të AI

Provo Sesame CSM

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Më i miri për: Efekte zërash argëtuese, qeshje dhe shprehje emocionale për argëtim

Provo Bark

Si të konfigurosh zërin AI për Fluxin tënd

Nga regjistrimi në jetim në më pak se 5 minuta

1

Krijo një kyç API

Regjistrohu dhe gjenero një kyç API nga paneli i llogarisë suaj. Niveli i lirë përfshin 15 kreditë.

2

Lidh Bot-in tënd të Fluxëve

Integro me bot-in tënd ekzistues (tmi.js, Python) ose përdor shembujt e kodit tonë për konfigurim të shpejtë.

3

Konfiguro tingujt dhe aktivizimet

Assign voices to donation levels, chat commands, or specific viewers. Set rate limits and filters.

4

Shko në _live

Zëri i AI-së punon në sfond. Paralajmërimet e donacioneve dhe mesazhet e bisedimeve luhen automatikisht nëpërmjet audios së rrjetit tënd.

Si përdorin streamerët zërin e AI

Konfigurime të realta të transmetimit të dhëna nga TTS.ai

Zërat e personalizuar të alarmit të donacionit

Zëvendëso njoftimet e paracaktuara të donacioneve TTS me zëra natyrorë të AI. Assign zëra të ndryshëm për nivelet e ndryshme të donacioneve - një zë i gëzuar për donacionet e vogla, një tregimtar epike për donacionet e mëdha, ose le të donatorit të zgjedhin nga 100 + zëra. Integro me StreamElements, Streamlabs, ose ndërto njoftime të personalizuara nëpërmjet API tonë.

  • 100+ zëra në 30+ gjuhë
  • Zëri i personalizuar për nivel donacioni
  • Përshtatshmëri me StreamElements dhe Streamlabs
  • Gjenerati me vonesë të ulët (më pak se 2 sekonda)

Sistemi Chat-to-Voice

Lëri që mesazhet e bisedës të ngjallin me zërin e folur. Shikuesit shkruajnë në bisedë dhe një zë AI lexon mesazhet e tyre me zë të lartë në rrjedhje. Përdor zëra të ndryshëm për shikues të ndryshëm, thekso mesazhet e abonuesve me zëra premium, ose krijo zëra karakteresh për komanda të veçanta të bisedës.

  • Pipeline chat-to-speech në kohë reale
  • Zëri specifik për shikuesin
  • Filtrimi i profanitetit dhe kufizimi i shpejtësisë
  • Modë vetëm për nën-përdorues me zëra premium

AI Cohost & Chat Bot

Krijo një personalitet AI që bashkë-prit stream-in tënd. Kombino API-në tonë TTS me një model gjuhe për të ndërtuar një bot bisede që dëgjon stream-in tënd, përgjigjet me komente të shkëlqyera, reagon ndaj ngjarjeve të lojës dhe angazhohet me audiencën duke përdorur një zë të personalizuar AI. Përdor Sesame CSM ose Dia TTS për një bisedë natyrore.

  • AI biseduese me kohë natyrore
  • Personaliteti dhe zëri i personalizuar i AI
  • Reagimet dhe komentet e ngjarjeve të lojës
  • Interaksioni i audiencës dhe P&P

Përmbajtja e Fluxëve shumëgjuhëshe

Arrij audiencën ndërkombëtare duke gjeneruar njoftime dhe tregime në më shumë se 30 gjuhë. Përdor përkthimin e fjalës për të përkthyer automatikisht dhe për të shprehur përmbajtjen tënde për shikuesit në mbarë botën. Klonimi i zërit ndërgjuhësor të lejon të ruaj identitetin e zërit tënd ndërsa flet në çdo gjuhë.

  • Suport për 30+ gjuhë
  • Përkthim i ruajtur me zë
  • Alarme të lokalizuara për rajon të shikuesve
  • Përgjigjet e bashkë-pritësve të AI shumëgjuhëshe

Latency e ulët për transmetimin në drejtim

Shpejtësia ka rëndësi kur transmetohet në drejtim të drejtpërdrejtë.

Modeli Shpejtësia Cilësia Më i miri për
Kokoro Me shpejtësi 5/5 Më i miri për streaming
MeloTTS Me shpejtësi 4/5 Alarm i lirë, shumëgjuhësh
Piper Me shpejtësi 3/5 Chat i lirë, me volum të lartë TTS
CosyVoice 2 Medium 5/5 Premium alarm me klonim
Bark Ngadalë 4/5 Efekte zërash dhe emocione argëtuese

Integrimi i shpejtë i API

Shto AI TTS tek bot-i yt i transmetimit në minuta

JavaScript (Node.js Stream Bot) REST API
// Twitch chat handler with AI TTS
const tmi = require('tmi.js');
const fetch = require('node-fetch');

client.on('message', async (channel, tags, message) => {
  if (tags['msg-id'] === 'highlighted-message') {
    const response = await fetch('https://api.tts.ai/v1/tts', {
      method: 'POST',
      headers: {
        'Authorization': 'Bearer YOUR_API_KEY',
        'Content-Type': 'application/json'
      },
      body: JSON.stringify({
        text: message,
        model: 'kokoro',
        voice: 'af_heart',
        format: 'mp3'
      })
    });
    // Play audio through OBS/stream audio
    playAudioOnStream(await response.buffer());
  }
});

Pyetje të shpeshta

Pyetja e zakonshme rreth zërit të AI për transmetimin drejtpërsëdrejti

Kokoro gjeneron audion në më pak se 1 sekond për mesazhet e zakonshme të dhurimit. MeloTTS dhe Piper janë edhe më të shpejtë. Koha e vonimit të përgjithshëm nga ngjarjet tek riprodhimi i audios është zakonisht 1-3 sekonda në varësi të modelit dhe gjatësisë së mesazhit.

Po. Mund të konfiguroni bot-in tuaj të transmetimit për të lejuar shikuesit të zgjedhin zëra me komandat e bisedimeve (p.sh., "!voice deep" ose "!voice female"). API jonë suporton më shumë se 100 zëra në të gjithë modelet, kështu që shikuesit kanë shumë mundësi.

API jonë punon me çdo softuer të rrjedhës që suporton paralajmërimet e personalizuara ose mbishkrimet JavaScript. Mund të integroheni nëpërmjet një bot të personalizuar që thërret API tonë dhe nxjerr audio në burimin tuaj të rrjedhës. Integrimet e drejtpërdrejta të plugin janë gjithashtu të mundshme nëpërmjet burimit të shfletuesit.

Një transmetim 4 orësh me aktivitet mesatar bisede (100-200 mesazhe TTS) përdor rreth 50-100 kreditë. Modelet falas (Piper, MeloTTS) përdorin zero kreditë. Plani Starter ($9/muaj, 500 kreditë) mbulon shumicën e transmetuesve me lehtësi.

Po. Klono çdo zë nga një shembull audio 5-30 sekondash dhe përdore atë për të gjithë stream-in tënd TTS. Chatterbox dhe GPT-SoVITS ofrojnë cilësinë më të mirë të klonimit. Kjo është e mrekullueshme për krijimin e një zëri të karakterit të nënshkrimit të stream-it.

Duhet të implementoni filtrimin e përmbajtjes në bot-in tuaj të rrjetit përpara se të dërgoni tekstin tek API. Përqasjet e zakonshme përfshijnë bllokimin e listave të fjalëve, filtrimin e regex, dhe modalitetin TTS vetëm për abonentët. Kufizimi ynë i shpejtësisë së API gjithashtu ndihmon në parandalimin e spam-it.

Po. Konfiguro bot-in e stream-it tënd për të kontrolluar rolin e shikuesve (abonues, VIP, moderator) dhe për të drejtuar kërkesat tek modele apo zëra të ndryshëm. Për shembull, shikuesit e lirë marrin Piper ndërsa abonentët marrin Kokoro ose Orpheus.

Boti juaj i rrjedhjes gjeneron audio nëpërmjet API dhe e ruan atë si një file të përkohshëm ose e rrjedh atë në një pajisje virtuale audio. Në OBS, kap atë burim audio. Alternativisht, përdor një burim shfletuesi me JavaScript që luan audion drejtpërsëdrejti në skenën tuaj.

Po. API jonë është e pavarur nga platforma. Çdo platformë që lejon bot-ët e personalizuar ose mbishkrimet e burimit të shfletuesit mund të integrojë TTS. I njëjti kod bot punon në Twitch, YouTube Live, Kick dhe platforma të tjera me ndryshime të vogla të trajtimit të ngjarjeve.

Po. Kombinimi i API-së sonë TTS me një LLM (si ChatGPT ose Claude) për të krijuar një bashkë-host të AI që përgjigjet në mënyrë inteligjente mesazheve të bisedimeve. Përdor Sesame CSM për biseda natyrore ose klono një zë të veçantë për karakterin tënd AI.

Ne rekomandojmë implementimin e një rezervë në bot tuaj, si një motor lokal TTS ose një rresht që riprovon kërkesat e dështuara. API jonë ka kohë të lartë funksionimi, por për rrjedhat kritike të misionit, duke patur një rezervë siguron përvojë të pandërprerë shikuesi.

Boti juaj duhet të implementojë një sistem rreshti që përpunon kërkesat TTS në mënyrë sekuenciale për të shmangur mbishkrimin e audios. Shumica e bot-ëve të rrjetit e trajtojnë këtë në mënyrë native. Përcaktoni një kohëzgjatje midis mesazheve (p.sh., 3-5 sekonda) për të mbajtur rrjetin të menazhueshëm.
5.0/5 (1)

Çfarë mund të përmirësojmë? Feedback-i juaj na ndihmon të zgjidhim problemet.

Gati për të rritur nivelin e rrjedhës suaj?

Bashkohu me mijëra streamer duke përdorur zërin AI. Niveli i lirë në dispozicion, nuk kërkohet karta krediti.