Report Bug / Feature Request

Prevod reči na text

Prepisujte audio a video na text s AI.Podporuje 99 jazykov, časové pečiatky a detekciu reproduktorov.

Nahrajte zvuk alebo video

Presuňte svoj súbor sem, alebo prehliadať

Podporuje MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
– alebo nahrávajte z mikrofónu –
00:00

Nastavenia

1,000/min znaky Prihlásiť sa na odber Sledovať používanie

Prepis

Nahrajte zvukový súbor a začnite kliknutím na položku Prepisovať

Prepisovanie zvuku... To môže chvíľu trvať.

Zistené:

Ako to funguje

1. nahrať zvuk

Nahrajte svoj audio alebo video súbor.Podporujeme MP3, WAV, FLAC, OGG, M4A, MP4 a WebM formáty až do 100MB.

Softvér podobný softvéru AI Transcribes:

Naše modely umelej inteligencie spracúvajú váš zvuk, zisťujú jazyk, identifikujú reproduktorov a generujú presný text s časovými pečiatkami.

3. Získajte svoj text

Skopírujte svoj prepis alebo si ho stiahnite vo formáte TXT alebo SRT titulkov a upravte ho podľa potreby.

Prípady použitia

Prevod reči na text pre každé odvetvie a pracovný postup

Stretnutia & konferencie

Automaticky prepisujte nahrávky aplikácií Zoom, Teams a Google Meet. Už nikdy nezmeškáte žiadnu akciu.Exportujte ako poznámky zo schôdze alebo titulky.

Rozhovory & žurnalistika

Prepisujte rozhovory pre články, výskumné práce a dokumenty.Diarizácia hovorcov identifikuje, kto čo povedal, aby sa ľahko pripisovalo.

Podcasty & médiá

Vytváraj prepisy a zobrazuj poznámky k epizódam podcastov. Vytváraj prehľadávateľné archívy svojho audioobsahu a pridávaj titulky k videopodcastom.

Prednášky & vzdelávanie

Premeňte nahrané prednášky na študijné poznámky, sprístupnite vzdelávací obsah pomocou presných titulkov a podporte študentov so sluchovým postihnutím.

Lekársky diktátor

Prepisujte konzultácie medzi lekárom a pacientom, klinické poznámky a lekárske diktovanie.Ušetrite hodiny manuálnej dokumentácie s presnosťou poháňanou umelou inteligenciou.

Súdne konania

Prepisujte výpovede, vypočutia a stretnutia s klientmi. Presné časové pečiatky na právne referencie.Exportujte vo formátoch vhodných pre súdnu dokumentáciu.

Porovnanie modelov STT

Whisper

Robustný model rozpoznávania reči OpenAI podporuje 99 jazykov.

  • V 99 jazykoch
  • Preklad
  • Časové pečiatky
  • Robustný voči hluku
OpenAI

Faster Whisper

4x rýchlejší ako Whisper s optimalizáciou CTranslate2, rovnaká presnosť.

  • 4-krát rýchlejšie
  • Spodná časť pamäte
  • Všetky veľkosti modelov
  • Dávkové spracovanie
  • Filtrovanie VAD
SYSTRAN

SenseVoice

Model porozumenia reči s detekciou emócií, viac ako 50 jazykov.

  • Viac ako 50 jazykov
  • Detekcia emócií
  • Audio udalosti
  • Analýza reproduktorov
  • Bohaté metaúdaje
Alibaba (FunAudioLLM)

Plány prevodu reči na text

Začnite zdarma, inovujte, keď budete potrebovať viac

Voľný
  • 1-minútový limit zvuku
  • Rýchlejší model Whisper
  • Základná transkripcia
  • Viac ako 100 jazykov
Striptease Najobľúbenejší
Vytvoriť bezplatný účet
  • 30-minútový audio + 15 kreditov
  • Všetky modely STT
  • Časové pečiatky na úrovni slov
  • Export titulkov SRT a VTT
  • Diarizácia reproduktorov
Zaregistrujte sa zdarma
Pre
  • 2-hodinové audio súbory
  • Dávková prepisovacia technológia
  • Prioritné spracovanie
  • Prístup k API
  • Vlastná slovná zásoba
Aktualizácia

Často kladené otázky

Naše modely využívajú umelú inteligenciu na presný prepis zvuku zo schôdzí, rozhovorov, podcastov, prednášok a ďalších zdrojov, pričom sa snažia zachovať autentickosť a presnosť.

Rýchlejší prepis sa odporúča pre väčšinu prípadov použitia. Je 4x rýchlejší ako pôvodný prepis, pričom si zachováva rovnakú presnosť. Ak potrebujete okrem prepisu aj detekciu emócií alebo detekciu zvukových udalostí, použite SenseVoice.

Podporujeme MP3, WAV, M4A, OGG, FLAC, WEBM a najbežnejšie audio/video formáty. Maximálna veľkosť súboru je 50MB.Pre väčšie súbory zvážte rozdelenie zvuku ako prvý.

Bezplatní používatelia môžu prepisovať až 5 minút zvuku, platené plány podporujú audio súbory až do 2 hodín. Pre dlhšie nahrávky použite naše API s dávkovým spracovaním.

Naše modely dosahujú presnosť viac ako 95 % pri jasnej anglickej reči. Presnosť sa líši v závislosti od jazyka, kvality zvuku a hluku na pozadí.

Áno, naše pokročilé režimy prepisu dokážu identifikovať a označiť rôznych rečníkov v zvukovom zázname.Diarizácia rečníkov je obzvlášť užitočná pri prepisoch schôdzí, rozhovoroch a podcastoch s viacerými ľuďmi, kde potrebujete vedieť, kto čo povedal.

Prostredníctvom nášho rozhrania API je k dispozícii streamovaný prepis v reálnom čase s použitím technológie Faster Whisper. Zvuk sa pri príchode spracováva po častiach, čím sa vytvárajú čiastočné prepisy s nízkou latenciou, čo je ideálne na živé titulkovanie a zapisovanie poznámok v reálnom čase.

Áno, náš prepisový výstup obsahuje časové pečiatky na úrovni slov, ktoré možno exportovať ako súbory titulkov SRT, VTT alebo ASS, čo je ideálne na pridávanie titulkov do videí YouTube, online kurzov a obsahu sociálnych médií.

K dispozícii sú aj časové pečiatky na úrovni slov, ktoré zobrazujú presný čas začiatku a konca pre každé slovo vo zvukovom zázname.

Faster Whisper je trénovaný na rôzne zvuky a dobre zvláda mierny hluk pozadia.Pre veľmi hlučné nahrávky odporúčame najprv spustiť zvuk cez náš Audio Enhancer, aby sa zlepšila jasnosť pred prepisom.

Áno, nahrané zvukové súbory sú spracované na našich zabezpečených GPU serveroch a po dokončení prepisu sú automaticky vymazané. Vaše zvukové súbory neukladáme, nezdieľame ani nepoužívame na vzdelávacie účely.Všetky prenosy sú šifrované.

Bezplatní používatelia môžu bezplatne prepísať až 5 minút zvuku. Platené plány používajú kredity na základe dĺžky zvuku: približne 1 kredit za minútu zvuku.Podrobné informácie o plánoch a balíkoch kreditov nájdete na našej stránke s cenami.
5.0/5 (1)

Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.

Prepisujte zvuk s AI

Získajte presné prepisy v 99 jazykoch.Zaregistrujte sa zdarma a získajte 15 000 znakov na začatie.