Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

Перадача гуку або відэа

Перацягніце файл сюды, або прагляд

Падтрымлівае фарматы MP3, WAV, FLAC, OGG, M4A, MP4, WebM.

файл.mp3

0 MB
— або запісваць з мікрафона —
00:00

& Настаўленні

1,000/min знакаў Падпісацца to track usage

Транслітарацыя

Загрузіць гукавы файл і націснуць Транскрыпцыя, каб пачаць

Перапісванне гуку... Гэта можа заняць хвіліну.

Знойдзена:

Як гэта працуе

Загрузіць гук

Загрузіць аўдыё- або відэафайл. Падтрымліваюцца фарматы MP3, WAV, FLAC, OGG, M4A, MP4 і WebM памерам да 100 Мб.

2. AI- транскрыпцыя

Нашы мадэлі штучнага інтэлекту апрацоўваюць ваш аўдыё, выяўляюць мову, вызначаюць гукарэжысёраў і генеруюць дакладны тэкст з часовымі штампамі.

3. Атрымаць ваш транскрыпт

Скапіруйце ваш транскрыпт або загрузіце яго ў фармаце TXT або SRT. Рэдагуйце і ўдасканальвайце па патрэбе.

Выкарыстанне

Аудыа-транскрыпцыя для любой галіны і працоўнага працэсу

Сустрэчы і канферэнцыі

Аўтаматычнае перапісванне запісаў Zoom, Teams і Google Meet. Больш ніколі не прапусціце ніводнага дзеяння. Экспарт у выглядзе заметак ці субтытраў.

Інтэрв' ю і журналістыка

Запіс інтэрв'ю для артыкулаў, дасьледчых работ і дакументальных фільмаў. Запіс гаворкі вызначае, хто што сказаў, каб лёгка вызначыць аўтарства.

Падкаст і медыя

Стварэньне транскрыптаў і паказ заметак для эпізодаў падкастаў. Стварэньне архіваў з магчымасьцю пошуку вашага аўдыё- зьмесьціва. Даданьне субтытраў да відэа- падкастаў.

Лекцыі і навучанне

Пераўтварэньне запісаных лекцыяў у вучэбныя заметкі. Даступнасьць адукацыйнага зьместу з дакладнымі падпіскамі. Падтрымка студэнтаў з парушэньнямі слуху.

Name=Сацыяльныя сеткі

Стварайце субтытры і закрытыя субтытры для відэа YouTube, TikTok і сацыяльных медыя. Палепшыце даступнасьць і SEO з дакладнымі транскрыптамі.

Прававыя і медыцынскіяName

Запіс паказанняў, слуханняў, кансультацый і дыктоўкі. Дакладныя часопісы для спасылак. Экспарт у фарматах, прыдатных для дакументацыі.

Падтрымліваемыя фарматы

Транскрыпцыя любога аўдыё- ці відэафайлу — мы аўтаматычна выцягнем аўдыё

Фарматы гуку

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Фарматы відэа

MP4 WebM AVI MOV MKV WMV FLV M4V

Аўдыё аўтаматычна выцягваецца з відэа файлаў для транскрыпцыі.

Модулі транскрыпцыі

Whisper

На тэрыторыі гміны размешчаны 99 населеных пунктаў.

  • 99 моў
  • Пераклад
  • Часовыя знакі
  • Надзейны да шуму
OpenAI

Faster Whisper

4x хутчэй, чым Whisper з аптымізацыяй CTranslate2, такая ж дакладнасць.

  • 4x хутчэй
  • Паменшыць памяць
  • Усе памеры мадэляў
  • Пакетная апрацоўка
  • Фільтраванне VAD
SYSTRAN

SenseVoice

Праграмнае забеспячэнне даступна на 50 мовах, у тым ліку на беларускай.

  • 50+ моў
  • Выяўленне эмоцый
  • Гукавыя падзеі
  • Аналіз гукавога файла
  • Багатыя метададзеныя
Alibaba (FunAudioLLM)

Частыя пытанні

Выкарыстоўвайце OGG файлы без канверсіі. Наш транскрыптар дэкадуе Vorbis (open-source patent-free), адпраўляе яго ў Faster Whisper на GPU і вяртае транскрыпт з часовымі знакамі і дадатковымі SRT і VTT субтытрамі.

OGG - гэта Vorbis (open-source patent-free). Ён найбольш часта вырабляецца open-source applications, game engines, Wikipedia audio, and Linux-recorded files.

OGG мае страты (Vorbis (open-source patent-free)), але страты адбываюцца ў аўдыё дыяпазонах, якія не нясуць шмат інфармацыі пра размову. Хутчэйшы Whisper транскрыптуе OGG у 96-256 kbps Vorbis з дакладнасцю ~ 1% ад дакладнасці WAV на тым жа зыходным запісе. Рэальная дакладнасць - гэта якасць першапачатковага запісу (мікрафон, пакой, гукавой дынамік), а не кодэк OGG.

OGG файлаў звычайна 1 MB/min at 128 kbps Vorbis, таму большасць загружаных файлаў не перавышае 500 МБ. Бесплатныя рахункі могуць транскрыптаваць да 5 хвілін за загрузку. Плацежныя планы даюць да 2 гадзін. Калі вы перавышаеце столькі ж на доўгія файлы, глядзіце на інструмент audiobook / longform, які апрацоўвае шматгадзінную транскрыпцыю.

Так - Faster Whisper падтрымлівае 99 моў і аўтаматычна вызначае мову гучання ў вашым файле OGG. Вы таксама можаце прымусіць выкарыстанне пэўнай мовы зыходнага коду праз дадатковыя налады, калі аўтаматычнае выяўленне выбірае няправільную мову (часта з акцэнтаванай англійскай, якая непасрэдна не з' яўляецца роднай мовай слухача, або з вельмі кароткімі кліпамі).

Так - транскрыпцыя ўключае ў сябе часопісы сегментаў і часопісы на ўзроўні словаў, экспартаваныя як SRT або VTT разам з тэкставай версіяй. Злучыце SRT з арыгінальным OGG (або пераўтвораным MP4) і вы атрымаеце здымак з субтытрамі, гатовы да публікацыі.

Так. Уключыце дыяграму гукавых дысплеяў у дадатковых наладах, і наш канвеер запусціць pyannote.audio наверху Whisper, каб пазначыць кожны дынамік. Для лепшых вынікаў на OGG, даць нам прыблізна 30 секунд гуку, каб дыяграма мела дастаткова семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных семантрычных сем

Не. Наш транскрыптар апрацоўвае OGG без прамежкаў - пераўтварэнне ў MP3 спачатку дадасць кропку перакодавання (патэнцыйна з стратамі) і марнаваць ваш час. Адным выключэннем з' яўляецца тое, што калі ваш файл OGG выкарыстоўвае незвычайны кодэк, які наш дэкадэр не распазнае (рэдка); мы паведамім вам пра гэта пры загрузцы і вы можаце пераўтварыць яго праз наш бясплатны Аудыа Канвэртар.

Так, гэта найбольш распаўсюджаны спосаб загрузкі для OGG. Хутчэйшы Шыптал можа працаваць з чыстымі запісамі, шумнымі запісамі і акцэнтаванай мовай - вам не трэба спачатку чысціць гук. Калі дакладнасць не тое, чаго вы чакаеце, запусціце файл праз наш Audio Enhancer (бясплатна на адзін праход), каб выдаліць фонавы шум, а затым паспрабуйце зноў транскрыпцыю.

Транскрыпцыя бясплатная для файлаў менш за 5 хвілін. Плацежныя планы выкарыстоўваюць ~1000 знакаў на хвіліну з OGG гукавых файлаў. 60- хвілінная сустрэча транскрыптуецца на 60000 знакаў; 3- хвілінная галасавая запіска бясплатная. Заўвага: калі ваш файл у асноўным змяшчае цішыню (напрыклад, доўгія перапынкі ў запісе сустрэчы), уключыце выяўленне галасавой дзейнасці, каб прапусціць цішыню і плаціць толькі за часткі гаворкі.

Так. Выцягнутыя OGG файлаў апрацоўваюцца на нашых серверах GPU і аўтаматычна выдаляюцца праз 2 дні. Мы ніколі не захоўваем гук доўгатэрмінова, не трэніруем мадэлі на дадзеных карыстальніка і не падзяляем іх з трэцімі асобамі. Транскрипт застаецца ў вашым рахунку столькі, колькі вы хочаце.

Так. Выправіць ваш файл OGG у / api/ v1/ transcribe / як шматчасткавы файл з аўдыё файлам у полі `file`. Адказ уключае транскрыпт, час сегмента, дадатковыя час на ўзроўні слова, і UUID задання, які вы можаце праверыць для URL экспарту SRT/ VTT. Даступна для ўсіх платных планаў.
5.0/5 (1)

Што мы можам палепшыць? Ваша ацэнка дапаможа нам выправіць праблемы.

Транскрыпцыя аўдыё з AI

Атрымайце дакладныя транскрыпцыі на 99 мовах. Зарэгіструйцеся бясплатна і атрымайце 15 крэдытных балаў, каб пачаць.