Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

Mes dar neturime TTS balsų jūsų kalba. Padėk mums pridėti savo! Parduoti savo balsą

Iškelti garsą ar vaizdo įrašą

Vilkite ir meskite failą čia, arba naršyti

Palaiko MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Nemokamai iki 500 MB · Pro iki 2 GB.

file.mp3

0 MB
— arba įrašyti iš savo mikrofono —
00:00

Nustatymai

1,000/min simboliai Užsiregistruoti takelių naudojimui

Perrašas

Įkelkite garso ar vaizdo failą ir spustelėkite Atšaukti norėdami pradėti

Tai gali užtrukti akimirką.

Aptikta:

Kaip tai veikia

1. Įkelkite garso ar vaizdo įrašą

Įkelkite garso ar vaizdo failą. Mes palaikome MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV ir MKV formatus iki 100MB.

2. AIS perrašinėjimai

Mūsų AI modeliai apdoroja jūsų garsą, nustato kalbą, identifikuoja garsiakalbius ir generuoja tikslų tekstą su žymomis.

3. Gaukite savo transkripciją

Kopijuoti savo stenogramą arba atsisiųsti jį į TXT arba SRT subtitrų formatą. Redaguoti ir tobulinti, jei reikia.

Naudojimo atvejai

Garso transkripcija kiekvienai pramonei ir darbo srauto

Posėdžiai ir konferencijos

Automatiškai transliuoti Zoom, Teams, and Google Meets įrašus. Daugiau niekada nepraleisti veiksmo elemento. Eksportuoti kaip posėdžio užrašus ar subtitrus.

Pokalbiai ir žurnalistika

Perrašyti interviu straipsnius, mokslinių tyrimų dokumentus, ir dokumentinius. Kalbėtojas diarizacija nustato, kas sakė, ką lengva priskirti.

Tinklalaidės ir medijos

Generuokite transkriptus ir parodykite užrašus podcast epizodams. Sukurkite ieškomus savo garso turinio archyvus. Pridėti subtitrai vaizdo podcast.

Paskaitos ir švietimas

Konvertuokite įrašytas paskaitas į studijų pastabas. Padaryti edukacinį turinį prieinamas su tiksliomis antraštėmis. Padėkite studentams su klausos sutrikimų.

„YouTube“ ir socialinė žiniasklaida

Generuokite subtitrus ir uždarus pavadinimus YouTube video, TikToks, ir socialinės medijos turinį. Pagerinkite prieinamumą ir SEO su tiksliais transkriptais.

Teisinis & Medicina

Atsekti nusėdimus, klausymus, konsultacijas, ir dictation. Tikslus timestamp reikšmės už nuorodą. Eksportuoti formatais tinka dokumentais.

Palaikomi formatai

Perrašyti bet kokį garso ar vaizdo failą — mes ištraukiame garso automatiškai

Garso formatai

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Vaizdo formatai

MP4 WebM AVI MOV MKV WMV FLV M4V

Garso automatiškai ištraukiamas iš vaizdo failų transkripcijos.

Perrašymo modeliai

Whisper

„OpenAI“ tvirtas kalbos atpažinimo modelis, palaikantis 99 kalbas.

  • 99 kalbos
  • Vertimas
  • Laikraščiai
  • Triukšmas ir triukšmas
OpenAI

Faster Whisper

4x greičiau nei Whisper su C Translate2 optimizavimas, toks pat tikslumas.

  • 4x greičiau
  • Apatinė atmintis
  • Visų modelių dydžiai
  • Partijos perdirbimas
  • VAD filtravimas
SYSTRAN

SenseVoice

Kalbų supratimas modelis su emocijų aptikimas, 50+ kalbos.

  • 50+ kalbų
  • Emocijos aptikimas
  • Garso įvykiai
  • Kalbėtojo analizė
  • Turtingi metaduomenys
Alibaba (FunAudioLLM)

Dažnai užduodami klausimai

Įkelkite savo OGG failą tiesiogiai – nereikia konvertavimo. Mūsų transkripcija dekoduoti Vorbis (open-source patent-free) srautą, siunčia jį Faster Whisper ant GPU, ir grąžinkite žymetą transkripciją kartu su neprivalomu SRT ir VTT subtitrų eksportas.

OGG is Vorbis (open-source patent-free). It is most commonly produced by open-source applications, game engines, Wikipedia audio, and Linux-recorded files.

OGG yra nuostolingas (Vorbis (open-source patent-free)), bet nuostoliai atsitinka garso juostose, kurios neneša daug kalbos informacijos. Greičiau Whisper tranzitai 96-256 kbps Vorbis at 96-256 kbps Vorbis per ~1% WAV tikslumas tame pačiame šaltinio įraše. Tikras tikslumas grindys yra originalus įrašymo kokybė (mic, kambarys, garsiakalbis aiškumas), o ne OGG kodekas.

OGG failai paprastai yra 1 MB/min at 128 kbps Vorbis, todėl dauguma įkelia žemės gerokai žemiau mūsų 500 MB lubų. Nemokama paskyros gali transkripcija iki 5 minučių už įkeldymą. Mokami planai eiti iki 2 valandų. Jei esate suimti lubų ilgų failų, žiūrėkite garso knygą / ilgų formų įrankis, kuris tvarko kelių valandų transkripcija.

Taip — Greitesnis Whisper palaiko 99 kalbas ir automatiškai aptinka kalbėtą kalbą jūsų OGG failas. Taip pat galite priversti tam tikrą šaltinio kalbą per pažangius nustatymus, jei auto-aptikimas parenka neteisingą vieną (dažnai su akcentuota anglų neteisingai klasifikuojama klausytojo gimtąja kalba, arba su labai trumpų klipų).

Yes — the transcript includes segment timestamps and word-level timestamps, exported as SRT or VTT alongside the plain-text version. Pair the SRT with the original OGG (or a converted MP4) and you have a subtitled clip ready to publish.

Taip. Įjungti garsiakalbio diarizaciją sudėtingesniuose nustatymuose ir mūsų vamzdynas veikia pyannote.audio ant Whisper pažymėti kiekvieną garsiakalbį. Dėl geriausių rezultatų OGG, suteikti mums ne mažiau kaip 30 sekundžių garso, todėl diarizatorius turi pakankamai pavyzdžių klasterių balso atspaudus. Dviejų garsiakalbių įrašai gauti tiksliausią žymėjimą.

Ne. Mūsų Transkliber rankenos OGG tiesiogiai — konvertavimo į MP3 pirmą kartą būtų pridėti re-kodavimo žingsnis (galbūt nuostolingas) ir švaistyti savo laiką. Viena išimtis yra, jei jūsų OGG failas naudoja neįprastą kodekas mūsų dekoderis neatpažįsta (retas); mes pasakysime, kad įkeldami ir galite konvertuoti per mūsų nemokamai Audio Converter.

Taip, tai yra labiausiai paplitęs įkėlimo modelis už OGG. Greičiau Whisper rankenos švarūs įrašai, triukšmingi, ir akcentuotas kalba — jums nereikia išvalyti garso pirmiausia. Jei tikslumas nėra tai, ko tikiesi, paleisti failą per mūsų garso stiprintuvas (laisvas už vieną leidimą) pašalinti fono triukšmą, tada dar kartą bandyti transkripcija.

Perrašai yra nemokami iki 5 minučių. Mokami planai naudoja ~1000 simbolių per minutę OGG garso. 60 minučių susirinkimas transliuoja 60 000 simbolių; 3 minučių balso pranešimas yra nemokamas. 88 000- speciali pastaba: jei failas yra daugiausia tylus (pvz., ilgas pauzes posėdžio įraše), įgalinkite Balso aktyvumo aptikimą praleisti tylą ir mokėti tik už kalbėjimo sekcijas.

Taip. Įkelti OGG failai apdorojami mūsų GPU serveriuose ir automatiškai ištrinami per 2 dienas. Mes niekada saugoti garso ilgalaikių, traukinių modelius vartotojo duomenų, ar dalintis su trečiosiomis šalimis. Tranrakstas lieka jūsų paskyroje, kol norite.

Taip. Padėkite savo OGG failą į /api/v1/ trantractor/ kaip daugiadalį formos duomenis su garso failu ` faile' laukelyje. Atsakymas apima stenogramą, segmentų žymeles, neprivalomas žodžio lygio žymeles ir darbą UUID galite apklausti SRT/ VTT eksporto URL. Galima rasti visuose apmokėtuose planuose.
5.0/5 (1)

Ką mes galėtume pagerinti? Jūsų atsiliepimai padeda mums išspręsti problemas.

Atsekti garso ir vaizdo įrašą su AI

Gaukite tikslius transkripciją 99 kalbomis. Užsiregistruoti nemokamai ir gauti 15,000 simbolių pradėti.