Report Bug / Feature Request

Изказване към текст

Transcribe audio и video за текст с AI. Подкрепя 99 езика, часове, и разпознаване на говорителя.

Все още нямаме ТТС гласове на вашия език. Помогнете ни да добавим вашия! Продажби на гласа си

Качване на аудио или видео

Изтегляне и изтегляне на файла тук, или преглеждане

Подкрепя MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Макс 100MB.

file. mp3

0 MB
— или запис от микрофона си —
00:00

Настройки

1,000/min символи Запиши се. за проследяване на използването

Транкрипция

Качете аудио файл и кликнете на Transcribe за да започнете

Преписване на аудио... това може да отнеме малко време.

Открито:

Как действа

1. Качване на аудио

Качете аудио или видео файл. Ние подкрепяме MP3, WAV, FLAC, OGG, M4A, MP4, и WebM формати до 100MB.

2. AI Преписвачи

Нашите AI модели обработват вашия аудио, откриване на езика, идентифициране на говорителите, и генериране на точен текст с времеви табели.

3. Вземи си текста

Копиране на транскрипцията си или го изтегли като TXT или SRT формат на субтитри. Редактиране и усъвършенстване, ако е необходимо.

Случаи за използване

Реч до текст за всяка индустрия и работен поток

Събрания и конференции

Автоматично записване на Zoom, екипи и Google Срещнете записи. Никога повече не пропускайте запис за действие. Експортирайте като бележки за среща или субтитри.

Интервюта и журналистизъм

Преписване интервюта за статии, изследователски документи и документални филми. Диагностика на спикера идентифицира кой е казал какво за лесно присвояване.

Подкасти и медии

Генериране на транскрипти и показване на бележки за подкаст епизоди. Създаване на търсещи архиви на вашето аудио съдържание. Добавяне на субтитри към видео подкастове.

Лекции и образование

Преобразуване на записани лекции в учени бележки. Направи образователно съдържание достъпно с точни подписи. Подкрепи студенти с увреждане на слуха.

Медицинска диктация

Запазете часове ръчна документация с точност на AI.

Правно производство

Преписване на показания, изслушвания и срещи на клиенти. Точни часове за правни референции. Износ в формати, подходящи за съдебна документация.

Сравнение на моделите STT

Whisper

Моделът на OpenAI за разпознаване на речта, който поддържа 99 езика.

  • 99 езици
  • Превод
  • Отпечатъци
  • Напрегнат към шум
OpenAI

Faster Whisper

4x по-бързо от Whisper с CTranslate2 оптимизация, същата точност.

  • 4х по-бързо
  • По-ниска памет
  • Всички размери на модела
  • Пакетна обработка
  • филтриране на VAD
SYSTRAN

SenseVoice

Модел за разбиране на говора с откриване на емоции, 50+ езици.

  • 50+ езици
  • Откриване на емоции
  • Аудио събития
  • Анализ на спикера
  • Богати метадани
Alibaba (FunAudioLLM)

Планове за изказване-текст

Стартиране безплатно, ъпгрейд, когато се нуждаете от повече

Безплатен
  • 1-минутно ограничение на звука
  • По-бързо шепнещ модел
  • Основна транскрипция
  • 100+ езици
Най-популярното
Безплатна сметка
  • 30-минутен звук + 15 000 символа
  • Всички модели на STT
  • Часови знаци на нивото на думите
  • Износ на субтитри SRT и VTT
  • Диагностика на спикера
Запишете се безплатно
Професионален
  • 2- часови аудио файлове
  • Пакетна транскрипция
  • Приоритетна обработка
  • API достъп
  • Потребителски речник
Надграждане

Често задавани въпроси

Говор на текст (STT), наречен също автоматично разпознаване на речта (ASR), преобразува говорещия език в писмен текст. Нашите модели използват AI, за да транскритират звука от срещи, интервюта, подкасти, лекции и др.

По-бързо Whisper се препоръчва за повечето случаи на употреба — това е 4х по-бързо от оригиналния Whisper при запазване на същата точност. Използвайте SenseVoice, ако се нуждаете от емоционално откриване или аудио откриване на събития заедно с транскрипция.

Подкрепяме MP3, WAV, M4A, OGG, FLAC, WEBM и най-често срещаните аудио/видео формати. Максимален размер на файла е 50MB. За по-големи файлове, първо помисли за разделяне на аудиото.

Безплатни потребители могат да се записват до 5 минути аудио. Платените планове поддържат аудио файлове до 2 часа. За по-дълги записи, използвайте нашия API с пакетна обработка.

Нашите модели постигат 95% + точност на ясен английски език. Точността варира по езика, качеството на звука и задния шум. По-бързо Whisper и Whisper поддържа 99 езици с различни нива на точност.

Да, нашите усъвършенствани режими на транскрипция могат да идентифицират и етикетират различни говорители в аудиото. Диагностикацията на оратора е особено полезна за транскрипти, интервюта и подкастове с много хора, където трябва да знаете кой е казал какво.

Real-time transcreating transcreation е достъпен чрез нашия API с помощта на по-бързо Whisper. Аудио се обработва в парчета, тъй като пристига, предоставяне на частични транскрипти с ниска латентност. Това е идеално за живо подписване и приемане на бележки в реално време.

Да, нашият транскрипционен изход включва часове, които могат да бъдат изнасяни като SRT, VTT или ASS субтитри файлове. Това е идеално за добавяне на надписи към YouTube видео, онлайн курсове и социални медии съдържание.

Да, всички резултати от транскрипцията включват сегментни времеви табели по подразбиране. Часовете на нивото на думите са също налични, показвайки точното време за начало и край за всяка дума в звука.

По-бързо Whisper се обучава по различни аудио и се справя с умерен фонов шум добре. За много шумни записи, ние препоръчваме първо да се стартира аудио през нашия аудио усилвател, за да се подобри яснотата преди транскрипция.

Да, качени аудио файлове се обработват на нашите защитени GPU сървъри и автоматично изтрити, след като транскрипцията е завършена. Ние не съхраняваме, споделяме или използваме вашия аудио за целите на обучението. Всички трансфери са шифрирани.

Безплатни потребители могат да се записват до 5 минути аудио без цена. Платените планове използват символи въз основа на продължителността на звука: приблизително 1000 символа в минута на звук. Проверете нашата ценова страница за подробна информация за плана и символни опаковки.
5.0/5 (1)

Какво можем да подобрим? Твоята обратна връзка ни помага да решим проблемите.

Transcribe Audio с интелигентен интеллектуален интеллект

Вземете точни транскрипции на 99 езика. Регистрирайте се безплатно и получавате 15 000 символа за начало.