Convert AVI to Text

Convert AVI video files to text with AI. Transcribe legacy video recordings to accurate text. Free online AVI transcription.

เรายังไม่มีเสียง TTS ในภาษาของคุณ ช่วยเราเพิ่มเสียงของคุณด้วย! ขายเสียงของคุณ

โหลดเพลงหรือวิดีโอ

ลากและวางแฟ้มของคุณที่นี่ หรือ แสดงหน้าต่าง

รองรับ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. ฟรี สูงสุด 500 MB · โปร สูงสุด 2GB

แฟ้ม.mp3

0 MB
หรือบันทึกจากไมโครโฟนของคุณ
00:00

ตั้งค่า

1,000/min ตัวอักษร ลงทะเบียน ใช้การติดตามการใช้งาน

คำแปล

โหลดแฟ้มเสียงหรือวิดีโอ และคลิกที่ ป้อนเพื่อเริ่ม

กำลังแปล อาจใช้เวลาสักครู่

ตรวจพบ:

มันทำงานอย่างไร

1. โหลดเพลงหรือวิดีโอ

โหลดแฟ้มเสียงหรือวิดีโอของคุณ เรารองรับรูปแบบ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV และ MKV ขนาดสูงสุด 100MB

2. AI เขียนแปล

โมเดล AI ของเรา ประมวลผลเสียงของคุณ ตรวจจับภาษา ระบุผู้พูด และสร้างข้อความที่ถูกต้อง ด้วยเวลาสแกน

3. เอาใบรับรองมา

คัดลอกหรือดาวน์โหลดมันเป็นรูปแบบ TXT หรือ SRT คำอธิบาย แก้ไขและปรับปรุงตามความต้องการ

กรณีการใช้

การบันทึกเสียงสำหรับทุกอุตสาหกรรมและกระบวนการทำงาน

การประชุมและสัมมนา

เขียนบันทึก Zoom, Teams และ Google Meet ออกมาเอง ไม่เคยพลาดกิจกรรมใดๆ อีกแล้ว ส่งออกเป็นข้อความหรือคำอธิบายของการประชุม

สัมมนาและนักข่าว

เขียนบทสัมภาษณ์ สำหรับบทความ บทความวิจัย และสารคดี นักพูด diarization ระบุว่าใครพูดอะไรเพื่อการอ้างอิงง่าย

พอดแคสต์และสื่อ

สร้างการตีความและแสดงบันทึกสำหรับโพดำ สร้างแฟ้มสำรองข้อมูลที่สามารถค้นหาได้ของเนื้อหาเสียงของคุณ เพิ่มคำอธิบายในโพดำวิดีโอ

บทบรรยายและการศึกษา

แปลงการบรรยายที่บันทึกไว้เป็นเอกสารเรียนรู้ ทำให้เนื้อหาทางการศึกษาเข้าถึงได้ด้วยคำอธิบายที่ถูกต้อง สนับสนุนนักเรียนที่มีปัญหาเรื่องการได้ยิน

สื่อมวลชนทางสังคมName

สร้างคำอธิบายและคำบรรยายปิดสำหรับวิดีโอ YouTube, TikToks และเนื้อหาโซเชียลมีเดีย ปรับปรุงความสามารถในการเข้าถึงและ SEO ด้วยการตีพิมพ์ที่แม่นยำ

กฎหมายและแพทย์Name

เขียนคำให้การ, การฟัง, การปรึกษา, และการอ่านคำพูด ตราเวลาที่แม่นยำสำหรับการอ้างอิง ส่งออกในรูปแบบที่เหมาะสมสำหรับเอกสาร

รูปแบบที่รองรับ

เขียนแฟ้มเสียงหรือวิดีโอใดๆ ออกมา — เราจะดึงเสียงออกมาโดยอัตโนมัติ

รูปแบบเสียง

MP3 WAV FLAC OGG M4A AAC WMA OPUS

รูปแบบวิดีโอ

MP4 WebM AVI MOV MKV WMV FLV M4V

เสียงจะถูกดึงออกมาจากแฟ้มวิดีโอโดยอัตโนมัติเพื่อบันทึก

โมเดลการแปลภาษา

Whisper

โมเดลการรับรู้การพูดที่แข็งแกร่งของ OpenAI รองรับ 99 ภาษา

  • ภาษา 99 ภาษา
  • การแปลภาษา
  • ตราเวลา
  • แข็งแรงต่อเสียงรบกวน
OpenAI

Faster Whisper

4x เร็วกว่า Whisper ด้วยการปรับปรุง CTranslate2 ความแม่นยำเท่ากัน

  • เร็วขึ้น4เท่า
  • หน่วยความจำต่ำ
  • ขนาดแบบจำลองทั้งหมด
  • การประมวลผลเป็นกลุ่ม
  • การกรอง VAD
SYSTRAN

SenseVoice

แบบจำลองการเข้าใจคำพูด ด้วยการตรวจจับอารมณ์ 50+ ภาษา

  • ภาษา
  • การตรวจจับอารมณ์
  • เหตุการณ์เสียง
  • การวิเคราะห์ตัวเล่าเรื่อง
  • ข้อมูลกำกับภาพ
Alibaba (FunAudioLLM)

คำถามที่ถามบ่อย

โหลดแฟ้ม AVI ของคุณ เครื่องแปลภาษาของเราจะดึงข้อมูลเสียงจากแฟ้ม a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container ส่งไปยัง Faster Whisper บน GPU และส่งกลับมาเป็นแปลภาษาที่ระบุเวลาพร้อมกับการส่งออกคำอธิบาย SRT และ VTT ตามความต้องการ คุณไม่ต้องทำการดึงเสียงออกมาเอง — มันจะทำได้จากเซิร์ฟเวอร์

AVI คือ a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container มันเป็นสิ่งที่ผลิตโดย older Windows recordings, camcorder exports, and legacy video archives

AVI มีการสูญเสีย (a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container) แต่การสูญเสียเกิดขึ้นในวงจรเสียงที่ไม่สามารถบันทึกข้อมูลการพูดได้มากนัก Faster Whisper จะบันทึก AVI ที่ highly variable — depends on the embedded codec ภายใน ~ 1% ของความแม่นยำของ WAV บนแหล่งที่มาเดียวกัน ความแม่นยำที่แท้จริงคือคุณภาพการบันทึกต้นฉบับ (ไมโครโฟน, ห้อง, ความชัดเจนของลำโพง) ไม่ใช่โค้ดเอกซ์โคเดก AVI

แฟ้ม AVI ส่วนใหญ่จะมีขนาด 20-100 MB/min depending on codec ดังนั้น จำนวนการอัพโหลดส่วนใหญ่จะอยู่ในขอบเขตของขนาด 500 MB ของเราได้ ส่วนบัญชีฟรีสามารถอัพโหลดได้ถึง5นาทีต่อครั้ง ส่วนบัญชีจ่ายสูงสุด2ชั่วโมง หากคุณต้องการใช้เวลาในการอัพโหลดที่ยาวนาน โปรดดูที่ เครื่องมือหนังสือเสียง/ แบบฟอร์มยาว ซึ่งสามารถจัดการการอัพโหลดได้หลายชั่วโมง

ใช่ — Faster Whisper รองรับภาษา 99 ภาษา และตรวจจับภาษาที่พูดในแฟ้ม AVI ของคุณโดยอัตโนมัติ คุณยังสามารถบังคับให้ใช้ภาษาต้นฉบับที่กำหนดเองได้ ผ่านการตั้งค่าระดับสูง หากการตรวจจับอัตโนมัติเลือกภาษาที่ผิด (เป็นเรื่องปกติกับภาษาอังกฤษที่มีสำเนียงที่ถูกจัดประเภทผิดว่าเป็นภาษาแม่ของผู้ฟัง หรือกับคลิปที่ยาวมาก)

เราจะส่งแฟ้มคำบรรยาย SRT และ VTT กลับมาพร้อมกับข้อความธรรมดาที่แปลออกมา หากต้องการฝังมันไว้ในแฟ้ม AVI ของคุณ ให้ใช้เครื่องมืออย่าง ffmpeg หรือ HandBrake เพื่อทำการมักซ์ SRT/VTT เป็นแทร็กคำบรรยายแบบซอฟต์ เราจะไม่เข้ารหัสวิดีโอเองอีกครั้ง - มันจะทำให้เกิดการสูญเสีย

ใช่ เปิดการทำบันทึกเสียงในลำโพงในการตั้งค่าระดับสูง และระบบท่อของเราจะทำงาน pyannote.audio บน Whisper เพื่อทำการติดป้ายทุกลำโพง สำหรับผลลัพธ์ที่ดีที่สุดบน AVI ให้เรามีเสียงอย่างน้อย 30 วินาที เพื่อให้เครื่องทำบันทึกเสียงมีตัวอย่างเพียงพอที่จะทำการติดป้ายเสียง การบันทึกด้วยลำโพงสองตัวจะทำให้การติดป้ายถูกต้องที่สุด

ไม่ เครื่องแปลภาษาของเราจะจัดการกับ AVI โดยตรง — การแปลเป็น MP4 ก่อน จะเพิ่มขั้นตอนการเข้ารหัสใหม่ (อาจจะสูญเสียข้อมูล) และทำให้เสียเวลาของคุณไป ยกเว้นเพียงอย่างเดียวคือ หากแฟ้ม AVI ของคุณใช้โค้ดเอกสารที่แปลกประหลาด ซึ่งเครื่องแปลภาษาของเราไม่สามารถรับรู้ได้ (หายาก) เราจะบอกคุณเมื่ออัปโหลด และคุณสามารถแปลผ่านเครื่องแปลเสียงฟรีของเรา

ใช่ นี่คือรูปแบบการอัพโหลดที่ใช้กันมากที่สุดสำหรับ AVI Faster Whisper สามารถจัดการการบันทึกเสียงที่สะอาด, เสียงรบกวน, และเสียงที่เน้นเสียง - คุณไม่ต้องทำความสะอาดเสียงก่อน หากคุณไม่คาดหวังความแม่นยำ โปรดใช้โปรแกรมปรับแต่งเสียงของเรา (ฟรีสำหรับครั้งเดียว) เพื่อลบเสียงรบกวนจากพื้นหลัง แล้วลองทำการตีความใหม่

การแปลเป็นภาษาอังกฤษฟรีสำหรับแฟ้มที่ใช้เวลาน้อยกว่า5นาที แพ็คเกจที่จ่ายค่าใช้จ่ายใช้ ~1,000 ตัวอักษรต่อนาทีของเสียง AVI ตัวอักษร การประชุม 60 นาที มีการแปลเป็นภาษาอังกฤษ 60,000 ตัวอักษร ส่วนเมมโมรี่เสียง3นาที ใช้ได้ฟรี ข้อควรจำสำหรับ AVI: หากแฟ้มของคุณมีเสียงเงียบอยู่ส่วนใหญ่ (เช่น การหยุดชะงักนานในการบันทึกการประชุม) ให้เปิดใช้งานการตรวจจับกิจกรรมการพูดเพื่อข้ามช่วงที่เงียบไป และจ่ายค่าใช้จ่ายเฉพาะส่วนที่พูดเท่านั้น

ใช่ แฟ้มที่อัพโหลด AVI แฟ้ม จะถูกประมวลผลบนเซิร์ฟเวอร์ GPU และจะถูกลบออกโดยอัตโนมัติภายใน2วัน เราจะไม่เก็บเสียงไว้นานๆ ฝึกแบบจำลองบนข้อมูลผู้ใช้ หรือแบ่งปันกับบุคคลที่สาม ข้อความที่แปลไว้จะอยู่ในบัญชีของคุณ ตราบเท่าที่คุณต้องการ

ใช่ โปรดส่งแฟ้ม AVI ของคุณไปยัง /api/v1/transcribe/ ในรูปแบบข้อมูลแบบหลายส่วน จุดจบจะรับวิดีโอโดยตรง — ไม่จำเป็นต้องดึงเสียงออกมาก่อน; ffmpeg จะจัดการการแปลงแบบ demox ด้านเซิร์ฟเวอร์ คำตอบจะรวมถึงการแปลงเสียง, สแตมป์เวลา และ UUID ของงานที่คุณสามารถโพลล์เพื่อส่งออก URL ของ SRT/VTT
5.0/5 (1)

เราจะปรับปรุงอะไรได้บ้าง ความคิดเห็นของคุณช่วยเราแก้ไขปัญหา

เขียนแปลงเสียงและวิดีโอด้วย AI

ได้รับการแปลที่ถูกต้องใน 99 ภาษา ลงทะเบียนฟรีและได้รับ 15,000 ตัวอักษรที่จะเริ่มต้น