ژباړې پالنه

په 99 ژبو کې غونډې، مرکې، کورسونه، پوډکاسټونه، طبي ډیکټیشن، او قانوني پروسې نقل کړئ. د ګړندۍ وسپنې (د OpenAI وسپنې څخه 4x چټک) او د احساس کشف سره SenseVoice لخوا چلول کیږي.

ناستې مرکې طبي قانوني ژبې

لېږل هڅه کول

خپل دوتنه دلته ځغلول او پرېښودل، يا لټول

MP3, WAV, FLAC, OGG, M4A, MP4. Max 50MB.

file.mp3

0 MB
...ليکل کيږي

غږيز لېښل کيږي...

لېښل شوی

AI لېږل ځانګړتياوې

د هرې کارونې قضیې لپاره دقیق ، ګړندی ، او ارزانه وینا-د متن لپاره

د ژبې ملاتړ

په 99 ژبو کې د ویسپ او چټک ویسپ سره غږیز نقل کړئ. د کراس ژبې کاري جریان لپاره د انګلیسي ژباړې شامل دي.

4x چټک پروسس

Faster Whisper په 4x سرعت او ټیټ حافظې کارولو کې د OpenAI Whisper په څیر ورته دقت وړاندې کوي.

مهالشمېرنې او برخې

د دقیق حوالې لپاره د کلمې کچه او د برخې کچه timestamps. د ویډیو سرلیکونو لپاره timestamped transcripts صادر کړئ.

احساس کشفول

SenseVoice د شتمنو میټا ډاټا لپاره د ژباړې سره سم د وینا کونکي احساسات، غږیز پیښې او احساسات کشف کوي.

د ويناوال پېژند

د وینا کونکي ورځپاڼې لیبلونه څوک چې په څو ګډون کونکو ریکارډونو کې څه وویل لکه غونډې او مرکې.

ګڼ برېښنالیکونه

د عادي متن، SRT سرلیکونو، VTT سرلیکونو، یا JSON سره د بشپړ میټا ډاټا په توګه صادر کړئ. د هر پلیټ فارم لپاره چمتو.

ليکنې ته وينا بېلګه

د صنعت مخکښ لیږد انجنونه

Faster WhisperFaster Whisper

4x faster than Whisper with CTranslate2 optimization, same accuracy.

/5

د: لپاره غوره غوره عمومي - د Whisper څخه 4x چټک، ورته دقت، د ډیری کارونې قضیو لپاره سپارښتنه کیږي

هڅه Faster Whisper

WhisperWhisper

OpenAI's robust speech recognition model supporting 99 languages.

/5

د: لپاره غوره د OpenAI لخوا د قوي 99 ژبې ملاتړ او ژباړې سره د حوالې ماډل

هڅه Whisper

SenseVoiceSenseVoice

Speech understanding model with emotion detection, 50+ languages.

/5

د: لپاره غوره د احساس کشف او د غږیز پیښې تحلیل سره د لیږد سره

هڅه SenseVoice

څنګه د AI سره آډیو لیږدول

په ثانیو کې پورته کول، لیږدول او صادرول

1

غږيز يا ويډيو لېښل

MP3، WAV، M4A، OGG، FLAC، یا ویډیو دوتنې تر 50MB پورته. د ټولو عام بڼو ملاتړ کوي.

2

بېلګه او ژبه وټاکﺉ

غوره د سرعت لپاره چټک Whisper، د ژباړې لپاره Whisper، یا د احساس کشف SenseVoice. د سرچینې ژبه وټاکئ.

3

لېښل

پروسس ثانیو ته د دوتنې د اوږدوالي پورې اړه لري دقیقې نیسي. د رښتیني وخت پرمختګ تازه.

4

کتنه او بهرول

د لیږد کتنه، د اړتیا په صورت کې سمول، او د متن، SRT، VTT، یا JSON په توګه د وخت سره صادرول.

د هر صنعت لپاره د لېږد

د مسلکي لپاره د موخو لپاره جوړ شوي کاري جریانونه

د سوداګرۍ غونډې

د زوم، ټیمونو او ګوګل میټ ریکارډونه په اتوماتيک ډول نقل کړئ. د وینا کونکي پیژندنې، وختونو او عمل توکو سره دقیق غونډې یادونه ترلاسه کړئ. د هرې غونډې پلیټ فارم څخه ریکارډونه پروسس کړئ - یوازې د آډیو یا ویډیو فایل پورته کړئ.

  • د ګڼ ګډون کوونکي اړيکنيو لپاره د ويناوال ليدنه
  • د کتنې لپاره مهالشمېرنې ليکنې
  • د ټولو غونډو د ثبت بڼې ملاتړ کوي
  • د غونډې د ارشيو لپاره ډله پروسس

ژورنالېزم او مرکې

د 95٪ + دقت سره مرکې، مطبوعاتي کنفرانسونه، او د ساحې ریکارډونه نقل کړئ. چټک Whisper د غږیز چاپیریال او څو ویناوالو سره معامله کوي. د دقیق حوالې او حقیقت چک کولو لپاره د کلمې کچه timestamps ترلاسه کړئ.

  • د يادښت لپاره د ويې کچ مهالشمېرنې
  • ږغ-غښتلی لېږل
  • د نړیوالو راپورونو لپاره د 99 ژبې ملاتړ
  • په انګلیسي ژباړه شامل

طبي ژباړه

د طبي ډیکټیشن، د ناروغ مشورې، او کلینیکي یادداشتونه نقل کړئ. د وسپنې پر بنسټ ماډلونه د لوړ دقت سره د طبي اصطلاحاتو اداره کوي. د SOAP یادداشتونه، جراحي راپورونه، او د غږ ریکارډونو څخه د ناروغ تاریخي کیسې پروسس کړئ.

  • طبي اصطلاحات
  • يادښت بڼول SOAP
  • HIPAA-aware پروسس
  • ليکنې ته د ليکنې کاري بهيرونه

قانوني لېږل

transcribe depositions, court proceedings, client meetings, and legal dictation. د قضیې اسنادو لپاره د سکرین لیبلونو او timestamps سره دقیق نقلونه ترلاسه کړئ. زموږ ماډلونه د قانوني اصطلاحاتو او رسمي ژبې نمونې اداره کوي.

  • د غږوونکي نښلېدلې ليکبڼې
  • قانوني اصطلاحات دقت
  • د سپارښتنې لپاره مهال ټاکل شوی
  • د ډکولو پروسس

اکاډمیک او څېړنه

د اکاډمیک مینځپانګې لټون وړ آرشیفونه رامینځته کړئ. SenseVoice د کیفیتي څیړنې تحلیل لپاره احساس او احساس کشف اضافه کوي.

  • د کورسونو او سيمينارونو نقلول
  • د څېړنې د مرکې پروسس
  • د کيفيت څېړنې احساس کشف
  • څو ژبه اکاډمیک منځپانګې

منځپانګې او رسنۍ

د ویډیو لپاره سرلیکونه او سرلیکونه رامینځته کړئ، د پوډکاسټونو لپاره د پوډکاسټونو نقل کړئ، او د آډیو آرشیفونو څخه د لټون وړ متن رامینځته کړئ. د هر پلیټ فارم لپاره په SRT، VTT، یا ساده متن بڼه کې صادر کړئ.

  • څېرمه سرليکونه بهرول SRT/VTT
  • پوډکاسټ ښودلو يادښتونو توليد
  • د یوټیوب / ټیکټوک لپاره ویډیو سرلیکونه
  • د غږيز ارشيو شمېريزول

د ژباړې انجن پرتله کول

ستاسو د اړتیاو لپاره سم ماډل غوره کړئ

بېلګه چټکتيا ژبې ځانګړې ځانګړتياوې لپاره غوره
Faster Whisper ۴x چټک 99 VAD چاڼ، ډله پروسس ډیری کارونې قضیې (سپارښتنه کیږي)
Whisper تلواله 99 ژباړه انګليسي، timestamps د ژباړې دندې، د حوالې دقت
SenseVoice ګړندی 50+ احساس کشف، غږیز پیښې، غږیز تحلیل څېړنه، احساس تحلیل

د ژباړې دقت او فعالیت

95%+

انګريزي دقت

99

ملاتړي ژبې

4x

د ويې ويلو نه چټک

2hr

ټولوجګه غږيز اوږدوالی

لېږل API

په خپل غوښتنلیک کې د ژباړې ادغام

پېټېن (غږيزه دوتنه لېږل) REST API
import requests

with open("meeting_recording.mp3", "rb") as f:
    response = requests.post("https://api.tts.ai/v1/stt", files={
        "audio": f
    }, data={
        "model": "faster-whisper",
        "language": "en",
        "timestamps": "true"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

result = response.json()
print(result["text"])       # Full transcription
print(result["segments"])   # Timestamped segments

ډېرې پوښتنې

د AI لیږد په اړه عام پوښتنې

زموږ ماډلونه په روښانه انګلیسي وینا کې د 95٪ + دقت ترلاسه کوي. دقت د ژبې، آډیو کیفیت، او پس منظر غږ لخوا توپیر لري. چټک ویسپ او ویسپ د معلوماتو په 680،000 ساعتونو کې روزل شوي او د پاکو ریکارډونو په اړه د انساني کچې دقت ته نږدې کیږي.

وړیا کاروونکي کولی شي د 5 دقیقو پورې لیږد کړي. د تادیې پلانونه د هر فایل لپاره د 2 ساعتونو پورې ملاتړ کوي. د اوږدو ریکارډونو لپاره، API د باچ پروسس ملاتړ کوي چیرې چې تاسو کولی شئ د پروګرام فایلونه ویشئ او پروسس کړئ.

هو. د ويناوالو diarization په نقل کې د مختلفو ويناوالو پیژندنه او لیبلونه کوي. دا د روښانه غږ سره غوره کار کوي چیرې چې ويناوال بدلونونه کوي. د وينا پرتله کول ممکن دقت کم کړي.

د مهم طبي یا قانوني لیږد لپاره، موږ د دقت لپاره د محصول بیاکتنه سپارښتنه کوو ځکه چې هیڅ اتومات سیسټم د تخصصي شرایطو سره 100٪ دقیق نه دی.

هو. د دقیق وخت سره د SRT یا VTT فرعي فایلونو په توګه نقلونه صادر کړئ. دا فایلونه په مستقیم ډول د یوټیوب، ویمیو، یا کوم ویډیو پلیټ فارم ته پورته کیدی شي چې د معیاري فرعي فورمو ملاتړ کوي.

هو. زموږ REST API د ډله ایز لیږد، د ریښتیني وخت لیږد، او د ویبووک خبرتیاوې ملاتړ کوي. د / v1 / stt پای ټکي ته آډیو فایلونه واستوئ او د وختونو سره لیږدول شوي متن ترلاسه کړئ. په Python، JavaScript، او cURL کې د مثالونو لپاره د API اسناد وګورئ.

د Alibaba لخوا SenseVoice د لیږد څخه بهر ځي - دا د وینا کونکي احساسات کشف کوي (خوشحاله، غمجن، غصه)، آډیو پیښې (خندا، تشویق، موسیقۍ)، او د آډیو مینځپانګې په اړه بډایه میټا ډاټا چمتو کوي. دا د 50 + ژبو ملاتړ کوي. دا وکاروئ کله چې تاسو یوازې د متن څخه ډیر اړتیا لرئ.

د غوره پایلو لپاره، د لوی ماډل اندازه وکاروئ او زموږ د آډیو Enhancer وسیلې له لارې د آډیو چلول په پام کې ونیسئ ترڅو د لیږدولو دمخه غږ کم کړي.

API د نږدې ریښتیني وخت کارولو قضیو لپاره د سټرینګ لیږد ملاتړ کوي. د آډیو ټوټې لیږل لکه څنګه چې دوی ریکارډ شوي او د لیږد پایلې په تدریجي ډول ترلاسه کیږي. دا د ژوندی سرلیکونو، غونډې یادونو او د لاسرسي غوښتنلیکونو لپاره ښه کار کوي.

هو. Whisper او Faster Whisper د ژباړې په موده کې شامل دي چې د 99 ملاتړ ژبو او په انګليسي کې د متن outputs په کوم کې چې غږيز transcribes. دا د يو جلا ژباړې ګام پرته د بهرني ژبې د مینځپانګې د پوهېدو لپاره ګټور دی.

د غوره دقت لپاره ترټولو لوی ماډل اندازه وکاروئ. کله چې ممکنه وي، پاک، لوړ کیفیت آډیو چمتو کړئ. د تکراري تخصصي شرایطو لپاره، تاسو کولی شئ د لټون او ځای په ځای کولو سره د نقل پروسس کړئ ترڅو د عام ډومین ځانګړي ناسم پیژندنه سم کړي.

تاسو کولی شئ MP4، MOV، AVI، MKV، او WebM ویډیو دوتنې ولولئ. د سیستم په اتوماتيک ډول د ژباړې لپاره د غږيزه څنډه استخراجوي. دا دا اسانه کوي چې پرته له لاسي غږيزه استخراجول په مستقیم ډول د ویډیو مینځپانګې څخه subtitles یا transcripts توليد کړي.
5.0/5 (1)

د ليکلو لپاره چمتو ياست؟

99 ژبې، 95٪ + دقت، فوري پایلې. هیڅ کریډیټ کارت ته اړتیا نشته.