Report Bug / Feature Request

Konuşmadan MetneName

Ses ve videoyu AI ile metin haline çevirin. 99 dil, zaman damgası ve konuşan tespitini destekler.

Ses veya Video Yükle

Dosyanızı buraya çekin ve bırakın, ya da browse

MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Maksimum 100MB.

file.mp3

0 MB
— ya da mikrofonunuzdan kaydedin —
00:00

Ayarları

1,000/min karakter Kayıt ol Kullanım izleme

Çeviri

Bir ses dosyası yükleyin ve başlatmak için Çevir' e basın

Ses kaydediyor, biraz zaman alabilir.

Tespit edildi:

Nasıl Çalışıyor

Ses Yükle

Ses veya video dosyanızı yükleyin. 100MB'ye kadar MP3, WAV, FLAC, OGG, M4A, MP4 ve WebM biçimlerini destekliyoruz.

2. AI Transcribes

Yapay zeka modellerimiz seslerinizi işlemek, dil tespit etmek, konuşanları tanımlamak ve zaman damgalarıyla doğru metin üretmek için.

3. Metininizi Al

Çevirinizi kopyalayın ya da TXT ya da SRT altyazılı biçiminde indirin. Gerekirse düzenleyin ve iyileştirin.

Kullanım Durumları

Her endüstri ve iş akışı için konuşmadan metne

Toplantılar ve Konferansler

Zoom, Teams ve Google Meet kayıtlarını otomatik olarak kopyala. Bir daha hiçbir eylem maddesini kaçırma. Toplantı notları veya altyazıları olarak ihraç et.

Röportajlar ve Gazetecilik

Makaleler, araştırma makaleleri ve belgeseller için röportajları kopyala. Konuşmacı diarization kolay teşhis için kimin ne dediğini tanımlar.

Podcastler ve Medya

Podcast bölümleri için transkripler oluşturun ve notlar gösterin. Ses içeriğiniz için arama yapılabilir arşivler oluşturun. Video podcastlere altyazılar ekleyin.

Dersler ve Eğitim

Kayıtlı dersleri çalışma notlarına dönüştürün. Eğitimsel içeriği doğru altyazılar ile erişilebilir hale getirin. İşitme engelli öğrencileri destekleyin.

Tıp Diktatörü

Doktor-hasta görüşmelerini, klinik notları ve tıbbi dikteleri kopyalayın. Yapay zeka destekli doğrulukla saatlerce elle belgelemeden tasarruf edin.

Yasal Prosedürler

İfadeler, duruşmalar ve müşteri toplantıları kaydedin. Hukuk referansları için doğru zaman damgaları. Mahkeme belgeleri için uygun biçimlerde ihraç edin.

STT Model Karşılaştırması

Whisper

OpenAI'nin güçlü konuşma tanıma modeli 99 dilde desteklenmektedir.

  • 99 dil
  • Çeviri
  • Zaman damgaları
  • Seslere dayanıklı
OpenAI

Faster Whisper

CTranslate2 optimizasyonu ile Whisper'dan 4x daha hızlı, aynı doğruluk.

  • 4x daha hızlı
  • Düşük bellek
  • Tüm model boyutları
  • Grup işlemi
  • VAD filtreleme
SYSTRAN

SenseVoice

Duygusal algılamayla konuşma anlama modeli, 50+ dil.

  • 50+ dil
  • Duygu tespit
  • Ses olayları
  • Konuşmacı analizi
  • Zengin meta veri
Alibaba (FunAudioLLM)

Konuşmadan Metin Planları

Bedava başla, daha fazlasına ihtiyacın olduğunda yükselt

Özgür
  • 1 dakika ses sınırı
  • Daha hızlı Whisper modeli
  • Temel transkripsiyon
  • 100+ dil
En Popüler
Bedava Hesap
  • 30 dakikalık ses + 15.000 karakter
  • Tüm STT modelleri
  • Sözcük seviyesi zaman damgaları
  • SRT & VTT altyazılı ihraç et
  • Konuşmacı diyaliz
Ücretsiz kayıt ol
Pro
  • 2 saatlik ses dosyaları
  • Grup Çevirisi
  • Öncelik işlemi
  • API erişimi
  • Özel sözlük
Üst düzeye çıkar

Sıkça Sorulan Sorular

Otomatik konuşma tanıma (ASR) olarak da bilinen konuşmadan metne (STT) dönüşüm, konuşulan dilin yazılı metne dönüştürülmesini sağlar. Modellerimiz toplantılar, röportajlar, podcast'ler, dersler ve daha fazlasının seslerini doğru bir şekilde kopyalamak için yapay zeka kullanır.

Hızlı Fısıltının çoğu kullanım durumunda kullanılması önerilir — aynı doğruluğu korurken orijinal Fısıltıdan 4x daha hızlıdır. Eğer transkripsiyonun yanında duygu tespit veya ses olay tespit ihtiyacınız varsa SenseVoice'ı kullanın.

MP3, WAV, M4A, OGG, FLAC, WEBM ve en yaygın ses/video biçimlerini destekliyoruz. Maksimum dosya boyutu 50MB'dir. Daha büyük dosyalar için önce ses parçalarını ayırmayı düşünün.

Ücretsiz kullanıcılar 5 dakikaya kadar ses kaydedebiliyor. Ücretli planlar 2 saate kadar ses dosyalarını destekliyor. Daha uzun kayıtlar için, API'mizi grup işlemiyle kullanın.

Modellerimiz açık İngilizce konuşmada %95+ doğruluğa ulaşmaktadır. Doğruluk dil, ses kalitesi ve arka plan gürültüsüne göre değişir. Faster Whisper ve Whisper değişik doğruluk seviyeleriyle 99 dilde desteklenir.

Evet, gelişmiş transkripsiyon modlarımız sesteki farklı konuşmacıları tanımlayabilir ve etiketleyebilir. Konuşmacı diarizasyonu özellikle toplantı transkripsiyonları, röportajlar ve kimin ne söylediğini bilmenize gerek olan çok kişilik podcastler için yararlıdır.

Faster Whisper'ı kullanarak API'miz aracılığıyla gerçek zamanlı akışın transkripsiyonu mevcuttur. Ses, gelene kadar parça parça işleme altına alınır, düşük gecikmeli kısmi transkripsiyonlar sağlar. Bu, canlı altyazılar ve gerçek zamanlı not alma için idealdir.

Evet, transkripsiyon çıktımız SRT, VTT veya ASS altyazılı dosyaları olarak ihraç edilebilen kelime seviyesinde zaman damgaları içerir. Bu YouTube videolarına, çevrimiçi derslere ve sosyal medya içeriğine altyazılar eklemek için mükemmeldir.

Evet, tüm çeviri sonuçları varsayılan olarak bölüm düzeyindeki zaman damgalarını içerir. Sözcük düzeyindeki zaman damgaları da mevcuttur ve sesteki her kelimenin kesin başlangıç ve bitiş zamanlarını gösterir.

Daha Hızlı Fısıltının ses çeşitliliği üzerinde eğitimi vardır ve orta derecede arka plan gürültüsünü iyi yönetir. Çok gürültülü kayıtlar için, seslerin transkripsiyondan önce netliğini artırmak için Ses İyileştirici'mizi kullanmanızı öneririz.

Evet, yüklenen ses dosyaları güvenli GPU sunucularımızda işlem görür ve transkripsiyon tamamlandıktan sonra otomatik olarak silinir. Seslerinizi eğitim amaçlı olarak saklamıyoruz, paylaşmıyoruz veya kullanmıyoruz. Tüm aktarımlar şifrelenir.

Ücretsiz kullanıcılar ücretsiz olarak 5 dakikaya kadar ses kaydedebiliyor. Ücretli planlar ses uzunluğuna göre karakter kullanıyor: dakikada yaklaşık 1000 karakter. Plan hakkında ayrıntılı bilgi ve karakter paketleri için fiyat sayfamızı inceleyin.
5.0/5 (1)

Neyi geliştirebiliriz?

AI ile Sesleri Çevir

99 dilde doğru metin çevirileri alın. Bedava kayıt olun ve başlamak için 15.000 karakter alın.