Hata / Özellik İstek Raporu

Konuşmadan MetneName

Ses ve videoyu AI ile metin haline çevirin. 99 dil, zaman damgası ve konuşan tespitini destekler.

Ücretsiz Kayıt Ol

Ses veya Video Yükle

Dosyanızı buraya çekin ve bırakın, ya da browse

MP3, WAV, FLAC, OGG, M4A, MP4, WebM. ücretsiz 500 MB · Pro 2 GB'a kadar.

— ya da mikrofonunuzdan kaydedin —

00:00

Ayarları

Model

Dil

Zaman damgalarını dahil et

Konuşmacı diyaliz

1,000/min karakter — Kayıt ol Kullanım izleme

Çeviri

Bir ses dosyası yükleyin ve başlatmak için Çevir' e basın

Nasıl Çalışıyor

Ses Yükle

Ses veya video dosyanızı yükleyin. 100MB'ye kadar MP3, WAV, FLAC, OGG, M4A, MP4 ve WebM biçimlerini destekliyoruz.

2. AI Transcribes

Yapay zeka modellerimiz seslerinizi işlemek, dil tespit etmek, konuşanları tanımlamak ve zaman damgalarıyla doğru metin üretmek için.

3. Metininizi Al

Çevirinizi kopyalayın ya da TXT ya da SRT altyazılı biçiminde indirin. Gerekirse düzenleyin ve iyileştirin.

Kullanım Durumları

Her endüstri ve iş akışı için konuşmadan metne

Toplantılar ve Konferansler

Zoom, Teams ve Google Meet kayıtlarını otomatik olarak kopyala. Bir daha hiçbir eylem maddesini kaçırma. Toplantı notları veya altyazıları olarak ihraç et.

Röportajlar ve Gazetecilik

Makaleler, araştırma makaleleri ve belgeseller için röportajları kopyala. Konuşmacı diarization kolay teşhis için kimin ne dediğini tanımlar.

Podcastler ve Medya

Podcast bölümleri için transkripler oluşturun ve notlar gösterin. Ses içeriğiniz için arama yapılabilir arşivler oluşturun. Video podcastlere altyazılar ekleyin.

Dersler ve Eğitim

Kayıtlı dersleri çalışma notlarına dönüştürün. Eğitimsel içeriği doğru altyazılar ile erişilebilir hale getirin. İşitme engelli öğrencileri destekleyin.

Tıp Diktatörü

Doktor-hasta görüşmelerini, klinik notları ve tıbbi dikteleri kopyalayın. Yapay zeka destekli doğrulukla saatlerce elle belgelemeden tasarruf edin.

Yasal Prosedürler

İfadeler, duruşmalar ve müşteri toplantıları kaydedin. Hukuk referansları için doğru zaman damgaları. Mahkeme belgeleri için uygun biçimlerde ihraç edin.

STT Model Karşılaştırması

Whisper

OpenAI'nin güçlü konuşma tanıma modeli 99 dilde desteklenmektedir.

99 dil
Çeviri
Zaman damgaları
Seslere dayanıklı

OpenAI

Faster Whisper

CTranslate2 optimizasyonu ile Whisper'dan 4x daha hızlı, aynı doğruluk.

4x daha hızlı
Düşük bellek
Tüm model boyutları
Grup işlemi
VAD filtreleme

SYSTRAN

SenseVoice

Duygusal algılamayla konuşma anlama modeli, 50+ dil.

50+ dil
Duygu tespit
Ses olayları
Konuşmacı analizi
Zengin meta veri

Alibaba (FunAudioLLM)

Konuşmadan Metin Planları

Bedava başla, daha fazlasına ihtiyacın olduğunda yükselt

Özgür

1 dakika ses sınırı
Daha hızlı Whisper modeli
Temel transkripsiyon
100+ dil

En Popüler

Bedava Hesap

30 dakikalık ses + 15.000 karakter
Tüm STT modelleri
Sözcük seviyesi zaman damgaları
SRT & VTT altyazılı ihraç et
Konuşmacı diyaliz

Ücretsiz kayıt ol

Pro

2 saatlik ses dosyaları
Grup Çevirisi
Öncelik işlemi
API erişimi
Özel sözlük

Üst düzeye çıkar

Sıkça Sorulan Sorular

Otomatik konuşma tanıma (ASR) olarak da bilinen konuşmadan metne (STT) dönüşüm, konuşulan dilin yazılı metne dönüştürülmesini sağlar. Modellerimiz toplantılar, röportajlar, podcast'ler, dersler ve daha fazlasının seslerini doğru bir şekilde kopyalamak için yapay zeka kullanır.

Hızlı Fısıltının çoğu kullanım durumunda kullanılması önerilir — aynı doğruluğu korurken orijinal Fısıltıdan 4x daha hızlıdır. Eğer transkripsiyonun yanında duygu tespit veya ses olay tespit ihtiyacınız varsa SenseVoice'ı kullanın.

MP3, WAV, M4A, OGG, FLAC, WEBM ve en yaygın ses/video biçimlerini destekliyoruz. Maksimum dosya boyutu 50MB'dir. Daha büyük dosyalar için önce ses parçalarını ayırmayı düşünün.

Ücretsiz kullanıcılar 5 dakikaya kadar ses kaydedebiliyor. Ücretli planlar 2 saate kadar ses dosyalarını destekliyor. Daha uzun kayıtlar için, API'mizi grup işlemiyle kullanın.

Modellerimiz açık İngilizce konuşmada %95+ doğruluğa ulaşmaktadır. Doğruluk dil, ses kalitesi ve arka plan gürültüsüne göre değişir. Faster Whisper ve Whisper değişik doğruluk seviyeleriyle 99 dilde desteklenir.

Evet, gelişmiş transkripsiyon modlarımız sesteki farklı konuşmacıları tanımlayabilir ve etiketleyebilir. Konuşmacı diarizasyonu özellikle toplantı transkripsiyonları, röportajlar ve kimin ne söylediğini bilmenize gerek olan çok kişilik podcastler için yararlıdır.

Faster Whisper'ı kullanarak API'miz aracılığıyla gerçek zamanlı akışın transkripsiyonu mevcuttur. Ses, gelene kadar parça parça işleme altına alınır, düşük gecikmeli kısmi transkripsiyonlar sağlar. Bu, canlı altyazılar ve gerçek zamanlı not alma için idealdir.

Evet, transkripsiyon çıktımız SRT, VTT veya ASS altyazılı dosyaları olarak ihraç edilebilen kelime seviyesinde zaman damgaları içerir. Bu YouTube videolarına, çevrimiçi derslere ve sosyal medya içeriğine altyazılar eklemek için mükemmeldir.

Evet, tüm çeviri sonuçları varsayılan olarak bölüm düzeyindeki zaman damgalarını içerir. Sözcük düzeyindeki zaman damgaları da mevcuttur ve sesteki her kelimenin kesin başlangıç ve bitiş zamanlarını gösterir.

Daha Hızlı Fısıltının ses çeşitliliği üzerinde eğitimi vardır ve orta derecede arka plan gürültüsünü iyi yönetir. Çok gürültülü kayıtlar için, seslerin transkripsiyondan önce netliğini artırmak için Ses İyileştirici'mizi kullanmanızı öneririz.

Evet, yüklenen ses dosyaları güvenli GPU sunucularımızda işlem görür ve transkripsiyon tamamlandıktan sonra otomatik olarak silinir. Seslerinizi eğitim amaçlı olarak saklamıyoruz, paylaşmıyoruz veya kullanmıyoruz. Tüm aktarımlar şifrelenir.

Ücretsiz kullanıcılar ücretsiz olarak 5 dakikaya kadar ses kaydedebiliyor. Ücretli planlar ses uzunluğuna göre karakter kullanıyor: dakikada yaklaşık 1000 karakter. Plan hakkında ayrıntılı bilgi ve karakter paketleri için fiyat sayfamızı inceleyin.

5.0/5 (1)

AI ile Sesleri Çevir

99 dilde doğru metin çevirileri alın. Bedava kayıt olun ve başlamak için 15.000 karakter alın.

Ücretsiz Kayıt Ol Fiyatları Gör

Konuşmadan MetneName

Ses veya Video Yükle

Ayarları

Çeviri

Nasıl Çalışıyor

Ses Yükle

2. AI Transcribes

3. Metininizi Al

Kullanım Durumları

Toplantılar ve Konferansler

Röportajlar ve Gazetecilik

Podcastler ve Medya

Dersler ve Eğitim

Tıp Diktatörü

Yasal Prosedürler

STT Model Karşılaştırması

Whisper

Faster Whisper

SenseVoice

Konuşmadan Metin Planları

Sıkça Sorulan Sorular

Speech to text (STT) nedir?

Hangi transkripsiyon modeli en iyi?

Hangi ses formatlarını yükleyebilirim?

Transkrip için bir zaman sınırı var mı?

Çeviri ne kadar doğru?

Konuşma metin olarak sesli diarizasyonu destekliyor mu?

Gerçek zamanlı bir kopya alabilir miyim?

Altyazılar veya SRT dosyaları oluşturabilir miyim?

Transkripte zaman damgası var mı?

Araç arka plan gürültüsünü nasıl yönetir?

Ses verilerim gizli mi?

Konuşmadan metne çevirme ne kadara mal oluyor?

AI ile Sesleri Çevir