خواننده TTS — به هر سندی گوش دهید

پی‌دی‌اف‌ها، مقالات، کتاب‌های الکترونیکی و اسناد را به صدای طبیعی تبدیل کنید. یک پرونده را بارگذاری کنید یا یک نشانی وب را بچسبانید، و خوانندهٔ TTS ما آن را به گفتار با صداهای هوش مصنوعی تبدیل می‌کند. در حال حرکت گوش دهید، در حین یادگیری چند وظیفه انجام دهید، یا محتوای نوشته شده را برای همه در دسترس قرار دهید. از پی‌دی‌اف، EPUB، TXT، DOCX و نشانی‌های وب پشتیبانی می‌کند.

خواننده PDF سند به صدا تبدیل مقاله به گفتار پشتیبانی EPUB در هر جایی گوش دادن

ویژگیهای خواننده TTS

یک تجربه کامل خواندن با صداهای هوش مصنوعی

پشتیبانی PDF/EPUB/URL

بارگذاری پی‌دی‌اف‌ها، کتاب‌های الکترونیکی EPUB، یا چسباندن هر نشانی وب. خواننده محتوای متنی را به صورت خودکار استخراج می‌کند و با صدای طبیعی هوش مصنوعی آن را با صدای بلند می‌خواند.

مشخص کردن کلمه

با روشن کردن کلمه به کلمه در زمان واقعی ، هنگام خواندن متن با صدای بلند ، دنبال کنید. درک را بهبود می بخشد و به یادگیرندگان بصری کمک می کند تا تمرکز کنند.

سرعت تنظیم‌پذیر ۰٫ ۵- ۳x

سرعت خواندن را از ۰٫۵x (شنیدن آهسته و محتاطانه) تا ۳x (شنیدن سریع) کنترل کنید. سرعت شنیدن بهینه خود را برای هر نوع محتوا پیدا کنید.

چند صدا

از بیش از ۱۰۰ صدای هوش مصنوعی برای خواندن انتخاب کنید. صدایی را که با محتوا مطابقت دارد انتخاب کنید — حرفه‌ای برای مقالات، گرم برای داستان‌ها، روشن برای کتاب‌های درسی.

بارگیری برون‌خط

صدای کامل هر سندی را به صورت MP3 برای گوش دادن آفلاین بارگیری کنید. هنگام رفت و آمد، در سالن ورزشی یا هر جایی که اینترنت وجود ندارد، گوش دهید.

چوب الفها

چوب‌الف موقعیت خود را در سندهای طولانی بگذارید. گوش دادن را دقیقاً از جایی که در نشستها متوقف کردید ، ادامه دهید. پیشرفت را در سندهای چند فصل دنبال کنید.

بهترین صداها برای خواندن

مدل‌ها برای شکل طولانی، راوی طبیعی بهینه شده‌اند

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

بهترین برای: بهترین برای خواندن طولانی - سریع، با کیفیت بالا، ریتم طبیعی برای گوش دادن مداوم

سعي کن Kokoro

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

بهترین برای: خوانندهٔ آزاد چندزبانه برای مقالات و اسناد به شش زبان

سعي کن MeloTTS

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

بهترین برای: کیفیت روایت سطح انسانی برای کتابها، مقالات طولانی و داستانها

سعي کن Orpheus

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 شبیه‌سازی صدا

بهترین برای: ترکیب جریان برای خواندن در زمان واقعی با تأخیر کم

سعي کن CosyVoice 2

StyleTTS 2StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

Medium 5/5

بهترین برای: گویندگی با کیفیت استودیویی برای تجربه‌های خواندن برتر

سعي کن StyleTTS 2

چگونه خواننده TTS کار می‌کند

از سند به صدا در سه گام

1

متن یا نشانی وب را بچسبانید

مستقیماً متن را وارد کنید، نشانی وب یک صفحه وب را بچسبانید، یا یک پرونده PDF/EPUB را بارگذاری کنید. خواننده به‌طور خودکار استخراج محتوا را برای تمام انواع ورودی انجام می‌دهد.

2

انتخاب یک صدای خواندن

از میان بیش از ۱۰۰ صدای هوش مصنوعی انتخاب کنید. صدایی را که با محتوای شما مطابقت دارد انتخاب کنید — حرفه‌ای برای اخبار، گرم برای داستان، روشن برای مواد علمی.

3

گوش دادن با روشن کردن

فشار دهید و با روشن کردن کلمه در زمان واقعی دنبال کنید. سرعت را تنظیم کنید، متوقف کنید، به جلو/به عقب بروید و گذرگاه‌های مهم را نشانه‌گذاری کنید.

4

بارگیری برای خارج از خط

دانلود کامل صدا به صورت MP3 برای گوش دادن آفلاین. مقالات، کتاب‌های الکترونیکی و اسناد خود را هرجا که بدون دسترسی به اینترنت هستید ببرید.

کارهایی که خواننده TTS می‌تواند انجام دهد

بیش از یک تبدیل متن به گفتار — یک تجربه کامل خواندن.

پشتیبانی سند PDF

هر فایل PDF، EPUB، DOCX، یا TXT را آپلود کنید و خواننده متن را استخراج می‌کند، ساختار (فصل‌ها، عنوان‌ها، پاراگراف‌ها) را حفظ می‌کند، و آن را به گفتار تبدیل می‌کند.

  • PDF با استخراج متن و OCR fallback
  • EPUB با ناوبری فصل
  • پشتیبانی DOCX و TXT
  • شناسایی ساختار هوشمند

خواننده مقاله وب

هر نشانی وب را بچسبانید و خواننده محتوای مقاله را استخراج می‌کند (تبلیغات ، ناوبری و نوارهای جانبی را حذف می‌کند) ، سپس آن را به گفتار طبیعی تبدیل می‌کند. برای گوش دادن به پست‌های وبلاگ ، مقالات خبری ، مقالات تحقیقی و مستندات در هنگام رفت و آمد ، تمرین یا انجام کارهای خانه ای عالی است.

  • استخراج خودکار مقاله از نشانیهای وب
  • تبلیغات، ناوبری و ستون‌های اصلی را حذف می‌کند
  • ساختار و سرآیندهای مقاله را حفظ می‌کند
  • با بیشتر وب‌گاه‌ها و وبلاگ‌ها کار می‌کند

کنترلهای پخش

کنترل‌های پخش کامل به شما اجازه می‌دهد سرعت را تنظیم کنید (۰٫۵x تا ۲x)، به جلو و عقب پرش کنید، موقعیت خود را نشان‌گذاری کنید، و از جایی که متوقف کردید ادامه دهید. خواننده پیشرفت شما را در میان سندهای طولانی دنبال می‌کند ، بنابراین هرگز جای خود را از دست نمی‌دهید.

  • سرعت پخش تنظیم‌پذیر) ۰٫ ۵x - ۲x (
  • ناوش در سطح پاراگراف
  • قابلیت چوب الف و ادامه
  • ردیابی پیشرفت برای سندهای طولانی

صادرات به عنوان پروندۀ صوتی

تبدیل تمام سندها به پرونده‌های MP3 قابل دانلود برای گوش دادن خارج از خط. ایجاد نسخه‌های کتاب صوتی از کتاب‌های الکترونیکی، مواد مطالعه که می‌توانید در حین رفت‌وآمد به آن‌ها گوش دهید، یا نسخه‌های قابل دسترس از سندها برای اعضای تیم با ناتوانی در خواندن.

  • صادرات سندهای کامل به عنوان MP3
  • گزینۀ صادرات فصل به فصل
  • پشتیبانی از گوش دادن خارج از خط
  • اشتراک‌گذاری نسخه‌های صوتی با دیگران

چه کسی از TTS Reader استفاده می‌کند؟

از دانش آموزان تا حرفه اي ها، همه از گوش دادن سود مي برند

دانشجوها

در حین سفر به کتاب‌های درسی، مقالات پژوهشی و یادداشت‌های مطالعه گوش دهید. یادگیری صوتی حافظه را بهبود می‌بخشد و به شما اجازه می‌دهد در حین فعالیت‌هایی که خواندن امکان‌پذیر نیست، مطالعه کنید.

حرفه اي

در حین سفر به گزارش‌ها، ایمیل‌ها و مقالات صنعت گوش دهید. با تبدیل سندها به صدایی که می‌توانید در حال حرکت مصرف کنید، در بالای بارهای کاری سنگین خواندن بمانید.

دسترسی‌پذیری

صداهای طبیعی هوش مصنوعی اسناد را برای افرادی که دچار اختلالات بینایی، دیس‌لکسی یا دیگر مشکلات خواندن هستند قابل دسترسی می‌کند.

ساخت خواننده TTS خودتان

از API برای تبدیل سندها به صورت برنامه‌ریزی شده به صدا استفاده کنید

Python — سند به صدا REST API
import requests

# Split your document into paragraphs
paragraphs = [
    "Chapter 1: The Beginning",
    "It was a dark and stormy night. The wind howled...",
    "Chapter 2: The Journey",
    "The next morning brought clear skies and new hope."
]

audio_chunks = []
for paragraph in paragraphs:
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": paragraph,
        "model": "kokoro",
        "voice": "af_sky",
        "format": "mp3"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})
    audio_chunks.append(response.content)

# Concatenate into a single audiobook file
with open("audiobook.mp3", "wb") as f:
    for chunk in audio_chunks:
        f.write(chunk)

گوش دادن به هر چیزی، با قیمت مقرون به صرفه

سطح رایگان برای خواندن گاه به گاه، برنامه‌های پرداختی برای مصرف سنگین اسناد.

لایۀ آزاد

$0

15000 کاراکتر در ثبت نام

  • خواندن مقالات و اسناد کوتاه
  • ۴ صدای طبیعی هوش مصنوعی
  • دسترسی به وب و موبایل

آغازگر

$9

۵۰۰۰۰۰ کاراکتر/ماه

  • کتاب‌های کامل و PDFها
  • همه ۲۰+ صداها
  • صادرات MP3

حرفه اي

$29

۲٬۰۰۰٬۰۰۰ کاراکتر/ماه

  • خواندن سند بدون محدودیت
  • صداهای گویندگی Premium
  • پردازش سند دسته
نمایش قیمت کامل

پرسشهای متداول

پرسش‌های رایج در مورد خواننده TTS

این خواننده از متن ساده (چسباندن مستقیم)، نشانی‌های وب (خودکار استخراج محتوای مقاله)، پرونده‌های پی‌دی‌اف و کتاب‌های الکترونیکی EPUB پشتیبانی می‌کند. محتوا به‌طور خودکار استخراج و پردازش می‌شود تا برای خواندن TTS بهینه باشد، سرآیندها، پاراگراف‌ها و فهرست‌ها به‌طور مناسب مدیریت شوند.

هنگام پخش صدا ، کلمۀ مربوط در متن در زمان واقعی مشخص می‌شود. این همگام‌سازی به شما کمک می‌کند تا به صورت بصری دنبال کنید ، درک را بهبود می‌بخشد ، و اگر نگاهتان را دور کنید ، پیدا کردن مکان خود را آسان می‌کند. مشخص کردن با تمام صداها و تنظیمات سرعت کار می‌کند.

بله. سرعت از ۰٫۵x (نیم سرعت ، عالی برای یادگیری زبان) تا ۳x (سریع تر برای بازخوانی سریع) است. پیش‌فرض سرعت طبیعی ۱٫۰x است. تغییرات سرعت بلافاصله بدون بازسازی صدا اعمال می‌شود.

بله. برای ذخیره صدای کامل به عنوان یک پرونده MP3 ، دکمۀ بارگیری را فشار دهید. مقالات ، کتابهای الکترونیکی ، و مواد مطالعه را با خود برای گوش دادن خارج از خط در حین رفت و آمد ، تمرین ، یا سفر ببرید. برای صدای بارگیری شده نیازی به اینترنت نیست.

خواننده سندهای هر طولی را با تقسیم خودکار آن‌ها به بخش‌ها مدیریت می‌کند. کتابها ، مقالات طولانی ، و پی‌دی‌اف‌های چندصفحه‌ای به صورت تکه‌های کوچک پردازش می‌شوند و بدون هیچ مشکلی پخش می‌شوند. هیچ محدودیت بالای عملی برای طول سند وجود ندارد.

خواننده محتوای متن را استخراج می‌کند و ساختار پاراگراف ، سرآیندها و قالب‌بندی فهرست را حفظ می‌کند. طرح‌بندی‌های پیچیده مانند جدول‌ها و پی‌دی‌اف‌های چندستونی برای جریان خواندن بهینه به متن خطی ساده می‌شوند. تصاویر پرش می‌شوند.

بله. این خواننده برای یادگیری زبان عالی است. متن را در زبان هدف خود بچسبانید ، از سرعت ۰٫۵x برای گوش دادن دقیق استفاده کنید ، و با روشن کردن کلمات دنبال کنید. ترکیب متن بصری و صوتی ، واژگان و تلفظ را تقویت می‌کند.

بله. خواننده هنگام استفاده از مدلهای آزاد (Kokoro, Piper, MeloTTS, VITS) رایگان است. صداهای پرمیوم با کیفیت بالا از کاراکترهای موجود در حساب شما استفاده می‌کنند. تجربه اصلی خواندن شامل روشن کردن ، کنترل سرعت و چوب الفها همیشه رایگان است.

بله. در هر نقطه در طول خواندن ، شمایل چوب الف را فشار دهید. هنگامی که برمی‌گردید ، خواننده از موقعیت چوب الف خود ادامه می‌دهد. این به ویژه برای کتابهای چند فصلی و مقالات علمی طولانی که در نشستهای متعدد می‌خوانید ، مفید است.

بله. خواننده TTS کاملاً پاسخگو است و در تلفن‌های هوشمند و تبلت‌ها کار می‌کند. رابط کاربری با کنترل‌های دوست‌داشتنی لمسی با صفحه نمایش‌های کوچکتر سازگار می‌شود. مشخص کردن کلمات و تنظیم سرعت در تلفن همراه و میزکار یکسان کار می‌کنند.

بله. نشانی وب هر مقاله را بچسبانید و خواننده به طور خودکار محتوای اصلی را استخراج می‌کند ، و ناوبری ، تبلیغات ، و نوارهای جانبی را حذف می‌کند. این با بیشتر سایتهای خبری ، وبلاگها ، و وبگاههای مبتنی بر مقاله کار می‌کند. متن استخراج شده در خواننده آماده برای پخش ظاهر می‌شود.

خواننده محتوای متنی را از PDFها استخراج می‌کند و تصاویر، نمودارها و عناصر غیر متنی را پرتاب می‌کند. برای PDFهای اسکن شده (بر پایه تصویر)، پردازش OCR متن را قبل از خواندن استخراج می‌کند. PDFهای متنی بهترین تجربه خواندن را با استخراج دقیق محتوا فراهم می‌کنند.
5.0/5 (1)

چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.

شروع گوش دادن به سندهای شما

بارگذاری یک پی‌دی‌اف، چسباندن یک نشانی وب، یا وارد کردن متن. خواننده TTS آن را بلافاصله به گفتار طبیعی تبدیل می‌کند.