연구소

AI 음성으로 여러 장의 오디오북과 팟캐스트를 만들 수 있습니다. 각 장별로 다른 음성을 할당하고, 발음을 관리하고, 완전한 프로젝트를 내보낼 수 있습니다.

새 프로젝트

챕터

Draft
0 words · 0 characters
0:00

아직 장이 없습니다. 클릭 \

시간대

생성된 장은 여기에 타임라인으로 나타납니다. 개별 장을 생성하거나 \ 를 클릭하십시오.

0:00
Generating chapter 1 of 3... 0%

프로젝트 설정

0s 10s

발음 사전

Example: "TTS" → "tee tee ess"
Word 발음
아직 발음 규칙이 없습니다. 위에 단어를 추가하거나 사전 파일을 업로드하십시오.

내보내기

모든 장을 하나의 오디오 파일로 합치기 각 장을 별도의 파일로 다운로드 (ZIP)

어떻게 작동하는지

4가지 간단한 단계로 전문적인 오디오북과 팟캐스트를 제작하세요.

Step 1

프로젝트 만들기

새로운 프로젝트를 시작하고 오디오북, Podcast, 보이스오버 또는 프레젠테이션의 유형을 선택합니다. 이름을 지정하고 기본 음성과 모델을 설정합니다.

Step 2

챕터 추가

프로젝트에 장 또는 섹션 추가하기 각 장의 텍스트를 붙여넣고 단어 수를 추적하고 드래그하여 섹션을 재정렬하십시오.

Step 3

음성 할당

각 장마다 다른 AI 음성을 선택하세요. 일관성을 위해 기본값을 사용하거나 내레이터와 캐릭터에 고유한 음성을 할당하세요.

Step 4

오디오북 내보내기

한 번의 클릭으로 모든 장을 생성한 다음 단일 스티치 오디오북으로 내보내거나 ZIP 아카이브로 개별 장을 다운로드하십시오.

사용 사례

Studio는 다양한 산업 분야에서 긴 형식의 오디오 프로덕션을 위해 제작되었습니다.

오디오북

전체 소설, 논픽션 책, 단편 소설을 전문적인 오디오북으로 변환합니다. 다중 음성을 사용하여 나레이터와 캐릭터를 구분합니다. Audible, Spotify 또는 Apple Books에서 배포할 준비가 된 단일 파일로 내보냅니다.

팟캐스트

여러 AI 호스트를 사용하여 팟캐스트 에피소드를 작성하고 제작하세요. 인터뷰 스타일의 쇼, 뉴스 라운드업 또는 스토리텔링 시리즈를 만들어 보세요. 스피커마다 다른 목소리를 할당하고 챕터 마커로 방송 준비 오디오를 내보냅니다.

전자 학습 과정

레슨 스크립트에서 완전한 강의 오디오를 생성합니다. 모듈을 챕터로 구성하고, 강사의 목소리를 일관되게 사용하고, 전문 용어에 대한 발음 규칙을 추가합니다.

기업 교육 프로그램

대규모로 교육 자료, 온보딩 오디오 및 규정 준수 모듈을 생성합니다. 부서 전반에서 일관된 브랜드 음성을 유지합니다. 텍스트를 편집하고 재녹음하지 않고 재생성하여 콘텐츠를 업데이트합니다.

문서화

접근성을 위해 기술 문서, 사용자 가이드 및 설명서를 오디오 형식으로 변환합니다. 발음 사전을 사용하여 약어, 제품 이름 및 도메인 특정 용어를 정확하게 처리합니다.

프리젠테이션

슬라이드 덱 및 비디오 프레젠테이션을 위한 내레이션 트랙을 생성합니다. 각 슬라이드를 챕터로 구성하고, 섹션별로 타이밍을 할당하고, 웹 세미나 및 컨퍼런스를 위해 시각적 콘텐츠와 동기화되는 오디오를 내보냅니다.

스튜디오 기능

전문적인 롱포맷 오디오 프로덕션에 필요한 모든 것.

다중 음성

각 장 또는 섹션에 다른 AI 목소리를 할당할 수 있습니다. 한 목소리를 내레이션에, 다른 목소리를 캐릭터 대화에 사용할 수 있습니다. 완벽한 캐스팅을 위해 24개 이상의 모델에 걸쳐 100개 이상의 목소리를 전환할 수 있습니다.

장 관리

드래그 앤 드롭으로 챕터를 추가, 제거, 재정렬할 수 있습니다. 각 섹션은 단어 및 문자 수를 측정할 수 있는 자체 텍스트 편집기를 갖추고 있습니다. 챕터를 개별적으로 또는 모두 한 번에 생성할 수 있습니다.

발음 사전

이름, 약어 및 기술 용어에 대한 사용자 지정 발음 규칙을 정의합니다..txt 또는.pls 사전 파일을 업로드하거나 수동으로 단어-발음 쌍을 추가하여 정확성을 보장합니다.

One-Click Export

전체 프로젝트를 구성 가능한 챕터 브레이크가 있는 단일 스티치 오디오 파일로 내보내거나 모든 챕터를 ZIP 아카이브의 개별 파일로 다운로드합니다. MP3 또는 WAV 출력.

자주 묻는 질문

Studio is a long-form audio production workspace. Create multi-chapter audiobooks, podcasts, or voiceover projects. Assign different voices to different sections, manage pronunciation dictionaries, and export as a single stitched audio file.

Each chapter or section can have a different voice assigned. For example, an audiobook can have a narrator voice for descriptions and different character voices for dialogue. You assign voices per section in the project editor.

A pronunciation dictionary lets you define how specific words should be spoken. Upload a .txt or .pls file with word-pronunciation pairs, or add them manually. Useful for character names, brand names, acronyms, and technical terms that AI might mispronounce.

Yes. Each chapter generates independently. If you need to fix a paragraph, just regenerate that section. The rest of your project stays intact. This saves time and credits on long projects.

Export your complete project as a single MP3 or WAV file with all chapters stitched together. You can also export individual chapters as separate files or download everything as a ZIP archive.

There is no hard limit on project length. Each chapter can be up to 50,000 characters. You can have unlimited chapters. Full-length novels (80,000+ words) are fully supported.

Yes. In project settings, you can set the chapter break duration — the silence inserted between chapters in the final export. Default is 2 seconds, adjustable from 0 to 10 seconds.

The core TTS API supports generating speech for individual sections. For full project management (chapters, voice assignment, stitching), use the web Studio interface. API-based project management is on the roadmap.

Using Kokoro (free tier), audiobook production costs 0 credits. A 60,000-word novel is approximately 360,000 characters. With standard-tier models (2 credits/1K chars), that would cost about 720 credits ($25-30).

Team collaboration is coming soon. Currently, projects are tied to individual accounts. The upcoming Teams feature will allow shared projects, team API keys, and usage dashboards.

Yes. You can use SSML tags in your text for fine-grained control over pronunciation, pauses, emphasis, and prosody. Combined with the pronunciation dictionary, you have complete control over how every word is spoken.

Yes. Upload a TXT, DOCX, or EPUB file and Studio will automatically split it into chapters. You can then assign voices, edit text, and generate audio for each chapter independently.
5.0/5 (1)

첫 번째 프로젝트 만들기

AI 음성으로 전문적인 오디오북과 팟캐스트를 만들 수 있습니다. 다중 장 지원, 다중 음성, 발음 제어.