쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

볼륨, 말하기 속도 및 피치 제어

포커스 모드
볼륨, 말하기 속도 및 피치 제어 - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

<prosody>

Prosody 태그 속성은 표준 TTS 음성으로 완벽하게 지원됩니다. 생성형, 신경 및 롱폼 음성은 volumerate 속성을 지원하지만 pitch 속성을 지원하지 않습니다. 생성형 음성의 경우 prosody 태그는 전체 문장 주위에만 사용할 수 있습니다.

선택된 음성의 볼륨, 속도 또는 피치를 제어하려면 prosody 태그를 사용합니다.

볼륨, 스피치 속도 및 피치는 선택된 특정 음성에 따라 다릅니다. 서로 다른 언어를 사용하는 음성 간의 차이 외에도 동일한 언어를 사용하는 각 개인의 음성 간에도 차이가 존재합니다. 따라서 속성은 모든 언어에 걸쳐 유사하지만 각 언어들 사이에 분명한 차이가 존재하며 절대값이란 있을 수 없습니다.

prosody 태그에는 세 개의 속성이 있으며 각 속성에는 해당 속성을 설정하는 데 사용 가능한 몇 가지 값이 있습니다. 각 속성은 동일한 구문을 사용합니다.

<prosody attribute="value"></prosody>

  • volume

    • default: 볼륨을 현재 음성의 기본 수준으로 재설정합니다.

    • silent, x-soft, soft, medium, loud, x-loud: 볼륨을 현재 음성에 사전 정의된 값으로 설정합니다.

    • +ndB, -ndB: 볼륨을 현재 볼륨 레벨으로부터 가감합니다. +0dB 값은 변경 없음, +6dB 값은 현재 볼륨의 약 2배, -6dB 값은 현재 볼륨의 약 절반을 의미합니다.

    예를 들어, 특정 구절의 볼륨을 다음과 같은 방식으로 설정할 수 있습니다.

    <speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>

    또는 다음과 같은 방식으로 설정할 수 있습니다.

    <speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
  • rate

    • x-slow, slow, medium, fast, x-fast. 선택된 음성에 대해 피치를 사전 정의된 값으로 설정합니다.

    • n%: 말하기 속도의 백분율 가감 예를 들어 100%의 값은 말하기 속도를 변경하지 않는 것이고, 200%의 값은 기본 속도의 2배에 해당하는 말하기 속도를 의미하며 50%의 값은 기본 속도의 절반에 해당하는 말하기 속도를 의미합니다. 이 값의 범위는 20%~200%입니다.

    예를 들어, 특정 구절의 스피치 속도를 다음과 같은 방식으로 설정할 수 있습니다.

    <speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>

    또는 다음과 같은 방식으로 설정할 수 있습니다.

    <speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
  • pitch

    • default: 현재 음성의 음색을 기본 수준으로 재설정합니다.

    • x-low, low, medium, high, x-high: 현재 음성의 음색을 사전 정의된 값으로 설정합니다.

    • +n% 또는 -n%: 상대적 백분율로 음색을 조절합니다. 예를 들어 값 +0%는 기준 음색 변경이 없음을 의미하고, +5%는 약간 더 높은 기준 음색을 제공하며, -5%는 약간 더 낮은 기준 음색을 가져옵니다.

    예를 들어, 특정 구절의 피치를 다음과 같은 방식으로 설정할 수 있습니다.

    <speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>

    또는 다음과 같은 방식으로 설정할 수 있습니다.

    <speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>

<prosody> 태그는 최소 1개의 속성을 포함해야 하나, 동일한 태그 안에 여러 개를 포함할 수도 있습니다.

<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>

또한 다음과 같은 방식으로 중첩된 태그와 조합할 수 있습니다.

<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.