스피치 마크 유형 - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스피치 마크 유형

SynthesizeSpeech 또는 StartSpeechSynthesisTask 명령에 대한 SpeechMarkTypes 옵션을 사용하여 스피치 마크를 요청합니다. 입력 텍스트에서 반환할 메타데이터 요소를 지정합니다. 최대 네 가지 형식의 메타데이터를 요청할 수 있지만, 요청당 반드시 하나 이상을 지정해야 합니다. 요청 시 오디오 출력이 생성되지 않습니다.

예를 들어 에서는 다음과 AWS CLI같습니다.

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly는 다음 요소를 사용하여 스피치 마크를 생성합니다.

  • sentence – 입력 텍스트의 문장 요소를 나타냅니다.

  • word – 텍스트의 단어 요소를 나타냅니다.

  • viseme – 말하는 각 음소에 대응하는 얼굴과 입의 움직임을 설명합니다. 자세한 내용은 Viseme과 Amazon Polly 단원을 참조하십시오.

  • ssml - SSML 입력 텍스트의 <mark> 요소를 설명합니다. 자세한 내용은 SSML 문서에서 음성 생성 단원을 참조하십시오.