쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

신경 음성

포커스 모드
신경 음성 - Amazon Polly

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Polly에는 표준 음성보다 자연스러운 음성을 낼 수 있는 신경망 텍스트 투 스피치(NTTS) 시스템이 있습니다. 표준 TTS 음성은 연결 합성을 사용합니다. 이 표준 엔진은 녹음된 스피치의 음소를 서로 연결하여 매우 자연스럽게 들리도록 합성된 스피치를 만들어 냅니다. 하지만 말은 변형될 수밖에 없고 파형 분절에 사용되는 기술로 인해 스피치 품질이 제한됩니다. Amazon Polly NTTS 엔진은 스피치를 생성하기 위해 표준 연결 합성을 사용하지 않으며, 다음 두 부분으로 이루어져 있습니다.

  • 신경망 - 음소(가장 기본적인 언어 단위) 시퀀스를 스펙트로그램 시퀀스로 변환합니다. (스펙트로그램은 다양한 주파수 대역의 에너지 레벨을 스냅샷으로 찍은 것입니다.)

  • 보코더 - 스펙트로그램을 거의 연속된 오디오 신호로 변환합니다.

신경 TTS 시스템의 첫 번째 구성 요소는 Sequence-to-Sequence 모델입니다. 이 모델은 해당하는 입력에서만 결과를 만들 뿐만 아니라 입력 요소의 시퀀스가 함께 작동하는 방식도 고려합니다. 모델이 출력되는 스펙트로그램을 선택하면 주파수 대역이 사람의 뇌가 말을 처리할 때 사용하는 음향 기능을 강조합니다.

그런 다음 이 모델의 출력이 신경 보코더로 전달되고 스펙트로그램이 스피치 파형으로 변환됩니다. 범용 연결 합성 시스템을 빌드하는 데 사용되는 대규모 데이터세트로 훈련될 경우 이 Sequence-to-Sequence 접근 방식은 더 우수하고 자연스럽게 들리는 음성을 만들어 냅니다.

사용 가능한 신경 음성

신경 음성은 36개 언어 및 언어 변형으로 제공됩니다. 다음 표에 음성이 나와 있습니다.

언어 및 사투리 언어 코드 이름/ID Gender

1

아랍어(걸프)

ar-AE

Hala

Zayd

여성

남성

2

벨기에 네덜란드어(플랑드르)

nl-BE

Lisa

여성

3

카탈루냐어

ca-ES

Arlet

여성

4

체코어

cs-CZ

Jitka

여성

5

중국어(광동어)

yue-CN

Hiujin

여성

6

표준 중국어

cmn-CN

Zhiyu

여성

7

덴마크어

da-DK

Sofie

여성

8

네덜란드어

nl-NL

Laura

여성

9

영어(호주)

en-AU

Olivia

여성

10

영어(영국)

en-GB

Amy*

Emma

Brian

Arthur

여성

여성

남성

남성

11

영어(인도)

en-IN

Kajal

여성

12

영어(아일랜드)

en-IE

Niamh

여성

13

영어(뉴질랜드)

en-NZ

Aria

여성

14

영어(싱가포르어)

en-SG

재스민

여성

15

영어(남아프리카)

en-ZA

Ayanda

여성

16

영어(미국)

en-US

Danielle

Gregory

Ivy

Joanna*

Kendra

Kimberly

Salli

Joey

Justin

Kevin

Matthew*

Ruth

Stephen

여성

남성

여성(어린이)

여성

여성

여성

여성

남성

남성(어린이)

남성(어린이)

남성

여성

남성

17

핀란드어

fi-FI

Suvi

여성

18

프랑스어(벨기에)

fr-BE

Isabelle

여성

19

프랑스어(캐나다)

fr-CA

Gabrielle

Liam

여성

남성

20

프랑스어

fr-FR

Léa

Rémi

여성

남성

21

독일어

de-DE

Vicki

Daniel

여성

남성

22

독일어(오스트리아)

de-AT

Hannah

여성

23

독일어(스위스)

de-CH

Sabrina

여성

24

힌디어

hi-IN

Kajal

여성

25

이탈리아어

it-IT

Bianca

Adriano

여성

남성

26

일본어

ja-JP

Takumi

Kazuha

Tomoko

남성

여성

여성

27

한국어

ko-KR

Seoyeon

지혜

여성

여성

28

노르웨이어

nb-NO

Ida

여성

29

폴란드어

pl-PL

Ola

여성

30

포르투갈어(브라질)

pt-BR

Camila

Vitória/Vitoria

Thiago

여성

여성

남성

31

포르투갈어(유럽)

pt-PT

Inês/Ines

여성

32

스페인어(스페인)

es-ES

Lucia

Sergio

여성

남성

33

스페인어(멕시코)

es-MX

Mia

Andrés

여성

남성

34

스페인어(미국)

es-US

Lupe*

Pedro

여성

남성

35

스웨덴어

sv-SE

Elin

여성

36

터키어

tr-TR

Burcu

여성

*Amy, Joanna, Lupe 및 Matthew 음성은 뉴스 진행자 말투로 사용할 수 있습니다. 자세한 내용은 뉴스 진행자 음성 적용 단원을 참조하십시오.

기능 및 리전 호환성

일부 AWS 리전에서는 신경 음성을 사용할 수 없으며 모든 Amazon Polly 기능을 지원하지도 않습니다.

신경 음성이 지원되는 리전은 다음과 같습니다.

  • 미국 동부(버지니아 북부): us-east-1

  • 미국 서부(오레곤): us-west-2

  • 아프리카(케이프타운): af-south-1

  • 아시아 태평양(도쿄): ap-northeast-1

  • 아시아 태평양(서울): ap-northeast-2

  • 아시아 태평양(오사카): ap-northeast-3

  • 아시아 태평양(뭄바이): ap-south-1

  • 아시아 태평양(싱가포르): ap-southeast-1

  • 아시아 태평양(시드니): ap-southeast-2

  • 아시아 태평양(말레이시아): ap-southeast-5

  • 캐나다(중부): ca-central-1

  • 유럽(프랑크푸르트): eu-central-1

  • 유럽(아일랜드): eu-west-1

  • 유럽(런던): eu-west-2

  • 유럽(파리): eu-west-3

  • 유럽(스페인): eu-south-2

  • AWS GovCloud(미국 서부): us-gov-west-1

이 리전의 엔드포인트와 프로토콜은 표준 음성에 사용되는 것과 같습니다. 자세한 내용은 Amazon Polly 엔드포인트 및 할당량을 참조하세요.

신경 음성에 지원되는 기능은 다음과 같습니다.

  • 실시간 및 비동기 스피치 합성 작업

  • 뉴스 진행자 말투입니다. 진행자 말투에 대한 자세한 내용은 뉴스 진행자 음성 적용을 참조하세요.

  • 모든 스피치 마크

  • Amazon Polly에서 지원하는 상당수의(전부 아님) SSML 태그입니다. NTTS를 지원하는 SSML 태그에 대한 자세한 내용은 지원되는 태그를 참조하세요.

표준 음성의 경우와 마찬가지로, 다양한 샘플링 속도 중에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. 표준 음성과 신경 음성에 맞는 샘플링 속도는 8kHz, 16kHz, 22kHz 또는 24kHz입니다. 표준 음성의 기본값은 22kHz이고 신경 음성의 기본값은 24kHz입니다. Amazon Polly는 MP3, OGG(Vorbis) 및 원시 PCM 오디오 스트림 형식을 지원합니다.

이 페이지에서

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.