语音视位和 Amazon Polly - Amazon Polly

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音视位和 Amazon Polly

语音视位代表说一个词时的面部和口腔位置。它是一个音素的视觉等价物,是形成单词的基本声学单元。语音视位是语音的基本可视构建基块。

每种语言都有一组与其特定音素相对应的 viseme。在语言中,每个音素都有相应的代表口腔发音时的形状的语音视位。然而,并非所有语音视位都能映射到特定的音素,因为许多音素虽然听上去不一样,但发音时的形状相同。例如,在英语中,单词“pet”(宠物)和“bet”(打赌)声音上是不同的。但是,在目视观察中(无声音),它们看起来完全相同。

下图显示了部分国际语音字母 (IPA) 音素和扩展语音评估方法语音字母 (X-SAMPA) 符号及其对应的美式英语配音的发音模组。

如需获得完整列表和所有可用语音的表格,请参阅 亚马逊 Polly 中的语言

IPA

X-SAMPA

描述

示例

语音视位

辅音

b

b

浊双唇塞音

bed

p

d

d

浊齿龈塞音

dig

t

d͡ʒ

dZ

浊龈后塞擦音

jump

S

ð

D

浊齿擦音

then

T

f

f

清唇齿擦音

five

f

g

g

浊软颚塞音

game

k

h

h

清喉擦音

house

k

...

...

...

...

...