了解 AWS Glue 数据目录表 - Amazon Chime SDK

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

了解 AWS Glue 数据目录表

下表列出并描述了 Amazon Chime SDK 调用分析 Glue 数据目录中的列、数据类型和元素。

call_analytics_metadata

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

detail-subtype

字符串

用于录音和 CallAnalyticsMetadata 细节类型。

callevent-type

字符串

与之关联的事件类型SIP,例如更新、暂停、恢复

mediaInsightsPipeline我是

字符串

Amazon Chime SDK 媒体见解渠道 ID。

metadata

字符串

voiceConnectorId

亚马逊 Chime SDK 语音连接器 ID。

callId

与使用情况相关的参与者的呼叫 ID。

transactionId

呼叫的事务 ID。

fromNumber

E.164 发起电话号码。

toNumber

E.164 目标电话号码。

方向

呼叫方向,出站或入站。

oneTimeMetadata.s3 RecordingUrl

Transcribe Call Analytics 发出的媒体对象的 Amazon S3 存储桶URL。

oneTimeMetadata.s3 RecordingUrlRedacted

Transcribe Call Analytics 发出的经过编辑的媒体对象的 Amazon S3 存储桶URL。

oneTimeMetadata.siprecMetadata

SIPREC与呼叫关联XML格式的元数据。

oneTimeMetadata.siprecMetadataJson

SIPREC与呼叫关联JSON格式的元数据。

oneTimeMetadata.InviteHeaders

邀请标头。

call_analytics_recording_metadata

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

detail-subtype

字符串

用于录音和 CallAnalyticsMetadata 细节类型。

callevent-type

字符串

与之关联的事件类型 SIP

mediaInsightsPipeline我是

字符串

亚马逊 Chime SDK 媒体洞察渠道 ID。

s3 MediaObjectConsoleUrl

字符串

媒体对象URL的 S3 存储桶。

metadata

字符串

voiceConnectorId

亚马逊 Chime SDK 语音连接器 ID。

callId

与使用情况相关的参与者的呼叫 ID。

transactionId

呼叫的事务 ID。

fromNumber

E.164 发起电话号码。

toNumber

E.164 目标电话号码。

方向

呼叫方向,出站或入站。

语音增强

与 service-type 相关的功能子类型。

oneTimeMetadata.siprecMetadata

SIPREC与呼叫关联XML格式的元数据。

oneTimeMetadata.siprecMetadataJson

SIPREC与呼叫关联JSON格式的元数据。

oneTimeMetadata.InviteHeaders

邀请标头。

transcribe_call_analytics

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

mediaInsightsPipeline我是

字符串

亚马逊 Chime SDK 媒体洞察渠道 ID。

metadata

字符串

voiceConnectorId

Amazon Chime Voice Connector ID。

callId

与使用情况相关的参与者的呼叫 ID。

transactionId

呼叫的事务 ID。

fromNumber

E.164 发起电话号码。

toNumber

E.164 目标电话号码。

方向

呼叫方向,OutboundInbound

UtteranceEvent

struct

UtteranceId

与指定 UtteranceEvent 相关的唯一标识符。

IsPartial

指示 UtteranceEvent 中的片段是完整的 (FALSE) 还是部分的 (TRUE)。

ParticipantRole

为每个音频通道提供扬声器的角色,可以是CUSTOMER或AGENT。

BeginOffsetMillis

从音频流开始到 UtteranceEvent 开始之间的时间,以毫秒为单位。

EndOffsetMillis

从音频流开始到 UtteranceEvent 开始之间的时间,以毫秒为单位。

转录

包含转录后文本。

情绪

提供在指定片段中检测到的情绪。

Items.beginoffsetmillis

转录后内容的开始时间,以毫秒为单位。

Items.endoffsetmillis

转录后内容的结束时间,以毫秒为单位。

Items.itemtype

识别内容的类型。选项:PRONUNCIATION(口语词)和 PUNCTUATION

Items.content

转录的单词或标点符号。

Items.confidence

与您的转录中的单词或短语相关的置信度分数。分数是介于 0 和 1 之间的值。值越大,指示识别内容与您的媒体中所说内容正确匹配的可能性越高。

Items.vocabularyfiltermatch

指示指定内容是否与您请求中所含词汇筛选器中的单词匹配。如果为 true,则存在词汇筛选匹配项。

Items.stable

已启用部分结果稳定,“稳定”指示指定内容是稳定的 (true),还是在片段完成后可能发生变化 (false)。

IssuesDetected.characterofsets_begin

提供识别匹配项的第一个字符的字符计数。例如,与议题或类别相关的第一个字符与片段转录中的内容相匹配。

IssuesDetected.characteroffsets_end

提供识别匹配项的最后一个字符的字符计数。例如,与议题或类别相关的最后一个字符与片段转录中的内容相匹配。

Entities.beginoffsetmillis

识别为 PII 的言语的开始时间,以毫秒为单位。

Entities.endoffsetmillis

识别为 PII 的言语的结束时间,以毫秒为单位。

Entities.category

识别信息的类别。唯一的类别是 PII

Entities.type

已PII识别的类型。例如,NAMECREDIT_DEBIT_NUMBER

Entities.content

识别为 PII 的一个或多个单词。

Entities.confidence

与您的音频中识别 PII 实体相关的置信度分数。置信度分数介于 0 和 1 之间。值越大,指示识别实体与您的媒体中所说实体正确匹配的可能性越高。

transcribe_call_analytics_category_events

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

mediaInsightsPipeline我是

字符串

亚马逊 Chime SDK 媒体洞察渠道 ID。

metadata

字符串

voiceConnectorId

Amazon Chime Voice Connector ID。

callId

与使用情况相关的参与者的呼叫 ID。

transactionId

呼叫的事务 ID。

fromNumber

E.164 发起电话号码。

toNumber

E.164 目标电话号码。

方向

呼叫方向,出站或入站。

CategoryEvent

数组

MatchedCategories

列出由用户定义的类别中的匹配项。

transcribe_call_analytics_post_call

列名称

数据类型

元素

定义

JobStatus

字符串

事件生成时间戳 ISO 8601。

LanguageCode

字符串

与 service-type 相关的功能类型。

转录

struct

LoudnessScores

测量每位参与者的说话音量。使用此指标来查看呼叫者或座席是否大声说话或者大喊大叫,这通常表示愤怒。

该指标表示为标准化值(给定片段中每秒的话音水平),范围从 0 到 100,其中值越高表示声音越大。

内容

包含转录后文本。

Id

与指定 UtteranceEvent 相关的唯一标识符。

BeginOffsetMillis

从音频流开始到 UtteranceEvent 开始之间的时间,以毫秒为单位。

EndOffsetMillis

从音频流开始到 UtteranceEvent 开始之间的时间,以毫秒为单位。

情绪

提供在指定转录片段中检测到的情绪。

ParticipantRole

为每个音频通道提供发言人角色,可以是客户或座席。

IssuesDetected。 CharacterOffsets. Begin

提供识别匹配项的第一个字符的字符偏移量。例如,转录片段中与议题相关的第一个字符。

IssuesDetected。 CharacterOffsets.End

提供识别匹配项的最后一个字符的字符偏移量。例如,转录片段中与议题相关的最后一个字符。

OutcomesDetected。 CharacterOffsets. Begin

提供在呼叫中识别的结果或决议。

OutcomesDetected。 CharacterOffsets.End

ActionItemsDetected。 CharacterOffsets. Begin

列出在呼叫中识别的所有操作内容。

ActionItemsDetected。 CharacterOffsets.End

AccountId

字符串

AWS 账户编号

类别

struct

MatchedCategories

列出匹配的类别。

MatchedDetails

列出从音频流开始到检测到该类别中的匹配项的时间,以毫秒为单位。

频道

字符串

频道

指示语音通道。

参与者

数组

ParticipantRole

为每个音频通道提供发言人角色,CUSTOMERAGENT

ConversationCharacteristics

struct

NonTalkTime

测量不含话音的时间段。使用此指标来查找长时间的静默,例如客户等待的时间过长。

中断

测量一个参与者是否以及何时打断了另一个参与者的话。频繁中断可能与粗鲁或愤怒相关,也可能与一个或两个参与者的消极情绪相关。

TotalConversationDurationMillis

对话的总时长。

情绪。 OverallSentiment。 AGENT

代理的 OverallSentiment 标签。

情绪。 OverallSentiment。 CUSTOMER

CustomerOverallSentiment 标签。

情绪。 SentimentByPeriod。 QUARTER。 AGENT

Agent 的各季情绪标签。

情绪。 SentimentByPeriod。 QUARTER。 CUSTOMER

Customer 的各季情绪标签。

TalkSpeed

测量两个参与者的说话速度。如果一个参与者说话太快,理解力就会受到影响。该指标以每分钟单词数来衡量。

TalkTime

测量每个参与者在呼叫期间的说话时长,以毫秒为单位。使用此指标来帮助识别是否有一名参与者在呼叫中占据主导地位,或者对话是否平衡。

SessionId

字符串

呼叫的 SessionId

ContentMetadata

字符串

根据客户指定的配置来标记原始内容与编辑后内容的字段。

transcribe

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

mediaInsightsPipeline我是

字符串

亚马逊 Chime SDK 媒体洞察渠道 ID。

metadata

字符串

voiceConnectorId

Amazon Chime Voice Connector ID。

callId

与使用情况相关的参与者的呼叫 ID。

transactionId

呼叫的事务 ID。

fromNumber

E.164 发起电话号码。

toNumber

E.164 目标电话号码。

方向

呼叫方向,OutboundInbound

TranscriptEvent

struct

ResultId

Result 的唯一标识符。

StartTime

Result 的开始时间,以毫秒为单位。

EndTime

Result 的结束时间,以毫秒为单位。

IsPartial

表明片段是否是完整的。如果 IsPartialtrue,则片段不是完整的。否则,片段是完整的。

ChannelId

与音频流相关的通道的 ID。

Alternatives.Entities

在您的转录输出中包含标识为个人身份信息 (PII) 的实体。

Alternatives.Items.Confidence

与您的转录中的单词或短语相关的置信度分数。置信度分数是介于 0 和 1 之间的值。值越大,指示识别内容与您的媒体中所说内容正确匹配的可能性越高。

Alternatives.Items.Content

转录的单词或标点符号。

替代品。物品。 EndTime

转录后内容的结束时间,以毫秒为单位。

Alternatives.Items.Speaker

如果启用了发言人分区,Speaker 就会标记指定内容的发言人。

Alternatives.Items.Stable

如果启用了部分结果稳定,Stable 会指示指定项目是稳定的 (true),还是在片段完成后可能发生变化 (false)。

替代品。物品。 StartTime

转录后内容的开始时间,以毫秒为单位。

Alternatives.Items.Type

识别内容的类型。选项:PRONUNCIATION(口语词)和 PUNCTUATION

替代品。物品。 VocabularyFilterMatch

指示指定内容是否与您请求中所含词汇筛选器中的单词匹配。如果为 true,则存在词汇筛选匹配项。

Alternatives.Transcript

包含转录后文本。

voice_analytics_status

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

字符串

AWS生成事件的服务。

account

字符串

AWS账户编号。

region

字符串

AWS账户区域。

版本

字符串

事件架构的版本。

id

字符串

事件的唯一 ID

detail

struct

taskId

任务的唯一 ID。

isCaller

指示参与者是否为呼叫者。

streamStartTime

流的开始时间。

transactionId

呼叫的事务 ID。

voiceConnectorId

Amazon Chime Voice Connector ID。

callId

与使用情况相关的参与者的呼叫 ID。

detailStatus

与 service-type 相关的详细功能类型。

statusMessage

任务 ID 成功或失败的状态。

mediaInsightsPipeline我是

亚马逊 Chime SDK 媒体洞察渠道 ID。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。

sourceArn

运行任务ARN的资源

streamArn

运行任务的 Kinesis 视频流ARN。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。

channelId

运行任务 streamArn 的频道。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。

speakerSearchDetails.voiceProfileId

已注册语音配置文件的 ID,其语音嵌入与呼叫中的发言人非常匹配。

speakerSearchDetails.confidenceScore

介于 [0, 1] 之间的数字,其中,数字越大,意味着机器学习模型对语音配置文件匹配越有信心。

speaker_search_status

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

字符串

AWS生成事件的服务。

account

字符串

AWS账户编号。

region

字符串

AWS账户区域。

版本

字符串

事件架构的版本。

id

字符串

事件的唯一 ID

detail

struct

taskId

任务的唯一 ID。

isCaller

指示参与者是否为呼叫者。

transactionId

呼叫的事务 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。

voiceConnectorId

Amazon Chime 语音连接器 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。

mediaInsightsPipeline我是 媒体见解管线 ID。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。
sourceArn 运行任务ARN的资源。
streamArn 运行任务的 Kinesis 视频流ARN。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。
channelId 运行任务 streamArn 的频道。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。
participantRole 中与关联的参与者角色streamArn。 channelId 只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。

detailStatus

与 service-type 相关的详细功能类型。

statusMessage

任务 ID 的状态,成功或失败。

speakerSearchDetails.voiceProfileId

已注册语音配置文件的 ID,其语音嵌入与呼叫中的发言人非常匹配。

speakerSearchDetails.confidenceScore

介于 [0, 1] 之间的数字,其中,数字越大,意味着机器学习模型对语音配置文件匹配越有信心。

voice_tone_analysis_status

列名称

数据类型

元素

定义

时间

字符串

事件生成时间戳 ISO 8601。

detail-type

字符串

与 service-type 相关的功能类型。

service-type

字符串

AWS 服务名称, VoiceAnalytics 或 CallAnalytics。

字符串

AWS生成事件的服务。

account

字符串

AWS账户编号。

region

字符串

AWS账户区域。

版本

字符串

事件架构的版本。

id

字符串

事件的唯一 ID

detail

struct

taskId

任务的唯一 ID。

isCaller

指示参与者是否为呼叫者。

transactionId

呼叫的事务 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。

voiceConnectorId

Amazon Chime 语音连接器 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。

mediaInsightsPipeline我是 媒体见解管线 ID。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。
sourceArn 运行任务ARN的资源。
streamArn 运行任务的 Kinesis 视频流ARN。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。
channelId 运行任务 streamArn 的频道。只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。
participantRole 中与关联的参与者角色streamArn。 channelId 只有通过媒体管道SDK而不是语音启动的演讲者搜索任务才会填充此字段SDK。

statusMessage

任务 ID 成功或失败的状态。

voiceToneAnalysis细节。 startFragmentNumber 与关联的起始片段号streamArn。

voiceToneAnalysis细节。 currentAverageVoice音调。 startTime

当前平均情绪所依据的说话者通话音频以 ISO86 01 格式的起始时间戳。

voiceToneAnalysis细节。 currentAverageVoice音调。 endTime

当前平均情绪所依据的说话者通话音频以 ISO86 01 格式结束时间戳。

voiceToneAnalysis细节。 currentAverageVoice音调。 beginOffsetMillis 当前平均情绪所依据的发言人呼叫音频起始片段的起始偏移量,以毫秒为单位。
voiceToneAnalysis细节。 currentAverageVoice音调。 endOffsetMillis 当前平均情绪所依据的发言人呼叫音频起始片段的结束偏移量,以毫秒为单位。

voiceToneAnalysis细节。 currentAverageVoice音调。 voiceToneScore. 阳性

发言人积极情绪的概率可能性介于 [0, 1] 之间。

voiceToneAnalysis细节。 currentAverageVoice音调。 voiceToneScore. 负数

发言人消极情绪的概率可能性介于 [0, 1] 之间。

voiceToneAnalysis细节。 currentAverageVoice音调。 voiceToneScore. 中立

发言人中性情绪的概率可能性介于 [0, 1] 之间。

voiceToneAnalysis细节。 currentAverageVoice音调。 voiceToneLabel

最高概率具有平均语音音调分数的标签。

voiceToneAnalysis细节。 overallAverageVoice音调。 startTime

以 ISO86 01 格式表示整体平均情绪所依据的说话者通话音频的起始时间戳。

voiceToneAnalysis细节。 overallAverageVoice音调。 endTime

整体平均情绪所依据的说话者通话音频以 ISO86 01 格式结束时间戳。

voiceToneAnalysis细节。 overallAverageVoice音调。 beginOffsetMillis 总体平均情绪所依据的发言人呼叫音频起始片段的起始偏移量,以毫秒为单位。
voiceToneAnalysis细节。 overallAverageVoice音调。 endOffsetMillis 总体平均情绪所依据的发言人呼叫音频起始片段的结束偏移量,以毫秒为单位。

voiceToneAnalysis细节。 overallAverageVoice音调。 voiceToneScore. 阳性

发言人积极情绪的概率可能性介于 [0, 1] 之间。

voiceToneAnalysis细节。 overallAverageVoice音调。 voiceToneScore. 负数

发言人消极情绪的概率可能性介于 [0, 1] 之间。

voiceToneAnalysis细节。 overallAverageVoice音调。 voiceToneScore. 中立

发言人中性情绪的概率可能性介于 [0, 1] 之间。

voiceToneAnalysis细节。 overallAverageVoice音调。 voiceToneLabel

情绪分数最高的情绪标签(积极、消极或中性)。