向已配置的表添加分析规则 - AWS Clean Rooms

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

向已配置的表添加分析规则

以下各节介绍如何向配置的表中添加分析规则。通过定义分析规则,您可以授权可以查询的成员运行与 AWS Clean Rooms支持的特定分析规则匹配的查询。

AWS Clean Rooms 支持以下类型的分析规则:

每个配置表只能有一个分析规则。在将配置的表与协作关联之前,您可以随时配置分析规则。

重要

如果您在协作中使用 Clean Rooms 加密计算且有加密数据表,则添加到加密配置表的分析规则应与数据的加密方式一致。例如,如果您加密了SELECT(聚合分析规则)的数据,则不应为JOIN(列表分析规则)添加分析规则。

向表中添加聚合分析规则(引导流程)

聚合分析规则允许使用可选维度上的COUNT、SUM和AVG函数在不泄露行级信息的情况下聚合统计信息的查询。

此过程描述了使用 AWS Clean Rooms 控制台中的引导流程选项为配置表添加聚合分析规则的过程。

为表添加聚合分析规则(引导流程)
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择配置表

  3. 选择配置表。

  4. 在配置表详细信息页面上,选择配置分析规则

  5. 步骤 1: 选择类型下,在类型下,保持聚合选项的默认选中状态。

  6. 创建方法下,选择引导流程,然后选择下一步

  7. 步骤 2: 指定查询控制下,对于聚合函数

    1. 从下拉列表中选择一个聚合函数

      • COUNT

      • COUNT DISTINCT

      • SUM

      • SUM DISTINCT

      • AVG

    2. 下拉列表中选择哪些列可以用于聚合函数

    3. (可选)选择添加其他函数以添加另一个聚合函数,并将一个或多个列与该函数相关联。

      注意

      至少需要一个聚合函数。

    4. (可选)选择移除以删除聚合函数。

  8. 对于联接控制

    1. 允许单独查询表选择一个选项:

      如果选择... 操作...
      否,只能查询重叠 只有在联接到可以查询的成员拥有的表时,才能对表进行查询。
      表可以单独查询,也可以在与其他表联接后进行查询。
    2. 指定联接列下,选择要允许在 INNER JOIN 语句中使用的列。

      如果您在上一步中选择了,则这是可选的

    3. 指定允许的匹配运算符下,选择哪些运算符(如果有)可用于在多个联接列上进行匹配。如果您选择两列或更多 JOIN 列,则需要其中一个运算符。

      如果选择... 操作...
      AND 您可以在 INNER JOIN 匹配条件中包含 AND,在表之间将一列联接到另一列。
      或者 您可以在 INNER JOIN 匹配条件中包含 OR,在表之间将一列与另一列进行匹配。此逻辑运算符对于获得更高的匹配率很有用。
  9. (可选)对于维度控件,在 “指定维度列” 下拉列表中,选择要允许在SELECT语句中使用哪些列,以及查询的WHEREGROUPBY、和ORDERBY部分。

    注意

    聚合函数或联接列不能用作维度列。

  10. 对于标量函数,请为要允许哪些标量函数?选择一个选项。

    如果选择... 操作...
    目前所有支持者都是 AWS Clean Rooms 您允许 AWS Clean Rooms当前支持的所有标量函数。
    • 您可以选择查看列表以查看 AWS Clean Rooms中支持的标量函数的完整列表。

    自定义列表 您可以自定义允许哪些标量函数。
    • 指定允许的标量函数下拉列表中选择一个或多个选项。

    您不想允许任何标量函数。

    有关更多信息,请参阅 标量函数

  11. 选择下一步

  12. 步骤 3: 指定查询结果控制下,为聚合约束

    1. 选择每个列名称的下拉列表。

    2. 选择应用 COUNT DISTINCT 函数后返回的每个输出行必须满足的每个不同值的最小数量的下拉列表。

    3. 选择添加约束,添加更多聚合约束。

    4. (可选)选择移除以删除聚合约束。

  13. 对于应用于输出的其他分析,请根据您的目标选择一个选项。

    你的目标 推荐选项
    仅允许对该表进行直接查询。拒绝对查询结果运行其他分析。该表只能用于直接查询。 不允许
    允许但不要求在此表上同时进行直接查询和额外分析。 允许
    要求该表只能用于通过所需的额外分析之一进行处理的直接查询。在此表上的直接查询必须经过进一步处理才能返回。 必填
  14. 选择下一步

  15. 步骤 4: 查看并配置下,查看您在之前的步骤中所做的选择,必要时进行编辑,然后选择配置分析规则

您将看到一条确认消息,指出您成功为表配置了聚合分析规则。

向表格添加列表分析规则(引导流程)

列表分析规则允许查询输出关联表和可以查询的成员的表之间重叠的行级列表。

此过程描述了使用 AWS Clean Rooms 控制台中的 “引导流程” 选项将列表分析规则添加到配置的表中的过程。

为表添加列表分析规则(引导流程)
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择配置表

  3. 选择配置表。

  4. 在配置表详细信息页面上,选择配置分析规则

  5. 步骤 1: 选择类型下,在类型下,选择列表选项。

  6. 创建方法下,选择引导流程,然后选择下一步

  7. 步骤 2: 指定查询控制下,对于联接控制

    1. 指定联接列下,选择要允许在 INNER JOIN 语句中使用的列。

    2. 指定允许的匹配运算符下,选择哪些运算符(如果有)可用于在多个联接列上进行匹配。如果您选择两列或更多 JOIN 列,则需要其中一个运算符。

      如果选择... 操作...
      AND 您可以在 INNER JOIN 匹配条件中包含 AND,在表之间将一列联接到另一列。
      或者 您可以在 INNER JOIN 匹配条件中包含 OR,在表之间将一列与另一列进行匹配。此逻辑运算符对于获得更高的匹配率很有用。
  8. (可选)对于列表控制,在指定列表列下拉列表中,选择要允许在查询输出中使用(即在 SELECT 语句中使用)或用于筛选结果(即 WHERE 语句)的列。

  9. 选择下一步

  10. 在 “步骤 3:指定查询结果控件” 下,对于应用于输出的其他分析,请根据您的目标选择一个选项。

    你的目标 推荐选项
    仅允许对该表进行直接查询。拒绝对查询结果运行其他分析。该表只能用于直接查询。 不允许
    允许但不要求在此表上同时进行直接查询和额外分析。 允许
    要求该表只能用于通过所需的额外分析之一进行处理的直接查询。在此表上的直接查询必须经过进一步处理才能返回。 必填
  11. 步骤 4: 查看并配置下,查看您在之前的步骤中所做的选择,必要时进行编辑,然后选择配置分析规则

您将看到一条确认消息,指出您成功为表配置了列表分析规则。

向表格添加自定义分析规则(引导流程)

自定义分析规则允许对已配置的表进行自定义SQL查询。如果您使用的是,则需要使用自定义分析规则:

  • 分析模板 — 允许一组特定的预先批准的SQL查询或一组可以提供使用您的数据的查询的特定账户

  • 差异隐私 — 防止用户识别尝试

此过程描述了使用 AWS Clean Rooms 控制台中的 “引导流程” 选项将自定义分析规则添加到配置的表中的过程。

为表添加自定义分析规则(引导流程)
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择配置表

  3. 选择配置表。

  4. 在配置表详细信息页面上,选择配置分析规则

  5. 步骤 1: 选择类型下,在类型下,选择自定义选项。

  6. 创建方法下,选择引导流程,然后选择下一步

  7. 步骤 2:设置差别隐私下面,确定是要开启还是关闭差别隐私。差别隐私是一种经过数学验证的技术,可以保护您的数据以免受到重新识别攻击。

    1. 对于差别隐私

      如果您... 则选择...
      具有用户级数据,并希望防范重新识别尝试 打开
      没有用户级数据或不需要针对重新识别尝试的保护 关闭
    2. 如果您选择开启差异隐私,请选择包含用户唯一标识符的用户标识符user_id列,例如要保护其隐私的列。

      要在协作中为两个或多个表启用差异隐私,您必须在两个分析规则中配置与用户标识符列相同的列,以保持各表中用户定义的一致性。如果未正确进行配置,可以查询的成员将收到一条错误消息,指出具有两列可供选择,以便在运行查询时计算用户贡献数量(例如,用户生成的广告展示次数)。

    3. 选择下一步

  8. 步骤 3:指定查询控制下面,

    1. 对于控件类型,请根据您的目标选择一个选项。

      你的目标 选项
      在配置表上运行每个新的分析模板之前,先对其进行审核 在允许在此表上运行每项新分析之前,先对其进行审核
      允许对配置表执行任何分析模板或直接查询 允许特定协作者创建的任何查询无需审核即可在此表上运行
    2. 选择以下操作之一:

      如果您选择了... 操作...
      在允许在此表上运行每项新分析之前,先对其进行审核 允许运行分析模板下,选择添加分析模板,然后从下拉列表中选择相应的协作分析模板
      允许特定协作者创建的任何查询无需审核即可在此表上运行 在 “AWS 账户 允许创建任何查询” 下,选择 “添加” AWS 账户,然后选择相应的 AWS 账户 ID
  9. 选择下一步

  10. 在 “步骤 4:指定查询结果控件” 下,

    1. 对于输出中不允许的列,请根据您的目标选择一个选项。

      你的目标 推荐选项
      允许在查询输出中返回所有列
      不允许在查询输出中返回某些列 自定义列表
    2. 选择以下操作之一:

      如果您选择了... 操作...
      继续前往应用于输出的其他分析
      自定义列表 在 “指定不允许的列” 下,选择要从查询输出中删除的列。
    3. 对于应用于输出的其他分析,请根据您的目标选择一个选项。

      你的目标 推荐选项
      仅允许对该表进行直接查询。拒绝对查询结果运行其他分析。该表只能用于直接查询。 不允许
      允许但不要求在此表上同时进行直接查询和额外分析。 允许
      要求该表只能用于通过所需的额外分析之一进行处理的直接查询。在此表上的直接查询必须经过进一步处理才能返回。 必填
  11. 选择下一步

  12. 在 “步骤 5:查看和配置” 下,查看您在之前的步骤中所做的选择,必要时进行编辑,然后选择配置分析规则

您将看到一条确认消息,指出您成功为表配置了自定义分析规则。

向表格添加分析规则(JSON编辑器)

以下过程说明如何使用 AWS Clean Rooms 控制台中的JSON编辑器选项向表格添加分析规则。

向表中添加聚合、列表或自定义分析规则(JSON编辑器)
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择配置表

  3. 选择配置表。

  4. 在配置表详细信息页面上,选择配置分析规则

  5. 步骤 1: 选择类型下,在类型下,选择聚合列表自定义选项。

  6. 在 “创建方法” 下,选择JSON编辑器,然后选择 “下一步”。

  7. 步骤 2: 指定控制下,您可以选择插入查询结构(插入模板)或插入文件(从文件导入)。

    如果选择... 操作...
    插入模板
    1. 分析规则定义中为所选分析规则指定参数。

    2. 您可以按 Ctrl + 空格键启用自动完成。

    有关聚合分析规则参数的更多信息,请参阅聚合分析规则 — 查询控制

    有关列表分析规则参数的更多信息,请参阅列表分析规则 — 查询控制

    从文件导入
    1. 从本地驱动器中选择您的JSON文件。

    2. 选择打开

      分析规则定义显示上传文件中的分析规则。

  8. 选择下一步

  9. 步骤 3: 查看并配置下,查看您在之前的步骤中所做的选择,必要时进行编辑,然后选择配置分析规则

您将收到一条确认消息,指出您成功为表配置了分析规则。

后续步骤

现在,您已经为配置表配置了分析规则,您已准备好: