在配置零 ETL 集成的目标时,AWS 提供了多种选项。目标可能是加密的 Amazon Redshift 数据仓库或 Amazon SageMaker Lakehouse 目录。
在选择零 ETL 集成的目标之前,您需要配置以下其中一个目标资源。
零 ETL 集成中目标的配置选项包括:
配置了 Amazon S3 存储的 Amazon SageMaker Lakehouse 目录和数据库。请参阅设置 AWS Glue 数据库。
配置了 Amazon Redshift 托管存储的 Amazon SageMaker Lakehouse 目录。请参阅配置与目标的集成。
由 Redshift 命名空间标识的 Amazon Redshift 数据仓库。请参阅配置与目标的集成。
注意
创建零 ETL 集成后,便无法修改其目标。
配置与目标的集成
在选择您的连接并指定了源 IAM 角色后,在指定 Amazon Redshift 数据仓库目标时,请按照下面的步骤进行操作:
指定 Redshift 集群或 Redshift Serverless 工作组的命名空间,或者创建新的命名空间。
选择 AWS Glue 自动修复此问题选项。对于 Redshift 目标,这将:
在 Redshift 集群或 Serverless 工作组上应用授权的服务主体。
将授权的 Glue 源 ARN 应用于 Redshift 集群或 Serverless 工作组。
将新的参数组与
enable_case_sensitive_identifier = true
关联。
提供集成名称,然后选择创建并启动集成。
一旦您的集成处于活动状态,请导航到集成详细信息页面并选择通过集成创建数据库。
最后,您可以导航到 Redshift 查询编辑器,并连接到您的数据库来验证快照和增量数据。
注意
命名空间或目录名称中只能使用小写字母数字字符和下划线。这与 AWS Glue Data Catalog 不同,后者允许创建具有任何名称(包括特殊字符)的数据库。
指定配置了 Amazon S3 存储目标的 Amazon SageMaker Lakehouse 目录和数据库时,请按照下面的步骤进行操作:
将 Redshift 的集成注册到 Lake Formation 中的目录中。请参阅 Registering Amazon Redshift clusters and namespaces to the AWS Glue Data Catalog。
在 AWS Lake Formation 中创建联合目录或托管目录。有关更多信息,请参阅: