启用 Amazon EMR on EKS 的集群访问
下面几节介绍了启用集群访问的几种方法。第一种是使用 Amazon EKS 集群访问管理(CAM),后者展示了如何手动启用集群访问。
使用 EKS 访问条目启用集群访问(推荐)
注意
aws-auth
ConfigMap 已弃用。要管理对 Kubernetes API 的访问权限,建议的方法是使用访问条目。
Amazon EMR 已与 Amazon EKS 集群访问管理(CAM)集成,因此您可以自动配置必要的 AuthN 和 AuthZ 策略,以便在 Amazon EKS 集群的命名空间中运行 Amazon EMR Spark 作业。从 Amazon EKS 集群命名空间创建虚拟集群时,Amazon EMR 会自动配置所有必要的权限,因此您无需在当前工作流中添加任何额外步骤。
注意
只有新的 Amazon EMR on EKS 虚拟集群支持 Amazon EMR 与 Amazon EKS CAM 集成。您无法迁移现有虚拟集群以使用此集成。
先决条件
-
确保您运行的是 2.15.3 或更高版本的 AWS CLI
-
Amazon EKS 集群必须为 1.23 或更高版本。
设置
要设置 Amazon EMR 与 Amazon EKS 的 AccessEntry API 操作之间的集成,确保已完成以下各项:
-
确保将 Amazon EKS 集群的
authenticationMode
设置为API_AND_CONFIG_MAP
。aws eks describe-cluster --name
<eks-cluster-name>
如果还未设置,请将
authenticationMode
设置为API_AND_CONFIG_MAP
。aws eks update-cluster-config --name
<eks-cluster-name>
--access-config authenticationMode=API_AND_CONFIG_MAP有关身份验证模式的更多信息,请参阅集群身份验证模式。
-
确保用于运行
CreateVirtualCluster
和DeleteVirtualCluster
API 操作的 IAM 角色也具有以下权限:{ "Effect": "Allow", "Action": [ "eks:CreateAccessEntry" ], "Resource": "arn:
<AWS_PARTITION>
:eks:<AWS_REGION>
:<AWS_ACCOUNT_ID>
:cluster/<EKS_CLUSTER_NAME>
" }, { "Effect": "Allow", "Action": [ "eks:DescribeAccessEntry", "eks:DeleteAccessEntry", "eks:ListAssociatedAccessPolicies", "eks:AssociateAccessPolicy", "eks:DisassociateAccessPolicy" ], "Resource": "arn:<AWS_PARTITION>
:eks:<AWS_REGION>:<AWS_ACCOUNT_ID>:access-entry/<EKS_CLUSTER_NAME>/role/<AWS_ACCOUNT_ID>/AWSServiceRoleForAmazonEMRContainers/*" }
概念和术语
以下是 Amazon EKS CAM 的相关术语和概念列表。
-
虚拟集群(VC):在 Amazon EKS 中创建的命名空间的逻辑表示。这是指向 Amazon EKS 集群命名空间的 1:1 链接。您可以使用虚拟集群在指定命名空间内的 Amazon EKS 集群上运行 Amazon EMR 工作负载。
-
命名空间:在单个 EKS 集群中隔离资源组的机制。
-
访问策略:允许 EKS 集群中的 IAM 角色访问和操作的权限。
-
访问条目:使用角色 arn 创建的条目。您可以将访问条目关联到访问策略,以便在 Amazon EKS 集群中分配特定权限。
-
EKS 访问条目集成虚拟集群:使用 Amazon EKS 中的访问条目 API 操作创建的虚拟集群。
使用 aws-auth
启用集群访问
您必须通过执行以下操作来允许 Amazon EMR on EKS 访问集群中的特定命名空间:创建 Kubernetes 角色、将角色绑定到 Kubernetes 用户以及将 Kubernetes 用户映射为服务关联角色 AWSServiceRoleForAmazonEMRContainers
。当 IAM 身份映射命令与 emr-containers
一起作为服务名称时,这些操作在 eksctl
中自动执行。您可以使用以下命令轻松地执行这些操作。
eksctl create iamidentitymapping \ --cluster
my_eks_cluster
\ --namespacekubernetes_namespace
\ --service-name "emr-containers"
用 Amazon EKS 集群的名称来替换 my_eks_cluster
,并使用创建用来运行 Amazon EMR 工作负载的 Kubernetes 命名空间来替换 kubernetes_namespace
。
重要
必须使用上一步设置 kubectl 和 eksctl 下载最新的 eksctl 才能使用此功能。
执行手动步骤以启用 Amazon EMR on EKS 的集群访问
您还可以使用以下手动步骤来启用 Amazon EMR on EKS 的集群访问。
-
在特定命名空间中创建 Kubernetes 角色
-
创建作用域为命名空间的 Kubernetes 角色绑定
运行以下命令以创建绑定在特定命名空间中的 Kubernetes 角色。此角色绑定将在上一步中创建的角色中定义的权限授予名为
emr-containers
的用户。此用户确定 Amazon EMR on EKS 的服务相关角色,因此允许 Amazon EMR on EKS 执行由您创建的角色所定义的操作。namespace=
my-namespace
cat - <<EOF | kubectl apply -f - --namespace "${namespace}" apiVersion: rbac.authorization.k8s.io/v1 kind: RoleBinding metadata: name: emr-containers namespace: ${namespace} subjects: - kind: User name: emr-containers apiGroup: rbac.authorization.k8s.io roleRef: kind: Role name: emr-containers apiGroup: rbac.authorization.k8s.io EOF -
更新 Kubernetes
aws-auth
配置映射您可以使用以下选项之一将 Amazon EMR on EKS 与服务关联的角色映射到
emr-containers
用户,并且该用户在上一步中绑定了 Kubernetes 角色。选项 1:使用
eksctl
运行以下
eksctl
命令:将 Amazon EMR on EKS 服务相关角色映射到emr-containers
用户。eksctl create iamidentitymapping \ --cluster
my-cluster-name
\ --arn "arn:aws:iam::my-account-id
:role/AWSServiceRoleForAmazonEMRContainers" \ --username emr-containers选项 2:不使用 eksctl
-
运行以下命令可在文本编辑器中打开
aws-auth
配置映射。kubectl edit -n kube-system configmap/aws-auth
注意
如果您收到指示
Error from server (NotFound): configmaps "aws-auth" not found
的错误,请参考《Amazon EKS 用户指南》中的添加用户角色的步骤,以应用库存 ConfigMap。 -
在
data
下,将 Amazon EMR on EKS 服务相关角色详细信息添加到ConfigMap
的mapRoles
部分。如果此部分在文件中尚不存在,请添加它。已更新的mapRoles
部分类似于以下示例。apiVersion: v1 data: mapRoles: | - rolearn: arn:aws:iam::<your-account-id>:role/AWSServiceRoleForAmazonEMRContainers username: emr-containers - ... <other previously existing role entries, if there's any>.
-
保存文件并退出文本编辑器。
-