

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 SageMaker AI Spark for Python 的资源 (PySpark) 示例
<a name="apache-spark-additional-examples"></a>

Amazon SageMaker AI 提供了一个 Apache Spark Python 库 ([SageMaker AI PySpark](https://github.com/aws/sagemaker-spark/tree/master/sagemaker-pyspark-sdk))，你可以用它来将 Apache Spark 应用程序与 SageMaker AI 集成。本主题包含可帮助您入门的示例 PySpark。有关 SageMaker AI Apache Spark 库的信息，请参阅[Apache Spark 搭载亚马逊 A SageMaker I](apache-spark.md)。

**下载 PySpark**

你可以从 [SageMaker AI](https://github.com/aws/sagemaker-spark) Spark 存储库中下载 Python Spark (PySpark) 和 Scala GitHub 库的源代码。

有关安装 SageMaker AI Spark 库的说明，请使用以下任一选项或访问 [SageMaker AI PySpark](https://github.com/aws/sagemaker-spark/tree/master/sagemaker-pyspark-sdk)。
+ 使用 pip 安装：

  ```
  pip install sagemaker_pyspark
  ```
+ 从源代码安装：

  ```
  git clone git@github.com:aws/sagemaker-spark.git
  cd sagemaker-pyspark-sdk
  python setup.py install
  ```
+ 您还可以在使用 `Sparkmagic (PySpark)` 或 `Sparkmagic (PySpark3)` 内核的笔记本实例中创建新笔记本，并连接到远程 Amazon EMR 集群。
**注意**  
Amazon EMR 集群必须配置有附加 `AmazonSageMakerFullAccess` 策略的 IAM 角色。有关为 EMR 集群配置角色的信息，请参阅《Amazon EMR 管理指南》**中的[为 Amazon EMR 对 AWS 服务的权限配置 IAM 角色](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-iam-roles.html)。

**PySpark 例子**

有关使用 SageMaker AI 的示例 PySpark，请参阅：
+ 在 “阅读文档” 中将@@ [亚马逊 SageMaker 人工智能与 Apache Spark 配合使用](https://sagemaker-examples.readthedocs.io/en/latest/sagemaker-spark/index.html)。
+ [SageMaker AI Spark](https://github.com/aws/sagemaker-spark) GitHub 存储库。