選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

使用 SageMaker AI Spark for Python (PySpark) 範例的資源

焦點模式
使用 SageMaker AI Spark for Python (PySpark) 範例的資源 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 提供 Apache Spark Python 程式庫 (SageMaker AI PySpark),可用來整合 Apache Spark 應用程式與 SageMaker AI。本主題包含可協助您開始使用 PySpark 的範例。如需 SageMaker AI Apache Spark 程式庫的相關資訊,請參閱 搭配 Amazon SageMaker AI 的 Apache Spark

下載 PySpark

您可以從 SageMaker AI Spark GitHub 儲存庫下載 Python Spark (PySpark) 和 Scala 程式庫的原始程式碼。

如需安裝 SageMaker AI Spark 程式庫的說明,請使用下列任一選項或造訪 SageMaker AI PySpark

  • 使用 pip 安裝:

    pip install sagemaker_pyspark
  • 從來源安裝 :

    git clone git@github.com:aws/sagemaker-spark.git cd sagemaker-pyspark-sdk python setup.py install
  • 您也可以在筆記本執行個體中建立新的筆記本,該執行個體使用 Sparkmagic (PySpark)Sparkmagic (PySpark3) 核心並連線至遠端 Amazon EMR 叢集。

    注意

    Amazon EMR 叢集必須使用已連接 AmazonSageMakerFullAccess政策的 IAM 角色進行設定。有關為 EMR 羣集配置角色的資訊,請參閱為亞馬遜 EMR 權限配置 IAM 角色 AWS 服務亞馬遜 EMR 管理指南

PySpark 範例

如需使用 SageMaker AI PySpark 的範例,請參閱:

若要在筆記本執行個體上執行筆記本,請參閱存取範例筆記本。若要在 Studio 上執行筆記本,請參閱建立或開啟 Amazon SageMaker Studio Classic Notebook

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。