Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Risorse per usare SageMaker Spark per esempi in Python (PySpark)
Amazon SageMaker fornisce una libreria Python Apache Spark (SageMaker PySpark
Scarica PySpark
Per istruzioni sull'installazione della libreria SageMaker Spark, usa una delle seguenti opzioni o visita. SageMaker PySpark
-
Installa usando pip:
pip install sagemaker_pyspark
-
Installa dalla fonte:
git clone git@github.com:aws/sagemaker-spark.git cd sagemaker-pyspark-sdk python setup.py install
-
Puoi anche creare un nuovo notebook in un'istanza notebook che utilizza il
Sparkmagic (PySpark3)
kernelSparkmagic (PySpark)
o e connetterti a un EMR cluster Amazon remoto.Nota
Il EMR cluster Amazon deve essere configurato con un IAM ruolo a cui è associata la
AmazonSageMakerFullAccess
policy. Per informazioni sulla configurazione dei ruoli per un EMR cluster, consulta Configure IAM Roles for Amazon EMR Permissions to AWS Services nella Amazon EMR Management Guide.
PySpark esempi
Per esempi sull'utilizzo SageMaker PySpark, consulta:
-
Utilizzo di Amazon SageMaker con Apache Spark
in Read the Docs. -
SageMaker Archivio Spark.
GitHub
Per eseguire i notebook su un'istanza del notebook, consulta Accedi a taccuini di esempio. Per eseguire i notebook su Studio, consulta Crea o apri un notebook Amazon SageMaker Studio Classic.