Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Ressources pour utiliser des exemples de SageMaker Spark pour Python (PySpark)
Amazon SageMaker fournit une bibliothèque Python Apache Spark (SageMaker PySpark
Télécharger PySpark
Vous pouvez télécharger le code source des bibliothèques Python Spark (PySpark) et Scala depuis le GitHub dépôt SageMaker Spark
Pour obtenir des instructions sur l'installation de la bibliothèque SageMaker Spark, utilisez l'une des options suivantes ou consultez SageMaker PySpark
-
Installation à l'aide de pip :
pip install sagemaker_pyspark
-
Installation à partir de la source :
git clone git@github.com:aws/sagemaker-spark.git cd sagemaker-pyspark-sdk python setup.py install
-
Vous pouvez également créer un nouveau bloc-notes dans une instance de bloc-notes qui utilise le noyau
Sparkmagic (PySpark)
ou leSparkmagic (PySpark3)
noyau et vous connecter à un EMR cluster Amazon distant.Note
Le EMR cluster Amazon doit être configuré avec un IAM rôle auquel la
AmazonSageMakerFullAccess
politique est attachée. Pour plus d'informations sur la configuration des rôles pour un EMR cluster, consultez la section Configurer les IAM rôles pour Amazon EMR Permissions to AWS Services dans le guide EMR de gestion Amazon.
PySpark exemples
Pour des exemples d'utilisation SageMaker PySpark, voir :
-
Utilisation d'Amazon SageMaker avec Apache Spark
dans Read the Docs. -
SageMaker GitHubRéférentiel Spark
.
Pour exécuter les blocs-notes sur une instance de bloc-notes, consultez Accédez à des exemples de blocs-notes. Pour exécuter les blocs-notes sous Studio, consultez Création ou ouverture d'un bloc-notes Amazon SageMaker Studio Classic.