As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Recursos para usar exemplos do SageMaker AI Spark para Python (PySpark)
A Amazon SageMaker AI fornece uma biblioteca Apache Spark Python (SageMaker AI PySpark
Baixar PySpark
Para obter instruções sobre como instalar a biblioteca do SageMaker AI Spark, use qualquer uma das opções a seguir ou visite o SageMaker AI PySpark
-
Instale usando pip:
pip install sagemaker_pyspark
-
Instale a partir da fonte:
git clone git@github.com:aws/sagemaker-spark.git cd sagemaker-pyspark-sdk python setup.py install
-
Você também pode criar um novo caderno em uma instância de caderno que use o kernel
Sparkmagic (PySpark)
ouSparkmagic (PySpark3)
para se conectar a um cluster remoto do Amazon EMR.nota
O cluster do Amazon EMR deve ser configurado com um perfil do IAM que tenha a política
AmazonSageMakerFullAccess
anexada. Para obter informações sobre a configuração de funções para um cluster do EMR, consulte Configurar funções do IAM para permissões do Amazon EMR em serviços da AWS no Guia de Gerenciamento do Amazon EMR.
PySpark exemplos
Para exemplos sobre o uso da SageMaker IA PySpark, consulte:
-
Usando o Amazon SageMaker AI com o Apache Spark
em Read the Docs. -
SageMaker GitHubRepositório AI Spark
.
Para executar os cadernos em uma instância de caderno, consulte Cadernos de exemplo de acesso. Para executar os cadernos no Studio, consulte Crie ou abra um notebook Amazon SageMaker Studio Classic.