Ejemplos de recursos para usar SageMaker AI Spark para Python (PySpark)

Amazon SageMaker AI proporciona una biblioteca Python (SageMaker AI PySpark) de Apache Spark que puede utilizar para integrar las aplicaciones de Apache Spark con la SageMaker IA. Este tema contiene ejemplos que le ayudarán a empezar PySpark. Para obtener información sobre la biblioteca SageMaker AI Apache Spark, consulteApache Spark con Amazon SageMaker AI.

Download PySpark

Puedes descargar el código fuente de las bibliotecas Python Spark (PySpark) y Scala desde el GitHub repositorio de SageMaker AI Spark.

Para obtener instrucciones sobre cómo instalar la biblioteca SageMaker AI Spark, usa cualquiera de las siguientes opciones o visita SageMaker AI PySpark.

Instalación con pip:
```
pip install sagemaker_pyspark
```

Instalación desde el origen:


git clone git@github.com:aws/sagemaker-spark.git
cd sagemaker-pyspark-sdk
python setup.py install

También puede crear un nuevo cuaderno en una instancia de cuaderno que utilice Sparkmagic (PySpark) o el kernel de Sparkmagic (PySpark3) y conectarse a un clúster remoto de Amazon EMR.

nota
El clúster de Amazon EMR debe configurarse con un rol de IAM que tenga asociada la política AmazonSageMakerFullAccess. Para obtener información sobre cómo configurar roles para un clúster de EMR, consulte Configure IAM Roles for Amazon EMR Permissions to AWS Services en la Guía de administración de Amazon EMR.

PySpark ejemplos

Para ver ejemplos sobre el uso de la SageMaker IA PySpark, consulte:

Uso de Amazon SageMaker AI con Apache Spark en Read the Docs.
SageMaker GitHubRepositorio AI Spark.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Utilízalo SageMakerEstimator en un Spark Pipeline

Chainer

Ejemplos de recursos para usar SageMaker AI Spark para Python (PySpark)

nota