Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Tutorial: utilizzo di un notebook SageMaker con l'endpoint di sviluppo
In AWS Glue, puoi creare un endpoint di sviluppo e quindi creare un notebook SageMaker per sviluppare script ETL e Machine Learning. Un notebook SageMaker è un'istanza di calcolo di Machine Learning completamente gestita che esegue l'applicazione Jupyter Notebook.
-
Nella console AWS Glue seleziona Dev endpoints (Endpoint di sviluppo) per passare all'elenco degli endpoint di sviluppo.
-
Seleziona la casella di controllo accanto al nome di un endpoint di sviluppo che desideri utilizzare e nel menu Action (Azione), scegli Create SageMaker notebook (Creazione di un notebook SageMaker).
-
Compilare la pagina Create and configure a notebook (Crea e configura un notebook) come segue:
-
Immettere il nome di un notebook.
-
In Attach to development endpoint (Collega a endpoint di sviluppo), verificare l'endpoint di sviluppo.
-
Creare o scegliere un ruolo AWS Identity and Access Management (IAM).
Si consiglia di creare un ruolo. Se si utilizza un ruolo esistente, assicurarsi di avere le autorizzazioni necessarie. Per ulteriori informazioni, consulta Fase 6: creare una policy IAM per i notebook SageMaker.
-
(Facoltativo) Scegliere un VPC, una sottorete e uno o più gruppi di sicurezza.
-
(Facoltativo) Scegliere una chiave di crittografia AWS Key Management Service.
-
(Facoltativo) Aggiungere i tag per l'istanza del notebook.
-
-
Seleziona Create Notebook (Crea notebook). Sulla pagina Notebooks (Notebook), scegli l'icona di aggiornamento in alto a destra e continua fino a quando la finestra Status (Stato) non mostra
Ready
. -
Selezionare la casella di controllo accanto al nuovo nome del notebook, quindi scegliere Open notebook (Apri notebook).
-
Creare un nuovo notebook: nella pagina jupyter scegliere New (Nuovo), quindi scegliere Sparkmagic (PySpark).
La schermata dovrebbe essere simile alla seguente:
-
(Facoltativo) Nella parte superiore della pagina, scegliere Untitled (Senza titolo) e assegnare un nome al notebook.
-
Per avviare un'applicazione Spark, immettere il seguente comando nel notebook e quindi nella barra degli strumenti scegliere Run (Esegui).
spark
Dopo una breve attesa, viene visualizzata la seguente risposta:
-
Creare un frame dinamico ed eseguirvi una query: copiare, incollare ed eseguire il codice seguente, che restituisce il conteggio e lo schema della tabella
persons_json
.import sys from pyspark.context import SparkContext from awsglue.context import GlueContext from awsglue.transforms import * glueContext = GlueContext(SparkContext.getOrCreate()) persons_DyF = glueContext.create_dynamic_frame.from_catalog(database="legislators", table_name="persons_json") print ("Count: ", persons_DyF.count()) persons_DyF.printSchema()