API Sessioni interattive - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

API Sessioni interattive

L'API delle sessioni interattive descrive l' AWS Glue API relativa all'utilizzo di sessioni AWS Glue interattive per creare e testare script di estrazione, trasformazione e caricamento (ETL) per l'integrazione dei dati.

Tipi di dati

Struttura sessione

Il periodo in cui è in esecuzione un ambiente di runtime Spark remoto.

Campi
  • Id: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID della sessione.

  • CreatedOn: timestamp.

    La data e l'ora di creazione della sessione.

  • Status: stringa UTF-8 (valori validi: PROVISIONING | READY | FAILED | TIMEOUT | STOPPING | STOPPED).

    Lo stato della sessione.

  • ErrorMessage: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Il messaggio di errore visualizzato durante la sessione.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    La descrizione della sessione.

  • Role: stringa UTF-8, non inferiore a 20 o superiore a 2048 byte di lunghezza, corrispondente a Custom string pattern #26.

    Il nome o l’Amazon Resource Name (ARN) del ruolo IAM associato alla sessione.

  • Command: un oggetto SessionCommand.

    Il comando Object.see. SessionCommand

  • DefaultArguments: una matrice di mappe con coppie chiave-valore, non superiore alle 75 coppie.

    Ogni chiave è una stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    Ogni valore è una stringa UTF-8, non superiore a 4096 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una matrice della mappa di coppie chiave-valore. Il massimo è 75 coppie.

  • Connections: un oggetto ConnectionsList.

    Il numero di connessioni utilizzate per la sessione.

  • Progress: numero (doppio).

    L'avanzamento dell'esecuzione del codice della sessione.

  • MaxCapacity: numero (doppio).

    Il numero di unità di elaborazione AWS Glue dati (DPU) che possono essere allocate durante l'esecuzione del processo. Una DPU è una misura relativa della potenza di elaborazione ed è costituita da 4 vCPU di capacità di elaborazione e 16 GB di memoria.

  • SecurityConfiguration: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il nome della SecurityConfiguration struttura da utilizzare con la sessione.

  • GlueVersion: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Custom string pattern #20.

    La AWS Glue versione determina le versioni di Apache Spark e Python supportate. AWS Glue GlueVersion Deve essere maggiore di 2.0.

  • DataAccessId: stringa UTF-8, non inferiore a 1 o superiore a 36 byte di lunghezza.

    L'ID di accesso ai dati della sessione.

  • PartitionId: stringa UTF-8, non inferiore a 1 o superiore a 36 byte di lunghezza.

    L'ID di partizione della sessione.

  • NumberOfWorkers: numero (intero).

    Il numero di dipendenti di uno specifico WorkerType da utilizzare per la sessione.

  • WorkerType: stringa UTF-8 (valori validi: Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="").

    Il tipo di worker predefinito allocato quando viene eseguita una sessione. Accetta un valore di G.1X, G.2X, G.4X o G.8X per le sessioni Spark. Accetta il valore Z.2X per le sessioni Ray.

  • CompletedOn: timestamp.

    La data e ora in cui questa sessione è stata completata.

  • ExecutionTime: numero (doppio).

    Il tempo totale di esecuzione della sessione.

  • DPUSeconds: numero (doppio).

    Le DPU utilizzate dalla sessione (formula: ExecutionTime * MaxCapacity).

  • IdleTimeout: numero (intero).

    Il numero di minuti di inattività prima del timeout della sessione.

  • ProfileName: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il nome di un profilo di AWS Glue utilizzo associato alla sessione.

SessionCommand struttura

Il SessionCommand che esegue questo lavoro.

Campi
  • Name: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Speciifica il nome di. SessionCommand Può essere 'glueetl' o 'gluestreaming'.

  • PythonVersion: stringa UTF-8, corrispondente a Custom string pattern #21.

    Specifica la versione di Python. La versione Python indica la versione supportata per i processi di tipo Spark.

Struttura istruzione

La dichiarazione o la richiesta di un'operazione particolare in una sessione.

Campi
  • Id: numero (intero).

    L'ID della dichiarazione.

  • Code: stringa UTF-8.

    Il codice di esecuzione della dichiarazione.

  • State: stringa UTF-8 (valori validi: WAITING | RUNNING | AVAILABLE | CANCELLING | CANCELLED | ERROR).

    Lo stato mentre viene eseguita la richiesta.

  • Output: un oggetto StatementOutput.

    L'output in JSON.

  • Progress: numero (doppio).

    L'avanzamento dell'esecuzione del codice.

  • StartedOn: numero (lungo).

    L'ora e la data unix in cui è stata avviata la definizione del processo.

  • CompletedOn: numero (lungo).

    L'ora e la data unix in cui è stata completata la definizione del processo.

StatementOutput struttura

Output dell'esecuzione del codice in formato JSON.

Campi
  • Data: un oggetto StatementOutputData.

    L'output dell'esecuzione del codice.

  • ExecutionCount: numero (intero).

    Il numero di esecuzioni dell'output.

  • Status: stringa UTF-8 (valori validi: WAITING | RUNNING | AVAILABLE | CANCELLING | CANCELLED | ERROR).

    Lo stato dell’output di esecuzione del codice.

  • ErrorName: stringa UTF-8.

    Il nome dell'errore nell'output.

  • ErrorValue: stringa UTF-8.

    Il valore dell’errore dell'output.

  • Traceback: una matrice di stringhe UTF-8.

    L’analisi dell'output.

StatementOutputData struttura

Output dell'esecuzione del codice in formato JSON.

Campi
  • TextPlain: stringa UTF-8.

    L'output dell'esecuzione del codice in formato testo.

ConnectionsList struttura

Specifica le connessioni utilizzate da un processo.

Campi
  • Connections: una matrice di stringhe UTF-8.

    Un elenco di connessioni utilizzate dal processo.

Operazioni

CreateSession azione (Python: create_session)

Crea una nuova sessione.

Richiesta

Richiedi la creazione di una nuova sessione.

  • Id: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID della richiesta della sessione.

  • Description: stringa di descrizione, non superiore a 2048 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    La descrizione della sessione.

  • Role: obbligatorio: stringa UTF-8, non inferiore a 20 o superiore a 2048 byte di lunghezza, corrispondente a Custom string pattern #26.

    L'ARN del ruolo IAM

  • Command: obbligatorio: un oggetto SessionCommand.

    Il SessionCommand che esegue questo lavoro.

  • Timeout: numero (intero), almeno 1.

    Il numero di minuti prima che la sessione scada. L'impostazione predefinita per i processi ETL di Spark è 48 ore (2.880 minuti), la durata massima della sessione per questo tipo di processo. Consulta la documentazione per altri tipi di processo.

  • IdleTimeout: numero (intero), almeno 1.

    Il numero di minuti di inattività prima del timeout della sessione. L'impostazione predefinita per i processi ETL di Spark è il valore di timeout. Consulta la documentazione per altri tipi di processo.

  • DefaultArguments: una matrice di mappe con coppie chiave-valore, non superiore alle 75 coppie.

    Ogni chiave è una stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    Ogni valore è una stringa UTF-8, non superiore a 4096 byte di lunghezza, corrispondente a URI address multi-line string pattern.

    Una matrice della mappa di coppie chiave-valore. Il massimo è 75 coppie.

  • Connections: un oggetto ConnectionsList.

    Il numero di connessioni da utilizzare per la sessione.

  • MaxCapacity: numero (doppio).

    Il numero di unità di elaborazione AWS Glue dati (DPU) che possono essere allocate durante l'esecuzione del processo. Una DPU è una misura relativa della potenza di elaborazione ed è costituita da 4 vCPU di capacità di elaborazione e 16 GB di memoria.

  • NumberOfWorkers: numero (intero).

    Il numero di dipendenti di uno specifico WorkerType da utilizzare per la sessione.

  • WorkerType: stringa UTF-8 (valori validi: Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="").

    Il tipo di worker predefinito allocato quando viene eseguito un processo. Accetta un valore di G.1X, G.2X, G.4X o G.8X per i processi Spark. Accetta il valore Z.2X per i notebook Ray.

    • Per il tipo di worker G.1X, ciascun worker esegue la mappatura su 1 DPU (4 vCPU, 16 GB di memoria) con disco da 84 GB (circa 34 GB liberi) e fornisce 1 esecutore. Questi tipi di worker sono raccomandati per carichi di lavoro come trasformazioni di dati, join e query, in quanto offrono un modo scalabile ed economico per eseguire la maggior parte dei processi.

    • Per il tipo di worker G.2X, ciascun worker esegue la mappatura su 2 DPU (8 vCPU, 32 GB di memoria) con disco da 128 GB (circa 77 GB liberi) e fornisce 1 esecutore. Questi tipi di worker sono raccomandati per carichi di lavoro come trasformazioni di dati, join e query, in quanto offrono un modo scalabile ed economico per eseguire la maggior parte dei processi.

    • Per il tipo di worker G.4X, ciascun worker esegue la mappatura su 4 DPU (16 vCPU, 64 GB di memoria) con disco da 256 GB (circa 235 GB liberi) e fornisce 1 esecutore. Questi tipi di worker sono raccomandati per i processi i cui carichi di lavoro contengono trasformazioni, aggregazioni, join e query con i requisiti più elevati. Questo tipo di lavoratore è disponibile solo per i lavori Spark ETL AWS Glue versione 3.0 o successiva AWS nelle seguenti regioni: Stati Uniti orientali (Ohio), Stati Uniti orientali (Virginia settentrionale), Stati Uniti occidentali (Oregon), Asia Pacifico (Singapore), Asia Pacifico (Sydney), Asia Pacifico (Tokyo), Canada (Centrale), Europa (Francoforte), Europa (Irlanda) ed Europa (Stoccolma).

    • Per il tipo di worker G.8X, ciascun worker esegue la mappatura su 8 DPU (32 vCPU, 128 GB di memoria) con disco da 512 GB (circa 487 GB liberi) e fornisce 1 esecutore. Questi tipi di worker sono raccomandati per i processi i cui carichi di lavoro contengono trasformazioni, aggregazioni, join e query con i requisiti più elevati. Questo tipo di worker è disponibile solo per i job Spark ETL AWS Glue versione 3.0 o successiva, nelle stesse AWS regioni supportate per il tipo di G.4X lavoratore.

    • Per il tipo di worker Z.2X, ciascun worker esegue la mappatura su 2 M-DPU (8 vCPU, 64 GB di memoria) con disco da 128 GB (circa 120 GB liberi) e fornisce un massimo di 8 worker Ray in base all'autoscaler.

  • SecurityConfiguration: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il nome della SecurityConfiguration struttura da utilizzare con la sessione

  • GlueVersion: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Custom string pattern #20.

    La AWS Glue versione determina le versioni di Apache Spark e Python supportate. AWS Glue GlueVersion Deve essere maggiore di 2.0.

  • DataAccessId: stringa UTF-8, non inferiore a 1 o superiore a 36 byte di lunghezza.

    L'ID di accesso ai dati della sessione.

  • PartitionId: stringa UTF-8, non inferiore a 1 o superiore a 36 byte di lunghezza.

    L'ID di partizione della sessione.

  • Tags: una matrice di mappe con coppie chiave-valore, non superiore alle 50 coppie.

    Ogni chiave è una stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza.

    Ogni valore è una stringa UTF-8, lunga non più di 256 byte.

    La mappa delle coppie di valori chiave (tag) appartenenti alla sessione.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta.

  • ProfileName: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Il nome di un profilo di AWS Glue utilizzo associato alla sessione.

Risposta
  • Session: un oggetto Sessione.

    Restituisce l'oggetto di sessione nella risposta.

Errori
  • AccessDeniedException

  • IdempotentParameterMismatchException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • ValidationException

  • AlreadyExistsException

  • ResourceNumberLimitExceededException

StopSession azione (Python: stop_session)

Interrompe la sessione.

Richiesta
  • Id: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID della sessione da interrompere.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta.

Risposta
  • Id: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Restituisce l'ID della sessione interrotta.

Errori
  • AccessDeniedException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • IllegalSessionStateException

  • ConcurrentModificationException

DeleteSession azione (Python: delete_session)

Elimina la sessione.

Richiesta
  • Id: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID della sessione da eliminare.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    Il nome dell'origine della richiesta di eliminazione della sessione.

Risposta
  • Id: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    Restituisce l'ID della sessione eliminata.

Errori
  • AccessDeniedException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • IllegalSessionStateException

  • ConcurrentModificationException

GetSession azione (Python: get_session)

Recupera la sessione.

Richiesta
  • Id: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID della sessione.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta.

Risposta
  • Session: un oggetto Sessione.

    Salva l'oggetto di sessione restituito nella risposta.

Errori
  • AccessDeniedException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

ListSessions azione (Python: list_sessions)

Recupera un elenco di sessioni.

Richiesta
  • NextToken: stringa UTF-8, non superiore a 400000 byte di lunghezza.

    Il token per il successivo set di risultati oppure null se non ci sono altri risultati.

  • MaxResults: numero (intero), non inferiore a 1 o superiore a 1000.

    Il numero massimo di risultati.

  • Tags: una matrice di mappe con coppie chiave-valore, non superiore alle 50 coppie.

    Ogni chiave è una stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza.

    Ogni valore è una stringa UTF-8, lunga non più di 256 byte.

    Tag appartenenti alla sessione.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta.

Risposta
  • Ids: una matrice di stringhe UTF-8.

    Restituisce l'ID della sessione.

  • Sessions: una matrice di oggetti Sessione.

    Restituisce l'oggetto di sessione.

  • NextToken: stringa UTF-8, non superiore a 400000 byte di lunghezza.

    Il token per il successivo set di risultati oppure null se non ci sono altri risultati.

Errori
  • AccessDeniedException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

RunStatement azione (Python: run_statement)

Esegue l’struzione.

Richiesta
  • SessionId: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID di sessione dell'istruzione da eseguire.

  • Code: obbligatorio: stringa UTF-8, non superiore a 68000 byte di lunghezza.

    Il codice dell'istruzione da eseguire.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta.

Risposta
  • Id: numero (intero).

    Restituisce l'ID dell'istruzione che è stata eseguita.

Errori
  • EntityNotFoundException

  • AccessDeniedException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • ValidationException

  • ResourceNumberLimitExceededException

  • IllegalSessionStateException

CancelStatement azione (Python: cancel_statement)

Annulla l’istruzione.

Richiesta
  • SessionId: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID di sessione dell'istruzione da annullare.

  • Id: obbligatorio: numero (intero).

    L'ID dell'istruzione da annullare.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta di annullare l'istruzione.

Risposta
  • Nessun parametro di risposta.

Errori
  • AccessDeniedException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • IllegalSessionStateException

GetStatement azione (Python: get_statement)

Recupera l'istruzione.

Richiesta
  • SessionId: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID sessione dell'istruzione.

  • Id: obbligatorio: numero (intero).

    L'ID dell’istruzione.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta.

Risposta
Errori
  • AccessDeniedException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • IllegalSessionStateException

ListStatements azione (Python: list_statements)

Elenca le istruzioni per la sessione.

Richiesta
  • SessionId: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.

    L'ID sessione delle istruzioni.

  • RequestOrigin: stringa UTF-8, non inferiore a 1 o superiore a 128 byte di lunghezza, corrispondente a Custom string pattern #27.

    L’origine della richiesta di elencare le istruzioni.

  • NextToken: stringa UTF-8, non superiore a 400000 byte di lunghezza.

    Un token di continuazione, se si tratta di una chiamata di continuazione.

Risposta
  • Statements: una matrice di oggetti Dichiarazione.

    Restituisce l'elenco delle istruzioni.

  • NextToken: stringa UTF-8, non superiore a 400000 byte di lunghezza.

    Un token di continuazione, se non sono ancora stati restituiti tutte le istruzioni.

Errori
  • AccessDeniedException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • IllegalSessionStateException