Risoluzione dei problemi - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi

Se si verifica un problema durante l'utilizzo di Amazon SageMaker Data Wrangler, ti consigliamo di fare quanto segue:

  • Se viene restituito un messaggio di errore, leggi il messaggio e risolvi il problema segnalato, se possibile.

  • Assicurati che il IAM ruolo del tuo utente di Studio Classic disponga delle autorizzazioni necessarie per eseguire l'azione. Per ulteriori informazioni, consulta Sicurezza e autorizzazioni.

  • Se il problema si verifica quando tenti di importare da un altro AWS servizio, come Amazon Redshift o Athena, assicurati di aver configurato le autorizzazioni e le risorse necessarie per eseguire l'importazione dei dati. Per ulteriori informazioni, consulta Importa.

  • Se i problemi persistono, scegli Ottieni assistenza in alto a destra dello schermo per contattare il team di Data Wrangler. Per ulteriori informazioni, vedi le seguenti immagini.

    La posizione del modulo di aiuto Data Wrangler nella console Data Wrangler.
    Il modulo di aiuto di Data Wrangler nella console Data Wrangler.

Come ultima risorsa, puoi provare a riavviare il kernel su cui è in esecuzione Data Wrangler.

  1. Salva ed esci dal file .flow per il quale desideri riavviare il kernel.

  2. Seleziona l'icona Terminali e kernel in esecuzione, come mostrato nell'immagine seguente.

    La posizione dell'icona Running Terminals and Kernels nella console.
  3. Selezionate l'icona Interrompi a destra del file .flow per il quale desideri terminare il kernel, come mostrato nell'immagine seguente.

    La posizione dell'icona Stop nella console.
  4. Aggiorna il browser.

  5. Riapri il file .flow su cui stavi lavorando.

Risoluzione dei problemi con Amazon EMR

Utilizza le seguenti informazioni per aiutarti a risolvere gli errori che potrebbero verificarsi durante l'utilizzo di Amazon. EMR

  • Errore di connessione: se la connessione fallisce con il seguente messaggioThe IP address of the EMR cluster isn't private error message, il tuo EMR cluster Amazon potrebbe non essere stato avviato in una sottorete privata. Come best practice di sicurezza, Data Wrangler supporta solo la connessione a cluster Amazon EMR privati. Scegli una EC2 sottorete privata per avviare un cluster. EMR

  • Interruzione della connessione e timeout: il problema è probabilmente legato alla connettività di rete. Dopo aver avviato la connessione al cluster, lo schermo non si aggiorna. Dopo circa 2 minuti, potresti visualizzare il seguente errore JdbcAddConnectionError: An error occurred when trying to connect to presto: xxx: Connect to xxx failed: Connection timed out (Connection timed out) will display on top of the screen..

    Gli errori possono avere due cause principali:

    • Amazon EMR e Amazon SageMaker Studio Classic sono diversiVPCs. Ti consigliamo di avviare Amazon EMR e Studio Classic contemporaneamenteVPC. Puoi anche usare il VPC peering. Per ulteriori informazioni, vedi Cos'è il VPC peering? .

    • Il gruppo di sicurezza EMR principale di Amazon non dispone della regola del traffico in entrata per il gruppo di sicurezza di Amazon SageMaker Studio Classic sulla porta utilizzata per Presto. Per risolvere il problema, consenti il traffico in entrata sulla porta 8889.

  • La connessione non riesce a causa di una configurazione errata del tipo di connessione: potresti visualizzare il seguente messaggio di errore: Data Wrangler couldn't create a connection to {connection_source} successfully. Try connecting to {connection_source} again. For more information, see Troubleshoot. If you’re still experiencing issues, contact support.

    Verifica il metodo di autenticazione. Il metodo di autenticazione che hai specificato in Data Wrangler deve corrispondere al metodo di autenticazione che stai utilizzando nel cluster.

  • Non disponi HDFS delle autorizzazioni per LDAP l'autenticazione: utilizza la seguente guida per risolvere il problema Configura le HDFS autorizzazioni utilizzando le credenziali Linux. Puoi accedere al cluster utilizzando i seguenti comandi:

    hdfs dfs -mkdir /user/USERNAME hdfs dfs -chown USERNAME:USERNAME /user/USERNAME
  • LDAPerrore di autenticazione con chiave di connessione mancante — Potresti visualizzare il seguente messaggio di errore:. Data Wrangler couldn't connect to EMR hive successfully. JDBC connection is missing required connection key(s): PWD

    Per LDAP l'autenticazione, è necessario specificare sia un nome utente che una password. La proprietà JDBC URL archiviata in Secrets Manager è mancantePWD.

  • Durante la risoluzione dei problemi di LDAP configurazione: ti consigliamo di assicurarti che l'LDAPautenticatore (LDAPserver) sia configurato correttamente per connettersi al cluster AmazonEMR. Usa il comando ldapwhoami per risolvere il problema di configurazione. Di seguito sono riportati esempi di comandi che puoi eseguire:

    • Per — LDAPS ldapwhoami -x -H ldaps://ldap-server

    • Per LDAP — ldapwhoami -x -H ldap://ldap-server

    Entrambi i comandi devono restituire Anonymous se l'autenticatore è stato configurato correttamente.

Risoluzione dei problemi di Salesforce

Errore di configurazione del ciclo di vita

Quando l'utente apre Studio Classic per la prima volta, potrebbe ricevere un errore che indica che c'è qualcosa di sbagliato nella configurazione del ciclo di vita. Usa Amazon CloudWatch per accedere ai log scritti dallo script di configurazione del ciclo di vita. Per ulteriori informazioni sul debugging delle configurazioni del ciclo di vita, consulta Esecuzione del debug delle configurazioni del ciclo di vita.

Se non riesci a eseguire il debug dell'errore, puoi creare il file di configurazione manualmente. Devi creare il file ogni volta che elimini o riavvii il server Jupyter. Per creare il file manualmente, esegui la procedura descritta di seguito.

Per creare un file di configurazione.
  1. Passa a Studio Classic.

  2. Scegli File, quindi Nuovo, quindi Terminale.

  3. Creare il .sfgenie_identity_provider_oauth_config.

  4. Apri il file in un editor di testo.

  5. Aggiungi un JSON oggetto contenente l'Amazon Resource Name (ARN) del segreto Secrets Manager al file. Per creare l'oggetto, puoi utilizzare il modello seguente.

    { "secret_arn": "example-secret-ARN" }
  6. Salva le tue modifiche nel file.

Impossibile accedere al cloud dei dati Salesforce dal flusso Data Wrangler

Dopo che l'utente ha scelto Cloud dei dati Salesforce dal flusso Data Wrangler, potrebbe ricevere un errore indicante che i prerequisiti per configurare la connessione non sono stati soddisfatti. Potrebbe essere causato dai seguenti errori:

  • Il segreto di Salesforce in Secrets Manager non è stato creato.

  • Il segreto Salesforce in Secrets Manager è stato creato, ma manca il tag Salesforce.

  • Il segreto di Salesforce in Secrets Manager è stato creato in modo errato. Regione AWS Ad esempio, l’utente non sarà in grado di accedere ai Dati del cloud Salesforce ca-central-1 perché hai creato il segreto in us-east-1. Puoi replicare il segreto in ca-central-1 o crearne uno nuovo con le stesse credenziali in ca-central-1. Per informazioni sulla replica dei segreti, consulta Replicare un AWS Secrets Manager segreto con altri. Regioni AWS

  • Nella policy utilizzata dai tuoi utenti per accedere ad Amazon SageMaker Studio Classic mancano le autorizzazioni per AWS Secrets Manager

  • C'è un errore di battitura nel Secrets Manager ARN dell'JSONoggetto che hai specificato durante la configurazione del ciclo di vita.

  • C'è un errore di battitura nel segreto di Secrets Manager contenente la configurazione di OAuth Salesforce

Pagina vuota che mostra redirect_uri_mismatch

Dopo aver scelto Salva e connetti, l’utente potrebbe essere reindirizzato a una pagina che mostra redirect_uri_mismatch. La richiamata URI che hai registrato nelle impostazioni dell'app Salesforce Connected è mancante o errata.

Utilizza quanto segue URL per verificare che Studio Classic URL sia registrato correttamente nelle impostazioni dell'app connessa della tua organizzazione Salesforce:. https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/ Per ulteriori informazioni sull'utilizzo delle impostazioni dell'app connessa, vai a quanto segue:URL. https://EXAMPLE_SALESFORCE_ORG/lightning/setup/NavigationMenus/home/

Nota

Sono necessari circa dieci minuti per propagarlo URI all'interno dei sistemi di Salesforce.

Spazi condivisi

Gli spazi condivisi attualmente non funzionano con l'integrazione del Cloud dei dati Salesforce. Puoi eliminare gli spazi condivisi nel dominio Amazon SageMaker AI che intendi utilizzare oppure puoi utilizzare un altro dominio per cui non sono configurati spazi condivisi.

OAuthErrore di reindirizzamento

Gli utenti dovrebbero essere in grado di importare i propri dati dal Cloud dei dati Salesforce dopo aver scelto Connetti. Se riscontrano un errore, consigliamo di chiedere loro di fare quanto segue:

  • Chiedi loro di essere pazienti: quando vengono reindirizzati ad Amazon SageMaker Studio Classic, il completamento del processo di autenticazione può richiedere fino a un minuto. Durante il reindirizzamento, consigliamo di avvisarli di evitare di interagire con il browser. Ad esempio, non dovrebbero chiudere la scheda del browser, passare a un'altra scheda o interagire con il flusso di Data Wrangler. L'interazione con il browser potrebbe rimuovere il codice di autorizzazione necessario per connettersi al cloud dei dati.

  • Consenti ai tuoi utenti di riconnettersi al cloud dei dati: esistono problemi temporanei che possono causare l'interruzione della connessione al Cloud dei dati Salesforce. Chiedi ai tuoi utenti di creare un nuovo flusso Data Wrangler e di provare nuovamente a connettersi al Cloud dei dati Salesforce.

  • Assicurati che i tuoi utenti chiudano tutte le altre schede con Amazon SageMaker Studio Classic: avere Studio Classic aperto in più schede può causare l'interruzione della connessione a Salesforce Data Cloud. Assicurati che i tuoi utenti abbiano una sola scheda di Studio Classic aperta.

  • Più utenti accedono a Studio Classic contemporaneamente: solo un utente alla volta deve accedere a un dominio Amazon SageMaker AI. Se più utenti accedono allo stesso dominio, la connessione che un utente sta tentando di creare a Salesforce Data Cloud potrebbe non riuscire.

Anche l'aggiornamento di Data Wrangler e Studio Classic potrebbe correggere il relativo errore. Per informazioni sull'aggiornamento di Data Wrangler, consulta. Aggiorna Data Wrangler Per informazioni sull'aggiornamento di Studio Classic, consulta. Chiudi e aggiorna SageMaker Studio Classic

Se nessuno dei passaggi precedenti per la risoluzione dei problemi funziona, potresti trovare un messaggio di errore di Salesforce con una descrizione corrispondente incorporata in Studio Classic. URL Di seguito è riportato un esempio di messaggio che potresti trovare: error=invalid_client_id&error_description=client%20identifier%20invalid.

Puoi esaminare il messaggio di errore in URL e provare a risolvere i problemi che presenta. Se il messaggio o la descrizione dell'errore non sono chiari, consigliamo di effettuare una ricerca nella Knowledge Base di Salesforce. Se la ricerca nella knowledge base non funziona, puoi contattare l'help desk di Salesforce per ulteriore assistenza.

Il caricamento di Data Wrangler richiede molto tempo

Quando gli utenti vengono reindirizzati a Data Wrangler dal Cloud dei dati Salesforce, potrebbero verificarsi lunghi tempi di caricamento.

Se è la prima volta che l'utente utilizza Data Wrangler o ha eliminato il kernel, potrebbero essere necessari circa 5 minuti per effettuare il provisioning della nuova EC2 istanza Amazon per utilizzare Data Wrangler.

Se non è la prima volta che l'utente utilizza Data Wrangler e non ha eliminato il kernel, puoi chiedergli di aggiornare la pagina o chiudere il maggior numero possibile di schede del browser.

Se nessuno degli interventi precedenti funziona, chiedi loro di configurare una nuova connessione al Cloud dei dati Salesforce.

L'utente non riesce a esportare i propri dati e riceve un errore Invalid batch Id

Quando l'utente esporta le trasformazioni apportate nei propri dati Salesforce, il processo di SageMaker elaborazione utilizzato da Data Wrangler sul backend potrebbe non riuscire. Il Cloud dei dati Salesforce potrebbe essere temporaneamente non disponibile o potrebbe esserci un problema di memorizzazione nella cache.

Per risolvere il problema, consigliamo agli utenti di tornare alla fase in cui importano i dati e modificare l'ordine delle colonne su cui stanno interrogando. Per esempio, possono modificare la seguente query:

SELECT col_A, col_B FROM table

Per eseguire la seguente query:

SELECT col_B, col_A FROM table

Dopo aver modificato l'ordine delle colonne e essersi assicurati che le trasformazioni successive apportate siano ancora valide, possono ricominciare a esportare i dati.

Gli utenti non possono esportare un set di dati molto grande

Se i tuoi utenti hanno importato un set di dati molto grande dal Cloud dei dati Salesforce, potrebbero non essere in grado di esportare le trasformazioni che hanno apportato. Un set di dati di grandi dimensioni potrebbe contenere troppe righe o può essere il risultato di una query complessa.

Consigliamo ai tuoi utenti di intraprendere le seguenti azioni:

  • Semplificando la loro richiesta SQL

  • Eseguire il campionamento dei propri dati

Di seguito sono riportate alcune strategie che possono utilizzare per semplificare le loro query:

  • Specificare i nomi delle colonne anziché utilizzare l'operatore *

  • Trovare un sottoinsieme dei dati che desiderano importare anziché utilizzare un sottoinsieme più grande

  • Ridurre al minimo i join tra set di dati molto grandi

Possono utilizzare il campionamento per ridurre il numero di righe nel loro set di dati. Per informazioni sui metodi di campionamento, gli utenti possono fare riferimento a Campionamento.

Gli utenti non possono esportare i dati a causa di un token di aggiornamento non valido

Data Wrangler utilizza un JDBC driver per l'integrazione con Salesforce Data Cloud. Il metodo di autenticazione è. OAuth InfattiOAuth, il token di aggiornamento e il token di accesso sono due dati diversi che vengono utilizzati per autorizzare l'accesso alle risorse all'interno di Salesforce Data Cloud.

Il token di accesso, o core token, è ciò che consente di accedere ai dati Salesforce ed eseguire query direttamente tramite Data Wrangler. È di breve durata e progettato per scadere rapidamente. Per mantenere l'accesso ai dati di Salesforce, Data Wrangler utilizza il token di aggiornamento per ottenere un nuovo token di accesso da Salesforce.

Potresti aver impostato la scadenza dell'aggiornamento troppo rapidamente per ottenere un nuovo token di accesso per i tuoi utenti. Potresti dover rivedere la policy sui token di aggiornamento per assicurarti che sia in grado di soddisfare le query che richiedono molto tempo per essere eseguite dagli utenti. Per informazioni sulla configurazione della policy dei token di aggiornamento, consulta https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/.

Query non riuscite o tabelle non caricate

Salesforce riscontra interruzioni del servizio. Anche se hai configurato tutto correttamente, i tuoi utenti potrebbero non essere in grado di importare i propri dati per periodi di tempo.

Le interruzioni del servizio possono verificarsi per motivi di manutenzione. Ti consigliamo di effettuare un controllo il giorno successivo per verificare se il problema è stato risolto.

Se riscontri problemi da più di un giorno, ti consigliamo di contattare l'help desk di Salesforce per ulteriore assistenza. Per informazioni su come contattare Salesforce, vedi Come desideri contattare Salesforce?

OAUTH_APP_BLOCKEDdurante il reindirizzamento di Studio Classic

Quando l'utente viene reindirizzato ad Amazon SageMaker Studio Classic, potrebbe notare il parametro di query error=OAUTH_APP_BLOCKED all'URLinterno di. Potrebbero avere un problema temporaneo che dovrebbe risolversi da solo entro un giorno.

È possibile che tu abbia bloccato anche il loro accesso all'app connessa. Per ulteriori informazioni sulla risoluzione del problema, consulta https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ConnectedApplication/home/

OAUTH_APP_DENIEDdurante il reindirizzamento di Studio Classic

Quando l'utente viene reindirizzato ad Amazon SageMaker Studio Classic, potrebbe notare il parametro di query error=OAUTH_APP_ACCESS_DENIED all'URLinterno di. Non hai concesso al loro tipo di profilo le autorizzazioni per accedere ai dati Connected App associati a Data Wrangler.

Per risolvere il problema di accesso, vai a https://EXAMPLE_SALESFORCE_ORG_URL/lightning/setup/ManageUsers/home/ e verifica se l'utente è assegnato al profilo corretto.