Importazione dei dati - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Importazione dei dati

Amazon SageMaker Canvas supporta l'importazione di dati tabulari, di immagini e documenti. Puoi importare set di dati dal tuo computer locale, da servizi Amazon come Amazon S3 e Amazon Redshift e da fonti di dati esterne. Quando importi set di dati da Amazon S3, puoi importare un set di dati di qualsiasi dimensione. Utilizza i set di dati che importi per creare modelli e fare previsioni per altri set di dati.

Ogni caso d'uso per il quale è possibile creare un modello personalizzato accetta diversi tipi di input. Ad esempio, se desideri creare un modello di classificazione delle immagini a etichetta singola, devi importare i dati di immagini. Per ulteriori informazioni sui diversi tipi di modello e sui dati che accettano, consulta Come funzionano i modelli personalizzati. Puoi importare dati e creare modelli personalizzati in SageMaker Canvas per i seguenti tipi di dati:

  • Tabular (CSV, Parquet o tavoli)

    • Categoriale: utilizza i dati categoriali per creare modelli di previsione categoriali personalizzati per previsioni a 2 e 3 o più categorie.

    • Numerico: utilizza dati numerici per creare modelli di previsione numerici personalizzati.

    • Testo: utilizza i dati di testo per creare modelli di previsione testuale multicategoria personalizzati.

    • Serie temporali: utilizza i dati delle serie temporali per creare modelli di previsione di serie temporali personalizzati.

  • Immagine (JPGoPNG): utilizza i dati dell'immagine per creare modelli di previsione delle immagini personalizzati con etichetta singola.

  • Documento (PDF,, JPGPNG,TIFF): i dati del documento sono supportati solo per i modelli SageMaker Canvas Ready-to-use. Per ulteriori informazioni sui Ready-to-use modelli in grado di effettuare previsioni per i dati dei documenti, consultaReady-to-use modelli.

È possibile importare dati in Canvas dalle seguenti origini dati:

  • File locali sul tuo computer

  • Bucket Amazon S3

  • Cluster forniti da Amazon Redshift (non Amazon Redshift Serverless)

  • AWS Glue Data Catalog tramite Amazon Athena

  • Amazon Aurora

  • Servizio di Database Relazionale Amazon (AmazonRDS)

  • Data Cloud di Salesforce

  • Snowflake

  • Databricks, SQLServer MariadB e altri database popolari tramite connettori JDBC

  • Oltre 40 piattaforme SaaS esterne, come SAP OData

Per un elenco completo delle fonti di dati da cui è possibile importare, consulta la tabella seguente:

Origine Tipo Tipi di dati supportati

Caricamento dei file locali

Locale

Tabella, immagine, documento

Amazon Aurora

Interno di Amazon

Tabulare

Bucket Amazon S3

Interno di Amazon

Tabella, immagine, documento

Amazon RDS

Interno di Amazon

Tabulare

Cluster con provisioning di Amazon Redshift (non Redshift Serverless)

Interno di Amazon

Tabulare

AWS Glue Data Catalog (tramite Amazon Athena)

Interno di Amazon

Tabulare

Databricks

Esterno

Tabulare

Snowflake

Esterno

Tabulare

Data Cloud di Salesforce

Esterno

Tabulare

SQLServer

Esterno

Tabulare

Mio SQL

Esterno

Tabulare

Poster SQL

Esterno

Tabulare

MariaDB

Esterno

Tabulare

Amplitude

Piattaforma SaaS esterna

Tabulare

CircleCI

Piattaforma SaaS esterna

Tabulare

DocuSign Monitora

Piattaforma SaaS esterna

Tabulare

Domo

Piattaforma SaaS esterna

Tabulare

Datadog

Piattaforma SaaS esterna

Tabulare

Dynatrace

Piattaforma SaaS esterna

Tabulare

Annunci su Facebook

Piattaforma SaaS esterna

Tabulare

Approfondimenti sulla pagina Facebook

Piattaforma SaaS esterna

Tabulare

Annunci Google

Piattaforma SaaS esterna

Tabulare

Google Analytics 4

Piattaforma SaaS esterna

Tabulare

Console di ricerca Google

Piattaforma SaaS esterna

Tabulare

GitHub

Piattaforma SaaS esterna

Tabulare

GitLab

Piattaforma SaaS esterna

Tabulare

Infor Nexus

Piattaforma SaaS esterna

Tabulare

Annunci su Instagram

Piattaforma SaaS esterna

Tabulare

Jira Cloud

Piattaforma SaaS esterna

Tabulare

LinkedIn Annunci

Piattaforma SaaS esterna

Tabulare

LinkedIn Annunci

Piattaforma SaaS esterna

Tabulare

Mailchimp

Piattaforma SaaS esterna

Tabulare

Marketo

Piattaforma SaaS esterna

Tabulare

Microsoft Teams

Piattaforma SaaS esterna

Tabulare

Mixpanel

Piattaforma SaaS esterna

Tabulare

Okta

Piattaforma SaaS esterna

Tabulare

Salesforce

Piattaforma SaaS esterna

Tabulare

Salesforce Marketing Cloud

Piattaforma SaaS esterna

Tabulare

Salesforce Pardot

Piattaforma SaaS esterna

Tabulare

SAP OData

Piattaforma SaaS esterna

Tabulare

SendGrid

Piattaforma SaaS esterna

Tabulare

ServiceNow

Piattaforma SaaS esterna

Tabulare

Singular

Piattaforma SaaS esterna

Tabulare

Slack

Piattaforma SaaS esterna

Tabulare

Stripe

Piattaforma SaaS esterna

Tabulare

Trend Micro

Piattaforma SaaS esterna

Tabulare

Typeform

Piattaforma SaaS esterna

Tabulare

Veeva

Piattaforma SaaS esterna

Tabulare

Zendesk

Piattaforma SaaS esterna

Tabulare

Chat Zendesk

Piattaforma SaaS esterna

Tabulare

Zendesk Sell

Piattaforma SaaS esterna

Tabulare

Zendesk Sunshine

Piattaforma SaaS esterna

Tabulare

Riunioni Zoom

Piattaforma SaaS esterna

Tabulare

Per istruzioni su come importare dati e informazioni sui requisiti dei dati di input, ad esempio la dimensione massima del file per le immagini, consulta Creazione di un set di dati.

Canvas fornisce anche diversi set di dati di esempio nell'applicazione per aiutarti a iniziare. Per ulteriori informazioni sui set di dati SageMaker di esempio forniti con cui puoi sperimentare, consulta Utilizzare set di dati di esempio.

Dopo aver importato un set di dati in Canvas, è possibile aggiornare il set di dati in qualsiasi momento. È possibile eseguire un aggiornamento manuale o impostare una pianificazione per gli aggiornamenti automatici dei set di dati. Per ulteriori informazioni, consulta Aggiornamento di un set di dati.

Per ulteriori informazioni specifiche per ciascun tipo di set di dati, consulta le sezioni seguenti:

Tabulare

Per importare dati da un'origine dati esterna (come un database Snowflake o una piattaforma SaaS), è necessario autenticarsi e connettersi all'origine dati nell'applicazione Canvas. Per ulteriori informazioni, consulta Connessione alle origini dati.

Se desideri importare set di dati di dimensioni superiori a 5 GB da Amazon S3 in Canvas, puoi ottenere un campionamento più rapido utilizzando Amazon Athena per interrogare e campionare i dati da Amazon S3.

Dopo aver creato i set di dati in Canvas, puoi preparare e trasformare i dati utilizzando la funzionalità di preparazione dei dati di Data Wrangler. Puoi utilizzare Data Wrangler per gestire i valori mancanti, trasformare le tue funzionalità, unire più set di dati in un unico set di dati e altro ancora. Per ulteriori informazioni, consulta Preparazione dei dati.

Suggerimento

Finché i dati sono disposti in tabelle, è possibile unire set di dati provenienti da varie fonti, come Amazon Redshift, Amazon Athena o Snowflake.

Immagine

Per informazioni su come modificare un set di dati di immagini ed eseguire attività come l'assegnazione o la riassegnazione di etichette, l'aggiunta di immagini o l'eliminazione di immagini, consulta Modifica di un set di dati di immagini.