Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Selezionare dati per l’etichettatura
<a name="sms-data-filtering"></a>

Puoi utilizzare la console Amazon SageMaker AI per selezionare una parte del tuo set di dati per l'etichettatura. I dati devono essere archiviati in un bucket S3 Amazon. Sono disponibili tre opzioni:
+ Utilizzare il set di dati completo.
+ Scegliere un campione del set di dati selezionato casualmente.
+ Specificare un sottoinsieme del set di dati utilizzando una query.

Le seguenti opzioni sono disponibili nella sezione **Lavori di etichettatura** della [console SageMaker AI](https://console.aws.amazon.com/sagemaker/groundtruth) dopo aver selezionato **Crea** processo di etichettatura. Per informazioni su come creare un processo di etichettatura nella console, consulta [Nozioni di base: crea un processo di etichettatura dei riquadri delimitatori con Ground Truth](sms-getting-started.md). Per configurare il set di dati utilizzato per l'etichettatura, nella sezione **Panoramica dei processi** seleziona **Configurazione aggiuntiva**.

## Utilizzo del set di dati completo
<a name="sms-full-dataset"></a>

Quando scegli di utilizzare il **set di dati completo** devi fornire un file manifest per gli oggetti dati. Puoi fornire il percorso del bucket Amazon S3 che contiene il file manifest o utilizzare la console SageMaker AI per creare il file. Per informazioni su come creare un file manifest utilizzando la console, consulta [Automatizzare la configurazione dei dati per i processi di etichettatura](sms-console-create-manifest-file.md). 

## Scelta di un campione casuale
<a name="sms-random-dataset"></a>

Quando vuoi etichettare un sottoinsieme casuale di dati, seleziona **Campione casuale**. Il set di dati viene archiviato nel bucket S3 Amazon specificato nel campo **Posizione del set di dati di input**. 

Dopo aver specificato la percentuale di oggetti di dati che desideri includere nell'esempio, scegli **Crea** sottoinsieme. SageMaker L'intelligenza artificiale sceglie casualmente gli oggetti di dati per il tuo lavoro di etichettatura. Dopo aver selezionato gli oggetti, scegli **Usa questo sottoinsieme**. 

SageMaker L'IA crea un file manifesto per gli oggetti di dati selezionati. Inoltre modifica il valore nel campo **Posizione del set di dati di input** in modo da puntare al nuovo file manifest.

## Specificare un sottoinsieme
<a name="sms-select-dataset"></a>

**Amazon S3 Select**  
Amazon S3 Select non è più disponibile per i nuovi clienti. I clienti esistenti di Amazon S3 Select possono continuare a utilizzare la funzionalità come di consueto. Per ulteriori informazioni, consulta [How to optimize querying your data in Amazon S3](https://aws.amazon.com/blogs/storage/how-to-optimize-querying-your-data-in-amazon-s3/)

Puoi specificare un sottoinsieme degli oggetti dati utilizzando una query `SELECT` di S3 Amazon sui nomi di file di oggetti. 

L'istruzione `SELECT` della query SQL è definita per l'utente. La clausola `WHERE` serve a specificare quali oggetti dati devono essere restituiti.

Per ulteriori informazioni sull'istruzione `SELECT` di S3 Amazon, consulta [Selecting content from Objects](https://docs.aws.amazon.com/AmazonS3/latest/dev/selecting-content-from-objects.html).

Scegli **Crea sottoinsieme** per avviare la selezione, quindi seleziona **Usa questo sottoinsieme** per utilizzare i dati selezionati. 

SageMaker AI crea un file manifesto per gli oggetti dati selezionati. Aggiorna inoltre il campo **Posizione del set di dati di input** per puntare al nuovo file manifest.