Usa Amazon SageMaker Ground Truth Plus per etichettare i dati - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Usa Amazon SageMaker Ground Truth Plus per etichettare i dati

Amazon SageMaker Ground Truth Plus è un servizio di etichettatura dei dati chiavi in mano che utilizza una forza lavoro esperta per fornire rapidamente annotazioni di alta qualità e riduce i costi fino al 40%. Utilizzando SageMaker Ground Truth Plus, i data scientist e i manager aziendali, come i data operations manager e i program manager, possono creare set di dati di formazione di alta qualità senza dover creare applicazioni di etichettatura e gestire autonomamente la forza lavoro addetta all'etichettatura. Puoi iniziare a usare Amazon SageMaker Ground Truth Plus caricando i dati insieme ai requisiti di etichettatura in Amazon S3.

Perché usare SageMaker Ground Truth Plus?

Per addestrare un modello di machine learning (ML), i data scientist hanno bisogno di set di dati etichettati di grandi dimensioni, di alta qualità. Con la crescita dell'adozione del machine learning, aumentano le esigenze di etichettatura. Ciò costringe i data scientist a dedicare settimane alla creazione di flussi di lavoro per l'etichettatura dei dati e alla gestione di una forza lavoro di etichettatura dei dati. Sfortunatamente, ciò rallenta l'innovazione e aumenta i costi. Per garantire che i data scientist possano dedicare il loro tempo alla creazione, alla formazione e all'implementazione di modelli di machine learning, i data scientist in genere incaricano altri team interni, composti da responsabili delle operazioni di dati e responsabili dei programmi, di produrre set di dati di addestramento di alta qualità. Tuttavia, questi team in genere non hanno accesso alle competenze necessarie per fornire set di dati di addestramento di alta qualità, il che influisce sui risultati del machine learning. Di conseguenza, cercate un partner per l'etichettatura dei dati che possa aiutarli a creare set di dati di addestramento di alta qualità su larga scala senza consumare le proprie risorse interne.

Quando carichi i dati, SageMaker Ground Truth Plus imposta i flussi di lavoro di etichettatura dei dati e li gestisce per tuo conto. Da lì, una forza lavoro esperta addestrata su una varietà di attività di apprendimento automatico (ML) esegue l'etichettatura dei dati. SageMaker Ground Truth Plus offre attualmente due tipi di forza lavoro esperta: una forza lavoro impiegata su Amazon e un elenco curato di fornitori di terze parti. SageMaker Ground Truth Plus ti offre la flessibilità di scegliere il personale addetto all'etichettatura. AWS gli esperti selezionano la migliore forza lavoro addetta all'etichettatura in base ai requisiti del progetto. Ad esempio, se hai bisogno di persone esperte nell'etichettatura dei file audio, specificalo nelle linee guida fornite a SageMaker Ground Truth Plus e il servizio selezionerà automaticamente gli etichettatori con tali competenze.

Importante

SageMaker Ground Truth Plus non supporta dati certificati PHI, PCI o FedRAMP e non è necessario fornire questi dati a Ground Truth Plus. SageMaker

Come funziona SageMaker Ground Truth Plus?

Un flusso di lavoro è composto da cinque componenti principali.

  • Richiesta di un progetto

  • Creazione di un team di progetto

  • Accesso al portale del progetto per monitorare lo stato di avanzamento dei set di dati di addestramento e rivedere i dati etichettati

  • Creazione di un batch

  • Ricezione dei dati etichettati

Come si usa SageMaker Ground Truth Plus?

Se sei un utente alle prime armi di SageMaker Ground Truth Plus, usa Guida introduttiva ad Amazon SageMaker Ground Truth Plus. get started. Per accedere a SageMaker Ground Truth Plus utilizzando la SageMaker console, devi trovarti negli Stati Uniti orientali (Virginia settentrionale) (us-east-1).