Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Controlla il flusso di oggetti di dati inviati ai lavoratori

Modalità Focus
Controlla il flusso di oggetti di dati inviati ai lavoratori - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

A seconda del tipo di lavoro di etichettatura creato, Amazon SageMaker Ground Truth invia oggetti di dati ai lavoratori in batch o in streaming. Puoi controllare il flusso di oggetti dati verso i worker nei modi seguenti:

  • Per entrambi i tipi di processo di etichettatura, puoi utilizzare MaxConcurrentTaskCount per controllare il numero totale di oggetti di dati disponibili per tutti i worker in un determinato momento in cui il processo di etichettatura è in esecuzione.

  • Per i processi di etichettatura in streaming, puoi controllare il flusso di oggetti di dati verso i worker monitorando e controllando il numero di oggetti dati inviati ad Amazon SQS associati al tuo processo di etichettatura.

Utilizza le seguenti sezioni per avere ulteriori informazioni su queste opzioni.

Utilizzalo MaxConcurrentTaskCount per controllare il flusso di oggetti di dati

MaxConcurrentTaskCountdefinisce il numero massimo di oggetti dati disponibili contemporaneamente nella coda delle attività del worker-portal. Se utilizzi la console, questo parametro è impostato su 1.000. Se si utilizzaCreateLabelingJob, è possibile impostare questo parametro su qualsiasi numero intero compreso tra 1 e 5.000, inclusi.

Utilizzate l'esempio seguente per comprendere meglio in che modo il numero di voci nel file manifestoNumberOfHumanWorkersPerDataObject, il e MaxConcurrentTaskCount definiscono le attività che i lavoratori vedono nella loro coda di attività nell'interfaccia utente del worker-portal.

  1. Hai un file manifest di input con 600 voci.

  2. Per ogni voce del file manifesto di input, potete NumberOfHumanWorkersPerDataObject definire il numero di lavoratori umani che etichetteranno una voce dal file di manifesto di input. In questo esempio, impostate un NumberOfHumanWorkersPerDataObject valore uguale a 3. Questo creerà 3 attività diverse per ogni voce nel file manifesto di input. Inoltre, per contrassegnare l'oggetto come etichettato correttamente, almeno 3 lavoratori diversi devono etichettare l'oggetto. Ciò crea un totale di 1.800 attività (600 x 3) che devono essere completate dai lavoratori.

  3. Vuoi che i lavoratori vedano solo 100 attività alla volta nella loro coda nell'interfaccia utente del Worker Portal. Per fare ciò, impostate un MaxConcurrentTaskCount valore uguale a 100. Ground Truth riempirà quindi la coda delle attività del portale dei lavoratori con 100 attività per lavoratore.

  4. Quello che succede dopo dipende dal tipo di lavoro di etichettatura che state creando e dal fatto che si tratti di un lavoro di etichettatura in streaming.

    • Processo di etichettatura in streaming: purché il numero totale di oggetti disponibili per i lavoratori sia pari aMaxConcurrentTaskCount, tutti gli oggetti del set di dati rimanenti nel file manifest di input e che invii in tempo reale tramite Amazon SNS vengono inseriti in una coda Amazon SQS. Quando il numero totale di oggetti disponibili per i lavoratori scende al di sotto del valore MaxConcurrentTaskCount negativoNumberOfHumanWorkersPerDataObject, viene utilizzato un nuovo oggetto di dati dalla coda per creare NumberOfHumanWorkersPerDataObject -task, che vengono inviati ai lavoratori in tempo reale.

    • Processo di etichettatura non in streaming: man mano che i worker terminano di etichettare un set di oggetti, ai worker verranno inviate fino a MaxConcurrentTaskCount volte NumberOfHumanWorkersPerDataObject il numero massimo di nuove attività. Questo processo viene ripetuto fino a quando tutti gli oggetti di dati nel file manifesto di input non vengono etichettati.

Usa Amazon SQS per controllare il flusso di oggetti di dati verso lo streaming dei lavori di etichettatura

Quando crei un processo di etichettatura in streaming, nel tuo account viene creata automaticamente una coda Amazon SQS. Gli oggetti dati vengono aggiunti alla coda di Amazon SQS solo quando il numero totale di oggetti inviati ai worker è superiore a MaxConcurrentTaskCount. In caso contrario, gli oggetti vengono inviati direttamente ai worker.

Puoi utilizzare questa coda per gestire il flusso di oggetti di dati verso il processo di etichettatura. Per ulteriori informazioni, consulta Gestisci le richieste di etichettatura con una coda Amazon SQS.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.