Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
A seconda del tipo di lavoro di etichettatura creato, Amazon SageMaker Ground Truth invia oggetti di dati ai lavoratori in batch o in streaming. Puoi controllare il flusso di oggetti dati verso i worker nei modi seguenti:
-
Per entrambi i tipi di processo di etichettatura, puoi utilizzare
MaxConcurrentTaskCount
per controllare il numero totale di oggetti di dati disponibili per tutti i worker in un determinato momento in cui il processo di etichettatura è in esecuzione. -
Per i processi di etichettatura in streaming, puoi controllare il flusso di oggetti di dati verso i worker monitorando e controllando il numero di oggetti dati inviati ad Amazon SQS associati al tuo processo di etichettatura.
Utilizza le seguenti sezioni per avere ulteriori informazioni su queste opzioni.
Argomenti
Utilizzalo MaxConcurrentTaskCount per controllare il flusso di oggetti di dati
MaxConcurrentTaskCount
definisce il numero massimo di oggetti dati disponibili contemporaneamente nella coda delle attività del worker-portal. Se utilizzi la console, questo parametro è impostato su 1.000. Se si utilizzaCreateLabelingJob
, è possibile impostare questo parametro su qualsiasi numero intero compreso tra 1 e 5.000, inclusi.
Utilizzate l'esempio seguente per comprendere meglio in che modo il numero di voci nel file manifestoNumberOfHumanWorkersPerDataObject
, il e MaxConcurrentTaskCount
definiscono le attività che i lavoratori vedono nella loro coda di attività nell'interfaccia utente del worker-portal.
-
Hai un file manifest di input con 600 voci.
-
Per ogni voce del file manifesto di input, potete
NumberOfHumanWorkersPerDataObject
definire il numero di lavoratori umani che etichetteranno una voce dal file di manifesto di input. In questo esempio, impostate unNumberOfHumanWorkersPerDataObject
valore uguale a 3. Questo creerà 3 attività diverse per ogni voce nel file manifesto di input. Inoltre, per contrassegnare l'oggetto come etichettato correttamente, almeno 3 lavoratori diversi devono etichettare l'oggetto. Ciò crea un totale di 1.800 attività (600 x 3) che devono essere completate dai lavoratori. -
Vuoi che i lavoratori vedano solo 100 attività alla volta nella loro coda nell'interfaccia utente del Worker Portal. Per fare ciò, impostate un
MaxConcurrentTaskCount
valore uguale a 100. Ground Truth riempirà quindi la coda delle attività del portale dei lavoratori con 100 attività per lavoratore. -
Quello che succede dopo dipende dal tipo di lavoro di etichettatura che state creando e dal fatto che si tratti di un lavoro di etichettatura in streaming.
-
Processo di etichettatura in streaming: purché il numero totale di oggetti disponibili per i lavoratori sia pari a
MaxConcurrentTaskCount
, tutti gli oggetti del set di dati rimanenti nel file manifest di input e che invii in tempo reale tramite Amazon SNS vengono inseriti in una coda Amazon SQS. Quando il numero totale di oggetti disponibili per i lavoratori scende al di sotto del valoreMaxConcurrentTaskCount
negativoNumberOfHumanWorkersPerDataObject
, viene utilizzato un nuovo oggetto di dati dalla coda per creareNumberOfHumanWorkersPerDataObject
-task, che vengono inviati ai lavoratori in tempo reale. -
Processo di etichettatura non in streaming: man mano che i worker terminano di etichettare un set di oggetti, ai worker verranno inviate fino a
MaxConcurrentTaskCount
volteNumberOfHumanWorkersPerDataObject
il numero massimo di nuove attività. Questo processo viene ripetuto fino a quando tutti gli oggetti di dati nel file manifesto di input non vengono etichettati.
-
Usa Amazon SQS per controllare il flusso di oggetti di dati verso lo streaming dei lavori di etichettatura
Quando crei un processo di etichettatura in streaming, nel tuo account viene creata automaticamente una coda Amazon SQS. Gli oggetti dati vengono aggiunti alla coda di Amazon SQS solo quando il numero totale di oggetti inviati ai worker è superiore a MaxConcurrentTaskCount
. In caso contrario, gli oggetti vengono inviati direttamente ai worker.
Puoi utilizzare questa coda per gestire il flusso di oggetti di dati verso il processo di etichettatura. Per ulteriori informazioni, consulta Gestisci le richieste di etichettatura con una coda Amazon SQS.