Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Selon le type de tâche d'étiquetage que vous créez, Amazon SageMaker Ground Truth envoie des objets de données aux employés par lots ou en streaming. Vous pouvez contrôler le flux d'objets de données vers les employés de la manière suivante :
-
Pour les deux types de travaux d'étiquetage, vous pouvez utiliser
MaxConcurrentTaskCount
pour contrôler le nombre total d'objets de données disponibles pour tous les employés à un moment donné lors de l'exécution de la tâche d'étiquetage. -
Pour les tâches d'étiquetage en streaming, vous pouvez contrôler le flux d'objets de données vers les employés en surveillant et en contrôlant le nombre d'objets de données envoyés à Amazon SQS associés à votre tâche d'étiquetage.
Utilisez les sections suivantes pour en savoir plus sur ces options.
Rubriques
MaxConcurrentTaskCount À utiliser pour contrôler le flux d'objets de données
MaxConcurrentTaskCount
définit le nombre maximum d'objets de données disponibles simultanément dans la file d'attente des tâches du portail de travail. Si vous utilisez la console, ce paramètre est défini à 1 000. Si vous l'utilisezCreateLabelingJob
, vous pouvez définir ce paramètre sur un entier compris entre 1 et 5 000 inclus.
Utilisez l'exemple suivant pour mieux comprendre comment le nombre d'entrées dans votre fichier manifeste, leNumberOfHumanWorkersPerDataObject
, et MaxConcurrentTaskCount
définissez les tâches que les travailleurs voient dans leur file d'attente de tâches dans l'interface utilisateur du portail des travailleurs.
-
Vous disposez d'un fichier manifeste d'entrée contenant 600 entrées.
-
Pour chaque entrée de votre fichier manifeste d'entrée, vous pouvez
NumberOfHumanWorkersPerDataObject
définir le nombre de travailleurs humains qui étiquetteront une entrée à partir de votre fichier manifeste d'entrée. Dans cet exemple, vous définissez uneNumberOfHumanWorkersPerDataObject
valeur égale à 3. Cela créera 3 tâches différentes pour chaque entrée de votre fichier manifeste d'entrée. De plus, pour que l'objet soit marqué comme correctement étiqueté, au moins 3 travailleurs différents doivent étiqueter l'objet. Cela crée un total de 1 800 tâches (600 x 3) à effectuer par les travailleurs. -
Vous souhaitez que les collaborateurs ne voient que 100 tâches à la fois dans leur file d'attente dans l'interface utilisateur du portail des travailleurs. Pour ce faire, vous devez définir une
MaxConcurrentTaskCount
valeur égale à 100. Ground Truth remplira ensuite la file d'attente des tâches du portail des travailleurs avec 100 tâches par travailleur. -
Ce qui se passe ensuite dépend du type de tâche d'étiquetage que vous créez et du fait qu'il s'agit d'une tâche d'étiquetage en streaming.
-
Tâche d'étiquetage en continu : tant que le nombre total d'objets disponibles pour les travailleurs est égal à
MaxConcurrentTaskCount
, tous les objets de jeu de données restants dans votre fichier manifeste d'entrée et que vous envoyez en temps réel via Amazon SNS sont placés dans une file d'attente Amazon SQS. Lorsque le nombre total d'objets disponibles pour les travailleurs tombe en dessous deMaxConcurrentTaskCount
moinsNumberOfHumanWorkersPerDataObject
, un nouvel objet de données de la file d'attente est utilisé pour créerNumberOfHumanWorkersPerDataObject
des tâches, qui sont envoyées aux travailleurs en temps réel. -
Tâche d'étiquetage ponctuelle (qui ne s'exécute pas en streaming) : au fur et à mesure que les employés terminent l'étiquetage d'un jeu d'objets, jusqu'à
MaxConcurrentTaskCount
xNumberOfHumanWorkersPerDataObject
nombre de nouvelles tâches seront envoyées aux employés. Ce processus est répété jusqu'à ce que tous les objets de données du fichier manifeste source soient étiquetés.
-
Utilisez Amazon SQS pour contrôler le flux d'objets de données vers les tâches d'étiquetage en continu
Lorsque vous créez une tâche d'étiquetage en streaming, une file d'attente Amazon SQS est automatiquement créée dans votre compte. Les objets de données ne sont ajoutés à la file d'attente Amazon SQS que lorsque le nombre total d'objets envoyés aux employés est supérieur à MaxConcurrentTaskCount
. Sinon, les objets sont envoyés directement aux employés.
Vous pouvez utiliser cette file d'attente pour gérer le flux d'objets de données vers votre tâche d'étiquetage. Pour en savoir plus, consultez Gérez les demandes d'étiquetage avec une file d'attente Amazon SQS.