Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Contrôlez le flux d'objets de données envoyés aux travailleurs

Mode de mise au point
Contrôlez le flux d'objets de données envoyés aux travailleurs - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Selon le type de tâche d'étiquetage que vous créez, Amazon SageMaker Ground Truth envoie des objets de données aux employés par lots ou en streaming. Vous pouvez contrôler le flux d'objets de données vers les employés de la manière suivante :

  • Pour les deux types de travaux d'étiquetage, vous pouvez utiliser MaxConcurrentTaskCount pour contrôler le nombre total d'objets de données disponibles pour tous les employés à un moment donné lors de l'exécution de la tâche d'étiquetage.

  • Pour les tâches d'étiquetage en streaming, vous pouvez contrôler le flux d'objets de données vers les employés en surveillant et en contrôlant le nombre d'objets de données envoyés à Amazon SQS associés à votre tâche d'étiquetage.

Utilisez les sections suivantes pour en savoir plus sur ces options.

MaxConcurrentTaskCount À utiliser pour contrôler le flux d'objets de données

MaxConcurrentTaskCountdéfinit le nombre maximum d'objets de données disponibles simultanément dans la file d'attente des tâches du portail de travail. Si vous utilisez la console, ce paramètre est défini à 1 000. Si vous l'utilisezCreateLabelingJob, vous pouvez définir ce paramètre sur un entier compris entre 1 et 5 000 inclus.

Utilisez l'exemple suivant pour mieux comprendre comment le nombre d'entrées dans votre fichier manifeste, leNumberOfHumanWorkersPerDataObject, et MaxConcurrentTaskCount définissez les tâches que les travailleurs voient dans leur file d'attente de tâches dans l'interface utilisateur du portail des travailleurs.

  1. Vous disposez d'un fichier manifeste d'entrée contenant 600 entrées.

  2. Pour chaque entrée de votre fichier manifeste d'entrée, vous pouvez NumberOfHumanWorkersPerDataObject définir le nombre de travailleurs humains qui étiquetteront une entrée à partir de votre fichier manifeste d'entrée. Dans cet exemple, vous définissez une NumberOfHumanWorkersPerDataObject valeur égale à 3. Cela créera 3 tâches différentes pour chaque entrée de votre fichier manifeste d'entrée. De plus, pour que l'objet soit marqué comme correctement étiqueté, au moins 3 travailleurs différents doivent étiqueter l'objet. Cela crée un total de 1 800 tâches (600 x 3) à effectuer par les travailleurs.

  3. Vous souhaitez que les collaborateurs ne voient que 100 tâches à la fois dans leur file d'attente dans l'interface utilisateur du portail des travailleurs. Pour ce faire, vous devez définir une MaxConcurrentTaskCount valeur égale à 100. Ground Truth remplira ensuite la file d'attente des tâches du portail des travailleurs avec 100 tâches par travailleur.

  4. Ce qui se passe ensuite dépend du type de tâche d'étiquetage que vous créez et du fait qu'il s'agit d'une tâche d'étiquetage en streaming.

    • Tâche d'étiquetage en continu : tant que le nombre total d'objets disponibles pour les travailleurs est égal àMaxConcurrentTaskCount, tous les objets de jeu de données restants dans votre fichier manifeste d'entrée et que vous envoyez en temps réel via Amazon SNS sont placés dans une file d'attente Amazon SQS. Lorsque le nombre total d'objets disponibles pour les travailleurs tombe en dessous de MaxConcurrentTaskCount moinsNumberOfHumanWorkersPerDataObject, un nouvel objet de données de la file d'attente est utilisé pour créer NumberOfHumanWorkersPerDataObject des tâches, qui sont envoyées aux travailleurs en temps réel.

    • Tâche d'étiquetage ponctuelle (qui ne s'exécute pas en streaming) : au fur et à mesure que les employés terminent l'étiquetage d'un jeu d'objets, jusqu'à MaxConcurrentTaskCount x NumberOfHumanWorkersPerDataObject nombre de nouvelles tâches seront envoyées aux employés. Ce processus est répété jusqu'à ce que tous les objets de données du fichier manifeste source soient étiquetés.

Utilisez Amazon SQS pour contrôler le flux d'objets de données vers les tâches d'étiquetage en continu

Lorsque vous créez une tâche d'étiquetage en streaming, une file d'attente Amazon SQS est automatiquement créée dans votre compte. Les objets de données ne sont ajoutés à la file d'attente Amazon SQS que lorsque le nombre total d'objets envoyés aux employés est supérieur à MaxConcurrentTaskCount. Sinon, les objets sont envoyés directement aux employés.

Vous pouvez utiliser cette file d'attente pour gérer le flux d'objets de données vers votre tâche d'étiquetage. Pour en savoir plus, consultez Gérez les demandes d'étiquetage avec une file d'attente Amazon SQS.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.