Étiquetage des données de formation à l'aide d'humains avec Amazon SageMaker Ground Truth

Mode de mise au point

Étiquetage des données de formation à l'aide d'humains avec Amazon SageMaker Ground Truth - Amazon SageMaker AI

Êtes-vous un nouvel utilisateur de Ground Truth ?

Pour entraîner un modèle de machine learning, vous avez besoin d'un grand jeu de données étiqueté de haute qualité. Ground Truth vous aide à créer des jeux de données d'entraînement de haute qualité pour vos modèles de machine learning. Avec Ground Truth, vous pouvez utiliser des employés Amazon Mechanical Turk, d'un fournisseur de votre choix ou d'une main-d'œuvre interne privée, ainsi que de le machine learning pour vous permettre de créer un jeu de données étiquetées. Vous pouvez utiliser le jeu de données étiquetées généré par Ground Truth pour entraîner vos propres modèles. Vous pouvez également utiliser le résultat comme jeu de données d'entraînement pour un modèle Amazon SageMaker AI.

En fonction de votre application ML, vous pouvez choisir l'un des types de tâches intégrées de Ground Truth pour que les employés génèrent des types spécifiques d'étiquettes pour vos données. Vous pouvez également créer un flux de travail d'étiquetage personnalisé pour fournir votre propre interface utilisateur et vos propres outils aux collaborateurs qui étiquettent vos données. Pour en savoir plus sur les types de tâches intégrées de Ground Truth, veuillez consulter Types de tâche intégrés. Pour savoir comment créer un workflow d'étiquetage personnalisé, reportez-vous à la section Flux de travail d'étiquetage personnalisés.

Pour automatiser l'étiquetage de votre jeu de données d'entraînement, vous pouvez, si vous le souhaitez, utiliser l'étiquetage automatisé des données. Ce processus Ground Truth utilise le machine learning pour déterminer les données qui doivent être étiquetées par l'homme. L'étiquetage automatisé des données peut réduire la durée et les efforts manuels requis pour l'étiquetage. Pour de plus amples informations, veuillez consulter Automatisez l'étiquetage des données. Pour créer un flux d'étiquetage personnalisé, veuillez consulter Flux de travail d'étiquetage personnalisés.

Utilisez des outils pré-intégrés ou personnalisés pour attribuer les tâches d'étiquetage de votre ensemble de données d'entraînement. Un modèle d'interface utilisateur d'étiquetage est une page Web que Ground Truth utilise pour présenter les tâches et les instructions à vos employés. La console SageMaker AI fournit des modèles intégrés pour étiqueter les données. Vous pouvez utiliser ces modèles pour commencer, ou vous pouvez créer vos propres tâches et instructions en utilisant nos composants HTML 2.0. Pour de plus amples informations, veuillez consulter Flux de travail d'étiquetage personnalisés.

Utilisez la main-d'œuvre de votre choix pour étiqueter votre ensemble de données. Vous avez le choix entre :

La main-d'œuvre Amazon Mechanical Turk, qui compte plus de 500 000 prestataires indépendants dans le monde entier.
une main-d'œuvre privée que vous constituez parmi vos employés ou sous-traitants pour le traitement des données de votre organisation ;
Une société fournisseur que vous pouvez trouver dans le et AWS Marketplace qui se spécialise dans les services d'étiquetage de données.

Pour de plus amples informations, veuillez consulter Main-d'œuvre.

Vous stockez vos jeux de données dans des compartiments Amazon S3. Les compartiments contiennent trois éléments : les données à étiqueter, un fichier manifeste source que Ground Truth utilise pour lire les fichiers de données et un fichier manifeste de sortie. Le fichier de sortie comprend les résultats de la tâche d'étiquetage. Pour de plus amples informations, veuillez consulter Utiliser les données d'entrée et de sortie.

Les événements liés à vos tâches d'étiquetage apparaissent sur Amazon CloudWatch sous le /aws/sagemaker/LabelingJobs groupe. CloudWatch utilise le nom de la tâche d'étiquetage comme nom du flux de log.

Êtes-vous un nouvel utilisateur de Ground Truth ?

Si vous utilisez Ground Truth pour la première fois, nous vous recommandons de procéder comme indiqué ci-dessous :

Lisez le document Pour commencer : créez une tâche d'étiquetage de boîtes de délimitation avec Ground Truth — Cette section vous guide dans la configuration de votre première tâche d'étiquetage Ground Truth.
Explorez d'autres sujets — En fonction de vos besoins, procédez de la façon suivante :
- Explorez les types de tâches intégrées — Utilisez des types de tâches intégrés pour rationaliser le processus de création d'une tâche d'étiquetage. Pour en savoir plus sur les types de tâches intégrées de Ground Truth, veuillez consulter Types de tâche intégrés.
- Gérez votre main-d'œuvre d'étiquetage — Constituez des équipes de travail et gérez votre main-d'œuvre existante. Pour de plus amples informations, veuillez consulter Main-d'œuvre.
- Découvrez les tâches d'étiquetage en streaming : créez une tâche d'étiquetage en streaming et envoyez de nouveaux objets de jeu de données aux employés en temps réel à l'aide d'une tâche d'étiquetage à exécution perpétuelle. Les employés reçoivent continuellement de nouveaux objets de données à étiqueter tant que la tâche d'étiquetage est active et que de nouveaux objets lui sont envoyés. Pour en savoir plus, consultez Offres d'emploi en matière d'étiquetage en streaming à Ground Truth.
Pour en savoir plus sur les opérations disponibles pour automatiser les opérations de Ground Truth, consultez la référence de l'API du service SageMaker AI.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Étiquetage des données avec un human-in-the-loop

Pour commencer : créer une tâche d'étiquetage

Rubrique suivante :

Pour commencer : créer une tâche d'étiquetage

Rubrique précédente :

Étiquetage des données avec un human-in-the-loop

Avez-vous besoin d’aide ?

Sur cette page

Sélectionner vos préférences de cookies

Personnaliser les préférences de cookies

Essentiels

Performances

Fonctionnels

Publicitaires

Impossible d'enregistrer les préférences concernant les cookies

Étiquetage des données de formation à l'aide d'humains avec Amazon SageMaker Ground Truth

Êtes-vous un nouvel utilisateur de Ground Truth ?

Rubrique suivante :

Rubrique précédente :

Avez-vous besoin d’aide ?

Sur cette page

Related resources

Cette page vous a-t-elle été utile ?

Related resources