Données Réduction des faux positifs (plus grande précision)Réduction des faux négatifs (meilleur rappel)

Amélioration d’un modèle Étiquettes personnalisées Amazon Rekognition

Les performances des modèles de machine learning dépendent largement de facteurs tels que la complexité et la variabilité des étiquettes personnalisées (objets et scènes spécifiques qui vous intéressent), la qualité et la capacité représentative du jeu de données d’entraînement que vous fournissez, ainsi que les infrastructures du modèle et les méthodes de machine learning utilisées pour entraîner le modèle.

Étiquettes personnalisées Amazon Rekognition simplifie le processus et aucune expertise en machine learning n’est requise. Cependant, le processus de création d’un bon modèle implique souvent des itérations sur les données et des améliorations du modèle pour atteindre les performances souhaitées. Vous trouverez ci-dessous des informations sur la manière d’améliorer votre modèle.

Données

En général, vous pouvez améliorer la qualité de votre modèle avec de plus grandes quantités de données de meilleure qualité. Utilisez des images d’entraînement qui montrent clairement l’objet ou la scène et qui ne sont pas encombrées d’objets inutiles. Pour les cadres de délimitation autour des objets, utilisez les images d’entraînement montrant l’objet entièrement visible et non masqué par d’autres objets.

Assurez-vous que les jeux de données d’entraînement et de test correspondent au type d’images sur lesquelles l’inférence va être exécutée. Pour les objets, tels que les logos, pour lesquels vous n’avez que quelques exemples d’entraînement, vous devez fournir des cadres de délimitation autour du logo dans les images de test. Ces images représentent ou illustrent les scénarios dans lesquels vous souhaitez localiser l’objet.

Pour ajouter de nouvelles images à un jeu de données d’entraînement ou de test, consultez Ajouter d'autres images à un jeu de données.

Réduction des faux positifs (plus grande précision)

Tout d’abord, vérifiez si l’augmentation du seuil supposé permet de conserver les prédictions correctes, tout en diminuant les faux positifs. À un moment donné, les gains diminuent en raison du compromis entre précision et rappel pour un modèle donné. Vous ne pouvez pas définir le seuil supposé pour une étiquette, mais vous pouvez obtenir le même résultat en spécifiant une valeur élevée pour le paramètre d’entrée MinConfidence telle que DetectCustomLabels. Pour plus d’informations, consultez Analyse d’une image avec un modèle entraîné.
Il se peut qu’une ou plusieurs des étiquettes personnalisées qui vous intéressent (A) soient régulièrement confondues avec la même classe d’objets (mais pas avec une étiquette qui vous intéresse) (B). Pour vous aider, ajoutez B comme étiquette de classe d’objet à votre jeu de données d’entraînement (avec les images sur lesquelles vous avez obtenu un faux positif). En fait, vous aidez le modèle à apprendre à prédire B et non A grâce aux nouvelles images d’entraînement. Pour ajouter des images à un jeu de données d’entraînement, consultez Ajouter d'autres images à un jeu de données.
Vous constaterez peut-être que le modèle confond deux de vos étiquettes personnalisées (A et B) : il est prédit que l’image de test portant l’étiquette A portera l’étiquette B et inversement. Dans ce cas, vérifiez d’abord qu’il n’y a pas d’images mal étiquetées dans vos jeux de données d’entraînement et de test. Utilisez la galerie de jeux de données pour gérer les étiquettes attribuées à un jeu de données. Pour plus d’informations, consultez Gestion des étiquettes. De plus, l’ajout d’images d’entraînement liées à ce type de confusion aide un modèle réentraîné à mieux faire la distinction entre A et B. Pour ajouter des images à un jeu de données d’entraînement, consultez Ajouter d'autres images à un jeu de données.

Réduction des faux négatifs (meilleur rappel)

Utilisez une valeur inférieure pour le seuil supposé. Vous ne pouvez pas définir le seuil supposé d’une étiquette, mais vous pouvez obtenir le même résultat en spécifiant une valeur moindre pour le paramètre d’entrée MinConfidence telle que DetectCustomLabels. Pour plus d’informations, consultez Analyse d’une image avec un modèle entraîné.
Utilisez de meilleurs exemples pour modéliser la diversité de l’objet et les images dans lesquelles il apparaît.
Scindez l’étiquette en deux catégories plus faciles à apprendre. Par exemple, au lieu de bons et de mauvais biscuits, vous préférerez peut-être de bons biscuits, des biscuits brûlés ou des biscuits brisés pour aider le modèle à mieux comprendre chaque concept unique.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Référence : fichier récapitulatif

Exécution d’un modèle entraîné