Utilisation de la modération des images et des vidéos APIs - Amazon Rekognition

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de la modération des images et des vidéos APIs

Dans l'image Amazon API Rekognition, vous pouvez détecter le contenu inapproprié, indésirable ou offensant de manière synchrone et DetectModerationLabelsasynchrone en utilisant et en utilisant des opérations. StartMediaAnalysisJobGetMediaAnalysisJob Vous pouvez utiliser Amazon Rekognition API Video pour détecter ce type de contenu de manière asynchrone à l'aide des opérations et. StartContentModerationGetContentModeration

Catégories d’étiquette

Amazon Rekognition utilise une taxonomie hiérarchique à trois niveaux pour étiqueter les catégories de contenu inapproprié, indésirable ou offensant. Chaque étiquette de niveau de taxonomie 1 (L1) possède un certain nombre d'étiquettes de niveau de taxonomie 2 (L2), et certaines étiquettes de niveau 2 peuvent avoir des étiquettes de niveau de taxonomie 3 (L3). Cela permet une classification hiérarchique du contenu.

Pour chaque étiquette de modération détectée, le renvoie API également leTaxonomyLevel, qui contient le niveau (1, 2 ou 3) auquel appartient l'étiquette. Par exemple, une image peut être étiquetée conformément à la catégorisation suivante :

L1 : Nudité non explicite des parties intimes et baisers, L2 : Nudité non explicite, L3 : Nudité implicite.

Note

Nous vous recommandons d'utiliser les catégories L1 ou L2 pour modérer votre contenu et d'utiliser les catégories L3 uniquement pour supprimer les concepts spécifiques que vous ne souhaitez pas modérer (c'est-à-dire pour détecter le contenu que vous ne souhaitez peut-être pas classer comme étant du contenu inapproprié, indésirable ou offensant en fonction de votre politique de modération).

Le tableau suivant montre les relations entre les niveaux de catégorie et les libellés possibles pour chaque niveau. Pour télécharger la liste des labels de modération, cliquez ici.

Catégorie de haut niveau (L1) Catégorie de deuxième niveau (L2) Catégorie de troisième niveau (L3) Définitions
Explicite Nudité explicite (Explicit Nudity) Organes génitaux masculins exposés Les organes génitaux masculins humains, y compris le pénis (qu'il soit en érection ou flasque), le scrotum et les poils pubiens visibles. Ce terme est applicable dans des contextes impliquant une activité sexuelle ou tout contenu visuel où les organes génitaux masculins sont affichés complètement ou partiellement.
Organes génitaux féminins exposés Parties externes du système reproducteur féminin, comprenant la vulve, le vagin et tout poil pubien observable. Ce terme est applicable dans les scénarios impliquant une activité sexuelle ou tout contenu visuel dans lequel ces aspects de l'anatomie féminine sont présentés complètement ou partiellement.
Fesses ou anus exposés Fesses ou anus humains, y compris les cas où les fesses sont nues ou lorsqu'elles sont visibles à travers des vêtements transparents. La définition s'applique spécifiquement aux situations où les fesses ou l'anus sont directement et complètement visibles, à l'exclusion des scénarios où toute forme de sous-vêtement ou de vêtement fournit une couverture complète ou partielle.
Mamelon féminin exposé Mamelons féminins humains, y compris les aéroles (zone entourant les mamelons) et les mamelons entièrement visibles et partiellement visibles.
Activité sexuelle explicite N/A Représentation d'actes sexuels réels ou simulés comprenant les rapports sexuels humains, le sexe oral, ainsi que la stimulation génitale masculine et la stimulation génitale féminine par d'autres parties du corps et objets. Le terme inclut également l'éjaculation ou les sécrétions vaginales sur des parties du corps ainsi que les pratiques érotiques ou les jeux de rôle impliquant le bondage, la discipline, la domination et la soumission, ainsi que le sadomasochisme.
Jouets sexuels N/A Objets ou appareils utilisés pour la stimulation ou le plaisir sexuels, par exemple un gode, un vibromasseur, un plug anal, des battements, etc.
Nudité non explicite des parties intimes et baisers Nudité non explicite Dos nu Partie postérieure humaine où la majeure partie de la peau est visible du cou à l'extrémité de la colonne vertébrale. Ce terme ne s'applique pas lorsque le dos de la personne est partiellement ou totalement occlus.
Mamelon masculin exposé Mamelons masculins humains, y compris les mamelons partiellement visibles.
Fesses partiellement exposées Fesses humaines partiellement exposées. Ce terme inclut une région partiellement visible des fesses ou des fessiers due à des vêtements courts, ou une partie supérieure partiellement visible de la fente anale. Le terme ne s'applique pas aux cas où les fesses sont entièrement nues.
Poitrine féminine partiellement exposée Sein féminin humain partiellement exposé où une partie du sein de la femme est visible ou découverte sans révéler la totalité du sein. Ce terme s'applique lorsque la région du pli intérieur du sein est visible ou lorsque le pli inférieur du sein est visible lorsque le mamelon est entièrement recouvert ou occlus.
Nudité implicite Personne nue, aux seins nus ou sans fond, mais dont les parties intimes, telles que les fesses, les tétons ou les organes génitaux, sont couvertes, occluses ou ne sont pas entièrement visibles.
Parties intimes obstruées Mamelon féminin obstrué Représentation visuelle d'une situation dans laquelle les mamelons d'une femme sont recouverts de vêtements ou de revêtements opaques, mais leurs formes sont clairement visibles.
Organes génitaux masculins obstrués Représentation visuelle d'une situation dans laquelle les organes génitaux ou le pénis d'un homme sont recouverts de vêtements ou de revêtements opaques, mais dont la forme est clairement visible. Ce terme s'applique lorsque les organes génitaux obstrués sur l'image sont en gros plan.
Baiser sur les lèvres N/A Représentation des lèvres d'une personne entrant en contact avec celles d'une autre personne.
Maillots de bain ou sous-vêtements Maillots de bain ou sous-vêtements féminins N/A Vêtements humains pour maillots de bain féminins (maillots de bain une pièce, bikinis, tankinis, etc.) et sous-vêtements féminins (soutiens-gorge, culottes, slips, lingerie, strings, etc.)
Maillots de bain ou sous-vêtements pour hommes N/A Vêtements humains pour maillots de bain masculins (par exemple, maillots de bain, shorts de bain, slips de bain, etc.) et sous-vêtements masculins (par exemple, slips, boxers, etc.)
Violence Armes N/A Instruments ou dispositifs utilisés pour blesser ou endommager des êtres vivants, des structures ou des systèmes. Cela inclut les armes à feu (par exemple, les fusils, les mitrailleuses, etc.), les armes tranchantes (par exemple, les épées, les couteaux, etc.), les explosifs et les munitions (par exemple, les missiles, les bombes, les balles, etc.).
Violence graphique Violence avec des armes L'utilisation d'armes pour blesser, endommager, blesser ou tuer soi-même, d'autres personnes ou des biens.
Violence physique Le fait de porter atteinte à d'autres personnes ou à des biens (par exemple, frapper, se battre, s'arracher les cheveux, etc.) ou tout autre acte de violence impliquant une foule ou plusieurs personnes.
Automutilation Le fait de se blesser soi-même, souvent en coupant des parties du corps telles que les bras ou les jambes, où les coupures sont généralement visibles.
Du sang et du sang Représentation visuelle de la violence à l'égard d'une personne, d'un groupe d'individus ou d'animaux, impliquant des blessures ouvertes, des effusions de sang et des parties du corps mutilées.
Explosions et explosions Représentation d'une explosion violente et destructrice de flammes intenses accompagnée d'une épaisse fumée ou de poussière et de fumée s'échappant du sol.
Perturbant visuellement Mort et émaciation Corps décharnés Des corps humains extrêmement maigres et sous-alimentés avec une atrophie physique sévère et un épuisement des tissus musculaires et adipeux.
Cadavres Des cadavres humains sous forme de corps mutilés, de cadavres suspendus ou de squelettes.
Collisions Accident aérien Incidents impliquant des véhicules aériens, tels que des avions, des hélicoptères ou d'autres véhicules volants, entraînant des dommages, des blessures ou la mort. Ce terme s'applique lorsque des parties des véhicules aériens sont visibles.
Drogues et tabac Produits Pilules Petites tables ou capsules solides, souvent rondes ou ovales. Ce terme s'applique aux pilules présentées séparément, dans un flacon ou dans un emballage transparent et ne s'applique pas à la représentation visuelle d'une personne prenant des pilules.
Matériel et usage des drogues et du tabac Fumer Le fait d'inhaler, d'expirer et d'allumer des substances brûlantes, notamment des cigarettes, des cigares, des cigarettes électroniques, du narguilé ou des joints.
Alcool Consommation d'alcool Boire Le fait de boire des boissons alcoolisées dans des bouteilles ou des verres d'alcool ou d'alcool.
Boissons alcoolisées N/A Gros plan d'une ou de plusieurs bouteilles d'alcool ou de spiritueux, de verres ou de mugs contenant de l'alcool ou de l'alcool, et de verres ou mugs contenant de l'alcool ou de l'alcool tenus par un individu. Ce terme ne s'applique pas à une personne qui boit dans des bouteilles ou des verres d'alcool ou d'alcool.
Gestes grossiers Doigt d’honneur N/A La représentation visuelle d'un geste de la main avec le majeur est étendue vers le haut tandis que les autres doigts sont rabattus vers le bas.
Jeu N/A N/A Le fait de participer à des jeux de hasard pour avoir la chance de gagner un prix dans les casinos, par exemple aux cartes à jouer, aux blackjacks, à la roulette, aux machines à sous dans les casinos, etc.
Symboles de haine Parti nazi N/A Représentation visuelle de symboles, de drapeaux ou de gestes associés au parti nazi.
Suprématie blanche N/A Représentation visuelle de symboles ou de vêtements associés au Ku Klux Klan (KKK) et d'images représentant des drapeaux confédérés.
Extrémiste N/A Images contenant des drapeaux de groupes extrémistes et terroristes.

Toutes les étiquettes de la catégorie L2 ne disposent pas d'une étiquette compatible dans la catégorie L3. De plus, les étiquettes L3 sous « Produits » et « Accessoires et usage des drogues et du tabac » ne sont pas exhaustives. Ces étiquettes L2 couvrent des concepts autres que les étiquettes L3 mentionnées et dans de tels cas, seules les étiquettes L2 sont renvoyées dans la réponse. API

Vous pouvez déterminer l’adéquation d’une image pour votre application. Par exemple, les images de nature suggestive peuvent être acceptables, ce qui n’est pas le cas de celles représentant la nudité. Pour filtrer les images, utilisez le tableau d'ModerationLabelétiquettes renvoyé par DetectModerationLabels (images) et par GetContentModeration (vidéos).

Type de contenu

Ils API peuvent également identifier le type de contenu animé ou illustré, et le type de contenu est renvoyé dans le cadre de la réponse :

  • Le contenu animé inclut les jeux vidéo et les animations (par exemple, dessins animés, bandes dessinées, mangas, anime).

  • Le contenu illustré inclut le dessin, la peinture et les croquis.

Fiabilité

Vous pouvez définir le seuil de confiance utilisé par Amazon Rekognition pour détecter du contenu inapproprié en spécifiant le paramètre d’entrée MinConfidence. Les étiquettes de contenu inapproprié détectées avec une fiabilité plus faible que MinConfidence ne sont pas renvoyées.

La spécification d'une valeur inférieure à 50 % est susceptible de renvoyer un grand nombre de résultats faussement positifs (c'est-à-dire un rappel plus élevé, une précision moindre). MinConfidence En revanche, le fait de spécifier une valeur MinConfidence supérieure à 50 % est susceptible de donner un nombre inférieur de résultats faussement positifs (c'est-à-dire un taux de rappel plus faible, une précision plus élevée). Si vous ne spécifiez pas de valeur pour MinConfidence, Amazon Rekognition renvoie les étiquettes de contenu inapproprié détecté avec au moins 50 % de confiance.

Le tableau ModerationLabel contient les étiquettes des catégories précédentes et une estimation de la précision du contenu reconnu. Une étiquette de premier niveau est renvoyée avec les étiquettes de second niveau qui ont été identifiées. Par exemple, Amazon Rekognition peut retourner « Nudité explicite » avec un haut degré de fiabilité comme étiquette de premier niveau. Cela peut suffire à vos besoins de filtrage. Toutefois, le cas échéant, vous pouvez utiliser le score de confiance d’une étiquette de deuxième niveau (par exemple, « Nudité graphique masculine ») pour obtenir un filtrage plus affiné. Pour obtenir un exemple, consultez Détection d’images inappropriées.

Gestion des versions

Image Amazon Rekognition et Vidéo Amazon Rekognition renvoient tous deux la version du modèle de détection de modération utilisée pour détecter les contenus inappropriés (ModerationModelVersion).

Tri et agrégation

Lorsque vous récupérez des résultats avec GetContentModeration, vous pouvez les trier et les agréger.

Ordre de tri : le tableau d’étiquettes renvoyé est trié par heure. Pour trier par étiquette, spécifiez NAME dans le paramètre d’entrée SortBy pour GetContentModeration. Si l’étiquette apparaît plusieurs fois dans la vidéo, il existe plusieurs instances de l’élément ModerationLabel.

Informations sur l'étiquette : l'élément du ModerationLabels tableau contient un ModerationLabel objet, qui contient à son tour le nom de l'étiquette et la confiance d'Amazon Rekognition dans l'exactitude de l'étiquette détectée. L’horodatage est l’heure à laquelle le ModerationLabel a été détecté, défini comme le nombre de millisecondes écoulées depuis le début de la vidéo. Pour les résultats agrégés par vidéo SEGMENTS, les structures StartTimestampMillis, EndTimestampMillis et DurationMillis sont renvoyées, qui définissent respectivement l’heure de début, l’heure de fin et la durée d’un segment.

Agrégation : spécifie la manière dont les résultats sont agrégés lorsqu’ils sont renvoyés. La valeur par défaut est d’agréger par TIMESTAMPS. Vous pouvez également choisir d’agréger par SEGMENTS, ce qui permet d’agréger les résultats sur une période donnée. Seules les étiquettes détectées lors des segments sont renvoyées.

Statuts des adaptateurs de modération personnalisés

Les adaptateurs de modération personnalisés peuvent avoir l'un des statuts suivants : TRAINING _IN_PROGRESS, _, TRAINING TRAINING _COMPLETED, FAILEDDELETING, DEPRECATED ou. EXPIRED Pour une explication complète de l'état de ces adaptateurs, consultez la section Gestion des adaptateurs.

Note

Amazon Rekognition n’est pas une autorité en matière de contenu inapproprié ou offensant, et ne prétend en aucun cas être un filtre exhaustif en la matière. De plus, la modération des images et des vidéos APIs ne détecte pas si une image contient du contenu illégal, tel queCSAM.