As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Na API do Amazon Rekognition Image, você pode detectar conteúdo impróprio, indesejado ou ofensivo de forma síncrona usando e usando e operando de forma assíncrona. DetectModerationLabelsStartMediaAnalysisJobGetMediaAnalysisJob Você pode usar a API Amazon Rekognition Video para detectar esse conteúdo de forma assíncrona usando as operações e. StartContentModerationGetContentModeration
Categorias de etiquetas
O Amazon Rekognition usa uma taxonomia hierárquica de três níveis para rotular categorias de conteúdo impróprio, indesejado ou ofensivo. Cada rótulo com nível de taxonomia 1 (L1) tem vários rótulos de taxonomia de nível 2 (L2), e alguns rótulos de taxonomia de nível 2 podem ter rótulos de taxonomia de nível 3 (L3). Isso permite uma classificação hierárquica do conteúdo.
Para cada rótulo de moderação detectado, a API também retorna o TaxonomyLevel
, que contém o nível (1, 2 ou 3) ao qual o rótulo pertence. Por exemplo, uma imagem pode ser rotulada de acordo com a seguinte categorização:
L1: nudez não explícita de partes íntimas e beijos, L2: nudez não explícita, L3: nudez implícita.
nota
Recomendamos usar categorias L1 ou L2 para moderar seu conteúdo e usar categorias L3 somente para remover conceitos específicos que você não deseja moderar (ou seja, para detectar conteúdo que você talvez não queira categorizar como conteúdo impróprio, indesejado ou ofensivo com base em sua política de moderação).
A tabela a seguir mostra as relações entre os níveis de categoria e os possíveis rótulos para cada nível. Para baixar uma lista dos rótulos de moderação, clique aqui.
Categoria de nível superior (L1) | Categoria de segundo nível (L2) | Categoria de terceiro nível (L3) | Definições |
---|---|---|---|
Explícito | Nudez explícita | Genitália masculina exposta | Genitália masculina humana, incluindo o pênis (ereto ou flácido), a bolsa escrotal e qualquer pêlo pubiano perceptível. Este termo é aplicável em contextos que envolvam atividade sexual ou qualquer conteúdo visual em que os órgãos genitais masculinos sejam exibidos total ou parcialmente. |
Genitália feminina exposta | Partes externas do sistema reprodutor feminino, abrangendo a vulva, a vagina e qualquer pêlo pubiano observável. Esse termo é aplicável em cenários que envolvam atividade sexual ou qualquer conteúdo visual em que esses aspectos da anatomia feminina sejam exibidos total ou parcialmente. | ||
Nádegas ou ânus expostos | Nádegas ou ânus humanos, incluindo casos em que as nádegas estão nuas ou quando são discerníveis por meio de roupas transparentes. A definição se aplica especificamente a situações em que as nádegas ou o ânus são direta e completamente visíveis, excluindo cenários em que qualquer forma de roupa íntima ou roupa oferece cobertura total ou parcial. | ||
Mamilo feminino exposto | Mamilos femininos humanos, incluindo aerola totalmente visível e parcialmente visível (área ao redor dos mamilos) e mamilos. | ||
Atividade sexual explícita | N/D | Representação de atos sexuais reais ou simulados que englobam relações sexuais humanas, sexo oral, bem como estimulação genital masculina e estimulação genital feminina por outras partes do corpo e objetos. O termo também inclui ejaculação ou fluidos vaginais em partes do corpo e práticas eróticas ou dramatizações envolvendo escravidão, disciplina, domínio e submissão e sadomasoquismo. | |
Brinquedos sexuais | N/D | Objetos ou dispositivos usados para estimulação ou prazer sexual, por exemplo, dildo, vibrador, plugue anal, batidas, etc. | |
Nudez não explícita de partes íntimas e beijos | Nudez não explícita | Costas nuas | Parte posterior humana, onde a maior parte da pele é visível do pescoço até o final da coluna. Este termo não se aplica quando as costas do indivíduo estão parcialmente ou totalmente ocluídas. |
Mamilo masculino exposto | Mamilos humanos masculinos, incluindo mamilos parcialmente visíveis. | ||
Nádegas parcialmente expostas | Nádegas humanas parcialmente expostas. Este termo inclui uma região parcialmente visível das nádegas ou nádegas devido a roupas curtas ou parte superior parcialmente visível da fenda anal. O termo não se aplica aos casos em que as nádegas estão totalmente nuas. | ||
Seio feminino parcialmente exposto | Seio feminino humano parcialmente exposto, onde uma parte do seio feminino é visível ou descoberta, sem revelar o seio inteiro. Este termo se aplica quando a região da prega mamária interna é visível ou quando a dobra mamária inferior é visível com o mamilo totalmente coberto ou ocluído. | ||
Nudez implícita | Um indivíduo que está nu, de topless ou sem fundo, mas com partes íntimas, como nádegas, mamilos ou genitália, cobertas, ocluídas ou não totalmente visíveis. | ||
Partes íntimas obstruídas | Mamilo feminino obstruído | Representação visual de uma situação em que os mamilos de uma mulher estão cobertos por roupas ou coberturas opacas, mas suas formas são claramente visíveis. | |
Genitália masculina obstruída | Representação visual de uma situação em que a genitália ou o pênis de um homem estão cobertos por roupas ou coberturas opacas, mas sua forma é claramente visível. Este termo se aplica quando a genitália obstruída na imagem está em close-up. | ||
Beijando na boca | N/D | Representação dos lábios de uma pessoa fazendo contato com os lábios de outra pessoa. | |
Roupa de banho ou roupa íntima | Roupa de banho ou roupa íntima feminina | N/D | Roupas humanas para roupas de banho femininas (por exemplo, roupas de banho de uma peça, biquínis, tanquínis, etc.) e roupas íntimas femininas (por exemplo, sutiãs, calcinhas, cuecas, lingerie, tangas, etc.) |
Roupa de banho ou roupa íntima masculina | N/D | Roupas humanas para trajes de banho masculinos (por exemplo, calções de banho, calções de banho, etc.) e roupas íntimas masculinas (por exemplo, cuecas, boxers, etc.) | |
Violência | Armas | N/D | Instrumentos ou dispositivos usados para causar danos ou danos a seres vivos, estruturas ou sistemas. Isso inclui armas de fogo (por exemplo, armas, rifles, metralhadoras etc.), armas afiadas (por exemplo, espadas, facas, etc.), explosivos e munições (por exemplo, mísseis, bombas, balas etc.). |
Violência gráfica | Violência de armas | O uso de armas para causar danos, danos, ferimentos ou morte a si mesmo, a outros indivíduos ou propriedades. | |
Violência física | O ato de causar danos a outras pessoas ou propriedades (por exemplo, bater, brigar, puxar cabelos, etc.) ou outro ato de violência envolvendo uma multidão ou vários indivíduos. | ||
Automutilação | O ato de causar danos a si mesmo, geralmente cortando partes do corpo, como braços ou pernas, onde os cortes geralmente são visíveis. | ||
Sangue e sangue | Representação visual da violência contra uma pessoa, um grupo de indivíduos ou animais, envolvendo feridas abertas, derramamento de sangue e partes do corpo mutiladas. | ||
Explosões e explosões | Representação de uma explosão violenta e destrutiva de chamas intensas com fumaça espessa ou poeira e fumaça saindo do solo. | ||
Visualmente perturbador | Morte e emaciação | Corpos enfraquecidos | Corpos humanos extremamente magros e desnutridos, com grave perda física e depleção de tecido muscular e adiposo. |
Cadáveres | Cadáveres humanos na forma de corpos mutilados, cadáveres pendurados ou esqueletos. | ||
Falhas | Acidente aéreo | Incidentes de veículos aéreos, como aviões, helicópteros ou outros veículos voadores, resultando em danos, ferimentos ou morte. Este termo se aplica quando partes dos veículos aéreos são visíveis. | |
Drogas e tabaco | Produtos | Comprimidos | Mesas ou cápsulas pequenas, sólidas, geralmente redondas ou ovais. Este termo se aplica a pílulas apresentadas como autônomas, em um frasco ou pacote transparente e não se aplica a uma representação visual de uma pessoa tomando pílulas. |
Parafernália e uso de drogas e tabaco | Fumar | O ato de inalar, expirar e acender substâncias queimadas, incluindo cigarros, charutos, cigarros eletrônicos, narguilé ou cigarro. | |
Álcool | Uso de álcool | Beber | O ato de beber bebidas alcoólicas em garrafas ou copos de álcool ou licor. |
Bebidas alcoólicas | N/D | Feche uma ou várias garrafas de álcool ou licor, copos ou canecas com álcool ou licor e copos ou canecas com álcool ou licor segurados por um indivíduo. Este termo não se aplica a um indivíduo que bebe garrafas ou copos de álcool ou licor. | |
Gestos rudes | Dedo do meio | N/D | A representação visual de um gesto com a mão com o dedo médio é estendida para cima enquanto os outros dedos estão dobrados para baixo. |
Jogos de aposta | N/D | N/D | O ato de participar de jogos de azar para ter a chance de ganhar um prêmio em cassinos, por exemplo, cartas de baralho, blackjacks, roleta, caça-níqueis em cassinos, etc. |
Símbolos de ódio | Partido Nazista | N/D | Representação visual de símbolos, bandeiras ou gestos associados ao Partido Nazista. |
Supremacia branca | N/D | Representação visual de símbolos ou roupas associados à Ku Klux Klan (KKK) e imagens com bandeiras confederadas. | |
Extremista | N/D | Imagens contendo bandeiras de grupos extremistas e terroristas. |
Nem todo rótulo na categoria L2 tem um rótulo compatível na categoria L3. Além disso, os rótulos L3 em “Produtos” e os rótulos L2 em “Parafernália e uso de drogas e tabaco” não são precisos. Esses rótulos L2 abrangem conceitos além dos rótulos L3 mencionados e, nesses casos, apenas os rótulos L2 são retornados na resposta da API.
Você determina a adequação do conteúdo ao aplicativo. Por exemplo, imagens de natureza sugestiva podem ser aceitáveis, mas imagens contendo nudez, não. Para filtrar imagens, use a matriz de rótulos ModerationLabel retornada por DetectModerationLabels
(imagens) e por GetContentModeration
(vídeos).
Tipo de conteúdo
A API também pode identificar tipos de conteúdo animado ou ilustrado, e o tipo de conteúdo é retornado como parte da resposta.
Conteúdo animado inclui videogame e animação (por exemplo, desenho animado, quadrinhos, mangá, anime).
Conteúdo ilustrado inclui desenho, pintura e esboços.
Confiança
Você pode definir o limite de confiança que o Amazon Rekognition usa para detectar conteúdo impróprio especificando o parâmetro de entrada MinConfidence
. Os rótulos não são retornados para conteúdo impróprio detectado com menos confiança do que MinConfidence
.
Especificar um valor para MinConfidence
que seja inferior a 50% provavelmente retornará um número elevado de resultados falsos positivos (ou seja, maior recordação, menor precisão). Por outro lado, especificar MinConfidence
acima de 50% provavelmente retornará um número menor de resultados falsos positivos (ou seja, menor recordação, maior precisão). Se você não especificar um valor para MinConfidence
, o Amazon Rekognition retornará rótulos para conteúdo impróprio detectado com pelo menos 50% de confiança.
A matriz ModerationLabel
contém rótulos nas categorias anteriores e uma confiança estimada na precisão do conteúdo reconhecido. Um rótulo de nível superior é retornado com todos os rótulos de segundo nível que foram identificados. Por exemplo, o Amazon Rekognition pode retornar "Nudez explícita" com uma alta pontuação de confiança como rótulo de alto nível. Isso pode ser suficiente para suas necessidades de filtragem. No entanto, se for necessário, você poderá usar a pontuação de confiança de um rótulo de segundo nível (como "Nudez masculina gráfica") para obter uma filtragem mais granular. Para obter um exemplo, consulte Detectando imagens inapropriadas.
Versionamento
Tanto o Amazon Rekognition Image quanto o Amazon Rekognition Video retornam a versão do modelo de detecção de moderação que é usado para detectar conteúdo impróprio (ModerationModelVersion
).
Classificação e agregação
Ao recuperar resultados com GetContentModeration, você pode classificar e agregar seus resultados.
Ordem de classificação — A matriz de etiquetas retornadas é classificada por hora. Para classificar por rótulo, especifique NAME
no parâmetro de entrada SortBy
para GetContentModeration
. Se o rótulo aparecer várias vezes no vídeo, haverá várias instâncias do elemento ModerationLabel
.
Informações do rótulo — O elemento da ModerationLabels matriz contém um ModerationLabel
objeto que, por sua vez, contém o nome do rótulo e a confiança que o Amazon Rekognition tem na precisão do rótulo detectado. O carimbo de data/hora é a hora em que a ModerationLabel
foi detectada, definida como o número de milissegundos decorridos desde o início do vídeo. Para resultados agregados por SEGMENTS
do vídeo, as estruturas StartTimestampMillis
, EndTimestampMillis
e DurationMillis
são retornadas, definindo a hora de início, a hora de término e a duração de um segmento, respectivamente.
Agregação: especifica como os resultados são agregados quando retornados. O padrão é agregar por TIMESTAMPS
. Você também pode optar por agregar por SEGMENTS
, o que agrega os resultados em uma janela de tempo. Somente rótulos detectados durante os segmentos são retornados.
Status de adaptador de moderação personalizado
Os adaptadores de moderação personalizados podem ter um dos seguintes status: TRAINING_IN_PROGRESS, TRAINING_COMPLETED, TRAINING_FAILED, DELETING, DEPRECATED ou EXPIRED. Para obter uma explicação completa dos status desses adaptadores, consulte Gerenciar adaptadores.
nota
O Amazon Rekognition não é uma autoridade e, de forma alguma, afirma ser um filtro exaustivo de conteúdo impróprio ou ofensivo. Além disso, a moderação de imagens e vídeos APIs não detecta se uma imagem inclui conteúdo ilegal, como CSAM.