Use o Amazon Augmented AI com o Amazon Textract
O Amazon Textract permite que você adicione detecção e análise de texto em documentos às suas aplicações. O Amazon Augmented AI (Amazon A2I) se integra diretamente à operação de API do Amazon Textract AnalyzeDocument
. Você pode usar o AnalyzeDocument
para analisar os relacionamentos entre itens detectados em um documento. Quando você adiciona um loop de análise humana do Amazon A2I a uma solicitação AnalyzeDocument
, o Amazon A2I monitora os resultados do Amazon Textract e envia um documento para um ou mais operadores humanos revisarem quando as condições especificadas em sua definição de fluxo são atendidas. Por exemplo, se você deseja que um humano revise uma chave específica, como Full name:
, e seus valores de entrada associados, você pode criar uma condição de ativação que inicia uma análise humana sempre que a chave do Full
name:
for detectada ou quando a confiança na inferência para essa chave estiver dentro de uma faixa que você especificar.
A imagem a seguir representa o fluxo de trabalho incorporado do Amazon A2I com o Amazon Textract. À esquerda, estão representados os recursos necessários para criar um fluxo de trabalho de análise humana do Amazon Textract: um bucket do Amazon S3, condições de ativação, um modelo de tarefa para operadores e uma equipe de trabalho. Esses recursos são usados para criar um fluxo de trabalho de análise humana ou definição de fluxo. Uma seta aponta para a direita, indicando a próxima etapa no fluxo de trabalho: utilizando o Amazon Textract para configurar um loop humano com o fluxo de trabalho de análise humana. Uma segunda seta aponta diretamente dessa etapa para a etapa na qual as condições de ativação especificadas no fluxo de trabalho de análise humana são atendidas. Isso inicia a criação de um loop humano. À direita da imagem, o ciclo humano é representado em três etapas: 1) a interface do operador e as ferramentas são geradas, e a tarefa é disponibilizada para os operadores, 2) os operadores revisam os dados de entrada e, finalmente, 3) os resultados são salvos no Amazon S3.
Você pode especificar quando o Amazon Textract envia uma tarefa para um operador humano revisar ao criar um fluxo de trabalho de análise humana ou uma definição de fluxo, através da especificação de condições de ativação.
É possível definir as seguintes condições de ativação ao usar o tipo de tarefa do Amazon Textract:
-
Inicie uma análise humana para chaves de formulário específicas com base na pontuação de confiança da chave de formulário.
-
Inicie uma análise humana quando chaves de formulário específicas estiverem ausentes.
-
Inicie uma análise humana para todas as chaves de formulário identificadas pelo Amazon Textract com pontuações de confiança em uma faixa especificada.
-
Enviar aleatoriamente uma amostra dos formulários a humanos para análise.
Quando a sua condição de ativação depende das pontuações de confiança das chaves de formulário, você pode usar dois tipos de confiança de predição para iniciar loops humanos:
-
Confiança de Identificação: A pontuação de confiança para pares chave-valor detectados dentro de um formulário.
-
Confiança de Qualificação: A pontuação de confiança para o texto contido nas chaves e valores em um formulário.
Na imagem na seguinte seção, Nome completo: Jane Doe é o par de chave-valor, Nome completo é a chave, e Jane Doe é o valor.
Você pode definir essas condições de ativação usando o console do Amazon SageMaker ao criar um fluxo de trabalho de análise humana ou criando um JSON para condições de ativação de loop humano e especificando isso como entrada no parâmetro HumanLoopActivationConditions
da operação da API CreateFlowDefinition
. Para saber como especificar condições de ativação no formato JSON, consulte Esquema JSON para condições de ativação de loop humano no Amazon Augmented AI e Uso do esquema JSON de condições de ativação de loop humano com o Amazon Textract.
nota
Ao utilizar o Augmented AI com o Amazon Textract, crie recursos do Augmented AI na mesma região AWS que você usa para chamar AnalyzeDocument
.
Conceitos básicos: integrar uma análise humana a um trabalho de análise de documento do Amazon Textract
Para integrar uma análise humana a um trabalho de detecção e análise de texto do Amazon Textract, você precisa criar uma definição de fluxo e, em seguida, utilizar a API do Amazon Textract para integrar essa definição de fluxo ao seu processo de trabalho. Para aprender como criar uma definição de fluxo utilizando o console do SageMaker ou a API do Augmented AI, consulte os seguintes tópicos:
Depois de criar a sua definição de fluxo, consulte o tópico Using Augmented AI with Amazon Textract para aprender como integrar a sua definição de fluxo à sua tarefa do Amazon Textract.
Exemplo completo usando o Amazon Textract e o Amazon A2I
Para um exemplo completo que demonstra como usar o Amazon Textract com o Amazon A2I usando o console, consulte Tutorial: Conceitos básicos do console Amazon A2I.
Para aprender como usar a API do Amazon A2I para criar e iniciar uma análise humana, você pode utilizar a integração do Amazon Augmented AI (Amazon A2I) com a Análise de Documento do Amazon Textract [Exemplo]
Visualização do console do operador do A2I Textract
Quando os operadores são designados para uma tarefa de análise em um fluxo de trabalho do Amazon Textract, eles podem ver uma interface do usuário semelhante à seguinte:
Você pode personalizar essa interface no console do SageMaker ao criar sua definição de revisão humana ou criando e utilizando um modelo personalizado. Para saber mais, consulte Criar e gerenciar modelos de tarefas de operadores.