Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Amazon S3 metadados do documento

Modo de foco
Amazon S3 metadados do documento - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Você pode adicionar metadados, informações adicionais sobre um documento, aos documentos em um bucket do Amazon S3 usando um arquivo de metadados. Cada arquivo de metadados está associado a um documento indexado.

Os arquivos de metadados devem ser armazenados no mesmo bucket dos arquivos indexados. Você pode especificar um local dentro do bucket para seus arquivos de metadados usando o console ou o S3Prefix campo do DocumentsMetadataConfiguration parâmetro ao criar uma fonte de Amazon S3 dados. Se você não especificar um prefixo do Amazon S3 , os arquivos de metadados deverão ser armazenados no mesmo local dos documentos indexados.

Se você especificar um Amazon S3 prefixo para seus arquivos de metadados, eles estarão em uma estrutura de diretórios paralela aos seus documentos indexados. Amazon Kendra procura seus metadados somente no diretório especificado. Se os metadados não forem lidos, verifique se a localização do diretório corresponde à localização dos metadados.

Os seguintes exemplos mostram como a localização do documento indexado é mapeada para a localização do arquivo de metadados: Observe que a Amazon S3 chave do documento é anexada ao Amazon S3 prefixo dos metadados e depois sufixada com .metadata.json para formar o caminho do arquivo de metadados. Amazon S3 A Amazon S3 chave combinada, com o Amazon S3 prefixo e o .metadata.json sufixo dos metadados, não deve ter mais do que um total de 1024 caracteres. É recomendável que você mantenha sua Amazon S3 chave abaixo de 1000 caracteres para considerar caracteres adicionais ao combinar sua chave com o prefixo e o sufixo.

Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json

Os metadados do documento são definidos em um arquivo JSON. O arquivo deve ser um arquivo de texto UTF-8 sem um marcador BOM. O nome do arquivo JSON deve ser <document>.<extension>.metadata.json. Neste exemplo, o “documento” é o nome do documento ao qual os metadados se aplicam e a “extensão” é a extensão do arquivo do documento. O ID do documento deve ser exclusivo na <document>.<extension>.metadata.json.

O conteúdo do arquivo JSON segue esse modelo. Todos os atributos/campos são opcionais, portanto, não é necessário incluir todos os atributos. Você deve fornecer um valor para cada atributo que deseja incluir; o valor não pode estar vazio. Se você não especificar o_source_uri, os links retornados Amazon Kendra nos resultados da pesquisa apontarão para o Amazon S3 bucket que contém o documento. DocumentIdé mapeado para o campo s3_document_id e é o caminho absoluto para o documento no S3.

{ "DocumentId": "S3 document ID, the S3 path to doc", "Attributes": { "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed, "custom attribute key": "custom attribute value", additional custom attributes }, "AccessControlList": [ { "Name": "user name", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "For example HTML | PDF. For supported content types, see Types of documents." }

Os campos de metadados _created_at e _last_updated_at são datas codificadas no ISO 8601. Por exemplo, 2012-03-25T12:30:10+01:00 é o formato de data e hora do ISO 8601 para 25 de março de 2012 às 12h30 (mais 10 segundos) no horário da Europa Central.

Você pode adicionar informações adicionais ao campo Attributes sobre um documento que você usa para filtrar consultas ou agrupar respostas de consultas. Para obter mais informações, consulte Criação de campos de documentos personalizados.

Você pode usar o campo AccessControlList para filtrar a resposta de uma consulta. Dessa forma, somente determinados usuários e grupos têm acesso aos documentos. Para obter mais informações, consulte Filtragem no contexto do usuário.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.