PostgreSQL - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

PostgreSQL

O PostgreSQL é um sistema de gerenciamento de banco de dados relacional de código aberto. Se você for um PostgreSQL usuário, poderá usar Amazon Kendra para indexar sua fonte PostgreSQL de dados. O conector da fonte de Amazon Kendra PostgreSQL dados é compatível com o PostgreSQL 9.6.

Você pode se conectar Amazon Kendra à sua fonte de PostgreSQL dados usando o Amazon Kendra console e a TemplateConfigurationAPI.

Para solucionar problemas do conector da fonte de Amazon Kendra PostgreSQL dados, consulteSolucionar problemas de origens de dados.

Atributos compatíveis

  • Mapeamentos de campos

  • Filtragem de contexto do usuário

  • Filtros de inclusão/exclusão

  • Sincronizações de conteúdo completas e incrementais

  • Nuvem privada virtual (VPC)

Pré-requisitos

Antes de poder usar Amazon Kendra para indexar sua fonte de PostgreSQL dados, faça essas alterações em suas PostgreSQL AWS contas.

Em PostgreSQL, verifique se você:

  • Anotou o nome de usuário e senha do banco de dados

    Importante

    Como prática recomendada, forneça credenciais de banco Amazon Kendra de dados somente para leitura.

  • Copiou a URL, a porta e a instância do host do banco de dados.

  • Verifique se cada documento é exclusivo em PostgreSQL e outras fontes de dados que você planeja usar para o mesmo índice. Cada fonte de dados que você deseja usar para um índice não deve conter o mesmo documento em todas as fontes de dados. Os IDs de documentos são globais para um índice e devem ser exclusivos por índice.

No seu Conta da AWS, verifique se você tem:

  • Criou um Amazon Kendra índice e, se estiver usando a API, anotei o ID do índice.

  • Criou uma IAM função para sua fonte de dados e, se estiver usando a API, anotei o ARN da IAM função.

    nota

    Se você alterar o tipo de autenticação e as credenciais, deverá atualizar sua IAM função para acessar a ID AWS Secrets Manager secreta correta.

  • Armazenou suas credenciais de autenticação de PostgreSQL em um AWS Secrets Manager senha e, se estiver usando a API, anotou o ARN da senha.

    nota

    Recomendamos que você atualize ou alterne regularmente as credenciais e as senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).

Se você não tiver uma IAM função ou segredo existente, poderá usar o console para criar uma nova IAM função e um novo Secrets Manager segredo ao conectar sua fonte de PostgreSQL dados Amazon Kendra a. Se você estiver usando a API, deverá fornecer o ARN de uma IAM função e Secrets Manager segredo existentes e um ID de índice.

Instruções de conexão

Para se conectar Amazon Kendra à sua fonte de PostgreSQL dados, você deve fornecer detalhes de suas PostgreSQL credenciais para que Amazon Kendra possa acessar seus dados. Se você ainda não configurou PostgreSQL para Amazon Kendra verPré-requisitos.

Console

Para se conectar Amazon Kendra a PostgreSQL

  1. Faça login no AWS Management Console e abra o Amazon Kendra console.

  2. No painel de navegação esquerdo, escolha Índices e, em seguida, escolha o índice que deseja usar na lista de índices.

    nota

    Você pode escolher definir ou editar as configurações de Controle de acesso do usuário em Configurações do índice.

  3. Na página Introdução, escolha Adicionar fonte de dados.

  4. Na página Adicionar fonte de dados, escolha PostgreSQLconector e, em seguida, escolha Adicionar conector. Se estiver usando a versão 2 (se aplicável), escolha o PostgreSQLconector com a tag “V2.0".

  5. Na página Especar detalhes da fonte de dados, insira as seguintes informações:

    1. Em Nome e descrição, em Nome da fonte de dados: insira um nome para a fonte de dados. Você pode incluir hífens, mas não espaços.

    2. (Opcional) Descrição: insira uma descrição opcional para a fonte de dados.

    3. Em Idioma padrão — Escolha um idioma para filtrar seus documentos para o índice. A menos que você especifique o contrário, o idioma padrão é o inglês. O idioma especificado nos metadados do documento substitui o idioma selecionado.

    4. Em Tags, em Adicionar nova tag — Inclua tags opcionais para pesquisar e filtrar seus recursos ou monitorar seus AWS custos.

    5. Escolha Próximo.

  6. Na página Definir seção e segurança, insira as informações a seguir:

    1. Em Fonte, insira o seguinte:

    2. Host: insira o nome do host do banco de dados.

    3. Port: insira a porta do banco de dados.

    4. Instância: insira a instância do banco de dados.

    5. Ativar localização do certificado SSL — Escolha inserir o Amazon S3 caminho para seu arquivo de certificado SSL.

    6. Em Autenticação: insira as seguintes informações:

      1. AWS Secrets Manager segredo — Escolha um segredo existente ou crie um novo Secrets Manager segredo para armazenar suas credenciais de PostgreSQL autenticação. Se optar por criar uma nova senha, uma janela secreta do AWS Secrets Manager será aberta.

        1. Insira as seguintes informações em Criar uma janela de senha do AWS Secrets Manager :

          1. Senha: um nome para sua senha. O prefixo 'AmazonKendra- PostgreSQL -' é adicionado automaticamente ao seu nome secreto.

          2. Em Nome de usuário do banco de dados e Senha, insira os valores da credencial de autenticação que você copiou do banco de dados.

        2. Escolha Salvar.

    7. Nuvem privada virtual (VPC): você pode escolher usar uma VPC. Nesse caso, você deve adicionar sub-redes e grupos de segurança da VPC.

    8. IAM função — Escolha uma IAM função existente ou crie uma nova IAM função para acessar as credenciais do repositório e indexar o conteúdo.

      nota

      IAM as funções usadas para índices não podem ser usadas para fontes de dados. Se você não tiver certeza se uma função existente é usada para um índice ou perguntas frequentes, escolha Criar uma nova função para evitar erros.

    9. Escolha Próximo.

  7. Na página Configurar configurações de sincronização, insira as seguintes informações:

    1. Em Sincronizar escopo, escolha uma das opções a seguir:

      • Consulta SQL: insira instruções de consulta SQL, como as operações SELECT e JOIN. As consultas SQL devem ser inferiores a 32 KB. O Amazon Kendra rastreará todo o conteúdo do banco de dados correspondente à sua consulta.

      • Coluna da chave primária: forneça a chave primária da tabela do banco de dados. Isso identifica uma tabela no banco de dados.

      • Coluna de título: forneça o nome da coluna do título do documento na tabela do banco de dados.

      • Coluna do corpo — Forneça o nome da coluna do corpo do documento na tabela do banco de dados.

    2. Em Configuração adicional: opcional, escolha entre as seguintes opções para sincronizar um conteúdo específico em vez de sincronizar todos os arquivos:

      • Colunas de detecção de alterações — insira os nomes das colunas que Amazon Kendra serão usadas para detectar alterações no conteúdo. Amazon Kendra reindexará o conteúdo quando houver uma alteração em qualquer uma dessas colunas.

      • Coluna de IDs dos usuários: insira o nome da coluna que contém os IDs de usuário para ter acesso ao conteúdo.

      • Coluna de grupos: insira o nome da coluna que contém os IDs de usuário para ter acesso ao conteúdo.

      • Coluna de URLs de origem: insira o nome da coluna que contém os URLs de origem a serem indexados.

      • Coluna de carimbos de data e hora — Insira o nome da coluna que contém carimbos de data e hora. Amazon Kendra usa informações de data e hora para detectar alterações em seu conteúdo e sincronizar somente o conteúdo alterado.

      • Coluna de fusos horários: insira o nome da coluna que contém os fusos horários para o conteúdo a ser rastreado.

      • Formato de carimbos de data/hora: insira o nome da coluna que contém carimbos de data e hora para usar para detectar alterações de conteúdo e sincronizar novamente o conteúdo.

    3. Modo de sincronização: escolha como você deseja atualizar o índice quando o conteúdo da fonte de dados for alterado. Quando você sincroniza sua fonte de dados Amazon Kendra pela primeira vez, todo o conteúdo é rastreado e indexado por padrão. Você deve executar uma sincronização completa dos seus dados se a sincronização inicial falhar, mesmo que você não escolha a sincronização completa como opção de modo de sincronização.

      • Sincronização completa: indexe todo o conteúdo de forma atualizada, substituindo o conteúdo existente sempre que sua fonte de dados for sincronizada com seu índice.

      • Sincronização nova e modificada: indexe somente conteúdo novo e modificado sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.

      • Sincronização nova, modificada e excluída: indexe somente conteúdo novo, modificado e excluído sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.

    4. Em Cronograma de execução da sincronização, em Frequência, escolha com que frequência o Amazon Kendra será sincronizado com a fonte de dados.

    5. Escolha Próximo.

  8. Na página Definir mapeamentos de campo, insira as seguintes informações:

    1. Selecione entre os campos de fonte de dados padrão gerados — IDs de documentos, títulos de documentos e URLs de origem — que você deseja mapear para indexar Amazon Kendra .

    2. Adicionar campo: para adicionar campos de fonte de dados personalizados, crie um nome de campo de índice para mapear e o tipo de dados do campo.

    3. Escolha Próximo.

  9. Na página Revisar e criar, verifique se as informações inseridas estão corretas e selecione Adicionar fonte de dados. Você também pode optar por editar as informações a partir desta página. Sua fonte de dados aparecerá na página Fontes de dados depois que a fonte de dados for adicionada com sucesso.

API

Para se conectar Amazon Kendra a PostgreSQL

Você deve especificar o seguinte usando a TemplateConfigurationAPI:

  • Fonte de dados — especifique o tipo de fonte de dados como JDBC quando você usa o esquema TemplateConfigurationJSON. Também especifique a fonte de dados como TEMPLATE quando você chama a CreateDataSourceAPI.

  • Tipo de banco de dados: especifique o tipo de banco de dados como postgresql.

  • Consulta SQL — especifique instruções de consulta SQL, como operações SELECT e JOIN. As consultas SQL devem ser inferiores a 32 KB. O Amazon Kendra rastreará todo o conteúdo do banco de dados correspondente à sua consulta.

  • Modo de sincronização — Amazon Kendra especifique como atualizar seu índice quando o conteúdo da fonte de dados for alterado. Quando você sincroniza sua fonte de dados Amazon Kendra pela primeira vez, todo o conteúdo é rastreado e indexado por padrão. Você deve executar uma sincronização completa dos seus dados se a sincronização inicial falhar, mesmo que você não escolha a sincronização completa como opção de modo de sincronização. Escolha uma das seguintes opções:

    • FORCED_FULL_CRAWLpara indexar todo o conteúdo de forma atualizada, substituindo o conteúdo existente sempre que sua fonte de dados é sincronizada com seu índice.

    • FULL_CRAWLpara indexar somente conteúdo novo, modificado e excluído sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.

    • CHANGE_LOGpara indexar somente conteúdo novo e modificado sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.

  • Nome de recurso secreto da Amazon (ARN) — Forneça o nome de recurso da Amazon (ARN) de um Secrets Manager segredo que contenha as credenciais de autenticação que você criou em sua conta. PostgreSQL A senha deve conter uma estrutura JSON com as seguintes chaves:

    { "user name": "database user name", "password": "password" }
    nota

    Recomendamos que você atualize ou alterne regularmente as credenciais e as senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).

  • IAM role — Especifique RoleArn quando você liga CreateDataSource para fornecer uma IAM função com permissões para acessar seu Secrets Manager segredo e chamar as APIs públicas necessárias para o PostgreSQL conector e. Amazon Kendra Para obter mais informações, consulte Funções para o IAM das fontes de dados do PostgreSQL.

Você também pode adicionar os seguintes recursos opcionais:

  • Nuvem privada virtual (VPC): especifique a VpcConfiguration quando ao chamar CreateDataSource. Para ter mais informações, consulte Configurando Amazon Kendra para usar um Amazon VPC.

  • Filtros de inclusão e exclusão: especifique se deseja incluir conteúdo específico usando IDs de usuário, grupos, URLs de origem, carimbos de data e hora e fusos horários.

  • Filtragem de contexto do usuário e controle de acesso —Amazon Kendra rastreia a lista de controle de acesso (ACL) de seus documentos, se você tiver uma ACL para seus documentos. As informações da ACL são usadas para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Para obter mais informações, consulte Filtrar o contexto do usuário.

  • Mapeamentos de campo: escolha mapear os campos de fonte de dados do PostgreSQL para os campos de índice do Amazon Kendra . Para obter mais informações, consulte Mapear campos de fonte de dados.

    nota

    O campo do corpo do documento ou o corpo do documento equivalente para seus documentos é obrigatório Amazon Kendra para pesquisar seus documentos. Você deve mapear o nome do campo do corpo do documento na fonte de dados para o nome do campo de índice_document_body. Todos os demais campos são opcionais.

Para ver uma lista de outras chaves JSON importantes a serem configuradas, consulte Esquema de modelo do (PostgreSQL.

Observações

  • As linhas excluídas do banco de dados não serão rastreadas ao Amazon Kendra verificar o conteúdo atualizado.

  • O tamanho dos nomes e valores dos campos em uma linha do banco de dados não pode exceder 400 KB.

  • Se você tiver uma grande quantidade de dados na fonte de dados do banco de dados e não quiser Amazon Kendra indexar todo o conteúdo do banco de dados após a primeira sincronização, poderá optar por sincronizar somente documentos novos, modificados ou excluídos.

  • Como prática recomendada, forneça credenciais de banco Amazon Kendra de dados somente para leitura.

  • Como prática recomendada, evite adicionar tabelas com dados confidenciais ou informações pessoais identificáveis (PII).