Mecanismo do Amazon Neptune versão 1.2.1.0 (08/03/2023) - Amazon Neptune

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Mecanismo do Amazon Neptune versão 1.2.1.0 (08/03/2023)

Desde 08/03/2023, a versão 1.2.1.0 do mecanismo está sendo implantada de forma geral. Observe que leva vários dias para que uma nova versão fique disponível em todas as regiões.

nota

Se estiver fazendo a atualização de uma versão do mecanismo anterior à 1.2.0.0:

  • A versão 1.2.0.0 do mecanismo introduziu um novo formato para grupos de parâmetros personalizados e grupos de parâmetros de cluster personalizados. Como resultado, se você estiver atualizando de uma versão de mecanismo anterior à 1.2.0.0 para a versão 1.2.0.0 ou posterior, deverá recriar todos os grupos de parâmetros personalizados e grupos de parâmetros de cluster personalizados existentes usando a família de grupos de parâmetros neptune1.2. As versões anteriores usavam a família de grupos de parâmetros neptune1, e esses grupos de parâmetros não funcionarão com a versão 1.2.0.0 e posterior. Consulte Grupos de parâmetros do Amazon Neptune para obter mais informações.

  • A versão 1.2.0.0 do mecanismo também introduziu um novo formato para undo logs. Como resultado, todos os undo logs criados por uma versão anterior do mecanismo devem ser eliminados e a métrica UndoLogsListSize do CloudWatch deve cair para zero para que seja possível iniciar qualquer atualização de uma versão anterior à 1.2.0.0. Se houver muitos registros de undo logs (duzentos mil ou mais) ao tentar iniciar uma atualização, a tentativa de atualização poderá expirar enquanto aguarda a conclusão da limpeza dos undo logs.

    É possível acelerar a taxa de limpeza atualizando a instância de gravador do cluster, que é onde a limpeza ocorre. Fazer isso antes de tentar realizar a atualização pode reduzir o número de undo logs antes de começar. Aumentar o tamanho do gravador para um tipo de instância 24XL pode aumentar a taxa de limpeza para mais de um milhão de registros por hora.

    Se a métrica UndoLogsListSize do CloudWatch for extremamente grande, abrir um caso de suporte pode ajudar a examinar estratégias adicionais para reduzi-la.

  • Por fim, houve uma alteração significativa na versão 1.2.0.0. Ela afeta o código anterior que usava o protocolo Bolt com autenticação do IAM. A partir da versão 1.2.0.0, o Bolt precisa de um caminho de recursos para a assinatura do IAM. Em Java, a definição do caminho de recursos pode ser assim: request.setResourcePath("/openCypher"));. Em outras linguagens, o /openCypher pode ser anexado ao URI do endpoint. Consulte Usar o protocolo Bolt para ver exemplos.

Versões de patch subsequentes para esta versão

Novos recursos nesta versão do mecanismo

  • Adição de suporte para o TinkerPop 3.6.2, que adiciona vários novos atributos do Gremlin, como as novas etapas mergeV(), mergeE(), element() e fail(). As etapas mergeV() e mergeE() são particularmente importantes, pois oferecem uma opção declarativa há muito esperada para realizar operações do tipo upsert, o que deve simplificar bastante os padrões de código existentes e facilitar a leitura do Gremlin. A versão 3.6.x também adicionou predicados regex, uma nova sobrecarga à etapa property() que precisa de uma Map e uma grande revisão do comportamento da modulação by() que é muito mais consistente em todas as etapas que a utilizam.

    Consulte a TinkerPop change log e de atualização para obter informações sobre as alterações na versão 3.6 e fatores a serem considerados ao realizar a atualização.

    Se você estiver usando fold().coalesce(unfold(), <mutate>) para inserções condicionais, recomendamos migrar para a nova sintaxe mergeV/E(), descrita aqui e aqui. O Neptune usa um padrão de bloqueio mais estreito para Merge do que para Coalesce, o que pode reduzir as exceções de modificação simultânea (CMEs).

    Para obter mais informações sobre os novos atributos disponíveis nesta versão do TinkerPop, consulte o blog de Stephen Mallette, Exploring new features of Apache TinkerPop 3.6.x in Amazon Neptune.

  • Adição de suporte para tipos de instância R6i, equipados com processadores escaláveis Intel Xeon de terceira geração. Eles são ideais para workloads com uso intenso de memória e oferecem relação de computação/preço até 15% melhor e largura de banda de memória até 20% maior por vCPU do que tipos de instância R5 comparáveis.

  • Adição de endpoints de API de resumo de grafos para grafos de propriedades e do RDF, que permitem que você obtenha um relatório resumido rápido sobre o grafo.

    Para grafos de propriedades (PG), a API de resumo de grafos gera uma lista somente leitura de rótulos de nós e bordas e chaves de propriedade, junto com contagens de nós, bordas e propriedades. Para grafos do RDF, ela fornece uma lista de classes e chaves de predicados, junto com contagens de quadrantes, assuntos e predicados.

    As seguintes alterações foram realizadas com nova API de resumo de grafos:

    • Adição de uma nova ação de plano de dados GetGraphSummary.

    • Adição de um novo endpoint rdf/statistics para substituir o endpoint sparql/statistics que agora está obsoleto.

    • Alteração do nome do campo summary na resposta do status das estatísticas para signatureInfo, para não confundi-lo com as informações de resumo dos grafos. As versões anteriores do mecanismo continuam usando summary na resposta JSON.

    • Alteração da precisão do campo date na resposta do status das estatísticas de minuto para milissegundo. O formato anterior era 2020-05-07T23:13Z (precisão de minutos), enquanto o novo formato é 2023-01-24T00:47:43.319Z (precisão de milissegundos). Os dois são compatíveis com a ISO 8601, mas essa alteração pode romper o código existente, dependendo de como a data está sendo analisada.

    • Adição de uma nova magia de linha %statistics à bancada de trabalho que permite recuperar estatísticas do mecanismo do DFE.

    • Adição de uma nova magia de linha %summary à bancada de trabalho que permite recuperar informações de resumo dos grafos.

  • Adição do registro em log de consultas lentas para registrar consultas que demoram mais do que um limite especificado para serem executadas. Você ativa e controla o registro em log de consultas lentas usando os dois novos parâmetros dinâmicos, a saber, neptune_enable_slow_query_log e neptune_slow_query_log_threshold.

  • Adição de suporte para dois parâmetros dinâmicos, a saber, os novos parâmetros de cluster, neptune_enable_slow_query_log e neptune_slow_query_log_threshold. Ao fazer uma alteração em um parâmetro dinâmico, ela tem efeito imediatamente, sem a necessidade de reinicializar a instância.

  • Adição de uma função removeKeyFromMap() do openCypher específica do Neptune que remove uma chave especificada de um mapa e exibe o novo mapa resultante.

Melhorias nesta versão do mecanismo

  • Extensão do suporte ao DFE do Gremlin para etapas limit com escopo local.

  • Adição de suporte de modulação by() para DedupGlobalStep do Gremlin no mecanismo do DFE.

  • Adição de suporte do DFE para SelectStep e SelectOneStep do Gremlin.

  • Melhorias no desempenho e correções para vários operadores do Gremlin, incluindo repeat, coalesce, store e aggregate.

  • Melhoria no desempenho das consultas do openCypher que envolvem MERGE e OPTIONAL MATCH.

  • Melhoria no desempenho das consultas do openCypher que envolvem UNWIND de uma lista de mapas de valores literais.

  • Melhoria no desempenho das consultas do openCypher que têm um filtro IN para id. Por exemplo:

    MATCH (n) WHERE id(n) IN ['1', '2', '3'] RETURN n
  • Adição da capacidade de especificar o IRI básico para consultas do SPARQL usando a declaração BASE (consulte Base padrão IRI para consultas e atualizações).

  • Redução do tempo de espera do processamento de carga para carregamentos em massa somente de bordas do Gremlin e do openCypher.

  • Os carregamentos em massa agora são retomados de forma assíncrona quando o Neptune é reiniciado para evitar um longo tempo de espera causado por problemas de conectividade do Amazon S3 antes de falhar nas tentativas de retomada.

  • Melhoria no tratamento das consultas SPARQL DESCRIBE que têm a dica de consulta describeMode definida como "CBD" (descrição concisa limitada) e que envolvem um grande número de nós em branco.

Defeitos corrigidos nesta versão do mecanismo

  • Correção de um erro do openCypher em que as consultas geravam uma string, "null", em vez de um valor nulo em Bolt e SPARQL-JSON.

  • Correção de um erro do openCypher na compreensão de lista que produzia um valor nulo em vez dos valores fornecidos para os elementos da lista.

  • Correção de um erro do openCypher em que os valores de bytes não eram serializados corretamente.

  • Correção de um erro do Gremlin em UnionStep que ocorria quando uma entrada era uma borda atravessando um vértice em um percurso secundário.

  • Correção de um erro do Gremlin que fazia com que um rótulo de etapa associado a UnionStep não se propagasse corretamente até a última etapa de cada percurso secundário.

  • Correção de um erro do Gremlin na etapa dedup com rótulos após uma etapa repeat, em que os rótulos anexados à etapa dedup não estavam disponíveis para uso posterior na consulta.

  • Correção de um erro do Gremlin em que a conversão da etapa repeat dentro de uma etapa union falhava com um erro interno.

  • Correção dos problemas de exatidão do Gremlin para consultas do DFE com limit como percurso filho de etapas que não são de junção retornando ao Tinkerpop. Consultas em um formato como este são afetadas:

    g.withSideEffect('Neptune#useDFE', true).V().as("a").select("a").by(out().limit(1))
  • Correção de um erro do SPARQL em que os padrões SPARQL GRAPH não consideravam o conjunto de dados fornecido por uma cláusula FROM NAMED.

  • Correção de um erro do SPARQL em que DESCRIBE do SPARQL com algumas cláusulas FROM e/ou FROM NAMED nem sempre usava corretamente os dados de grafos padrão e às vezes gerava uma exceção. Consulte SPARQLDESCRIBEcomportamento em relação ao gráfico padrão.

  • Correção de um erro do SPARQL para que a mensagem de exceção correta fosse exibida quando caracteres nulos fossem rejeitados.

  • Correção de um erro de explain do SPARQL que afetava os planos que continham um operador PipelinedHashIndexJoin.

  • Correção de um erro que causava um erro interno quando uma consulta que gerava um valor constante era enviada.

  • Correção de um problema com a lógica do detector de deadlock que ocasionalmente fazia com que o mecanismo parasse de responder.

Versões de linguagem de consulta compatíveis com esta versão

Antes de atualizar um cluster de banco de dados para a versão 1.2.1.0, assegure-se de que o projeto seja compatível com estas versões da linguagem de consulta:

  • Versão compatível mais antiga do Gremlin: 3.6.2

  • Versão compatível mais recente do Gremlin: 3.6.2

  • openCypher versão: Neptune-9.0.20190305-1.1

  • SPARQL versão: 1.1

Caminhos de atualização para a versão 1.2.1.0 do mecanismo

É possível atualizar manualmente qualquer versão anterior do mecanismo do Neptune maior ou igual a 1.1.0.0 para esta versão.

nota

A partir da versão 1.2.0.0 do mecanismo, todos os grupos de parâmetros personalizados e os grupos de parâmetros de cluster personalizados utilizados com versões do mecanismo anteriores à 1.2.0.0 agora devem ser recriados usando a família de grupos de parâmetros neptune1.2. As versões anteriores usavam a família de grupos de parâmetros neptune1, e esses grupos de parâmetros não funcionarão com versões a partir de 1.2.0.0 em diante. Consulte Grupos de parâmetros do Amazon Neptune para obter mais informações.

A atualização para esta versão principal não será automática.

Atualizar para esta versão

O Amazon Neptune 1.2.1.0 já está disponível ao público em geral.

Se um cluster de banco de dados estiver executando uma versão do mecanismo a partir da qual haja um caminho de atualização para esta versão, ele estará elegível para ser atualizado agora. Você pode atualizar qualquer cluster elegível usando as operações do cluster de banco de dados no console ou usando o SDK. O seguinte comando da CLI atualizará imediatamente um cluster elegível:

Para Linux, OS X ou Unix:

aws neptune modify-db-cluster \ --db-cluster-identifier (your-neptune-cluster) \ --engine-version 1.2.1.0 \ --apply-immediately

Para Windows:

aws neptune modify-db-cluster ^ --db-cluster-identifier (your-neptune-cluster) ^ --engine-version 1.2.1.0 ^ --apply-immediately

As atualizações são simultaneamente aplicadas a todas as instâncias em um cluster de banco de dados. Como as atualizações exigem a reinicialização do banco de dados nessas instâncias, ocorrerá um tempo de inatividade de vinte a trinta segundos a alguns minutos. Depois disso, você poderá retomar o uso do cluster de banco de dados.

Sempre teste antes de fazer a atualização

Quando uma nova versão principal ou secundária do mecanismo do Neptune for lançada, sempre teste as aplicações do Neptune antes de atualizá-la. Mesmo uma atualização secundária pode introduzir novos atributos ou comportamentos que afetem o código.

Comece comparando as páginas de notas da versão atual com as da versão de destino para ver se haverá alterações nas versões da linguagem de consulta ou outras alterações importantes.

A melhor maneira de testar uma nova versão antes de atualizar o cluster de banco de dados de produção é clonar o cluster de produção para que o clone execute a nova versão do mecanismo. Depois, você pode executar consultas no clone sem afetar o cluster de banco de dados de produção.

Sempre crie um snapshot manual antes de fazer a atualização

Antes de fazer uma atualização, é altamente recomendável sempre criar um snapshot manual do cluster de banco de dados. Ter um snapshot automático só oferece proteção de curto prazo, enquanto um snapshot manual permanece disponível até que você o exclua explicitamente.

Em determinados casos, o Neptune cria um snapshot manual para você como parte do processo de atualização, mas não confie nisso e, em qualquer caso, crie o próprio snapshot manual.

Quando você tiver certeza de que não precisará reverter o cluster de banco de dados para o estado de pré-atualização, poderá excluir explicitamente o snapshot manual criado, bem como o snapshot manual que o Neptune tenha criado. Se o Neptune criar um snapshot manual, ele terá um nome que começa com preupgrade, seguido pelo nome do cluster de banco de dados, a versão do mecanismo de origem, a versão do mecanismo de destino e a data.

nota

Se você estiver tentando atualizar com uma ação pendente em andamento, poderá encontrar um erro como o seguinte:

We're sorry, your request to modify DB cluster (cluster identifier) has failed. Cannot modify engine version because instance (instance identifier) is running on an old configuration. Apply any pending maintenance actions on the instance before proceeding with the upgrade.

Se você encontrar esse erro, aguarde a conclusão da ação pendente ou acione imediatamente uma janela de manutenção para permitir que a atualização anterior seja concluída.

Para obter mais informações sobre como atualizar a versão do mecanismo, consulte Manter o cluster de banco de dados do Amazon Neptune. Em caso de dúvidas ou preocupações, o AWS Support está disponível nos fóruns da comunidade e por meio do AWS Premium Support.