Usar as propriedades do Spark para especificar uma configuração personalizada - Amazon Athena

Usar as propriedades do Spark para especificar uma configuração personalizada

Ao criar ou editar uma sessão no Amazon Athena para Apache Spark, você pode usar as propriedades do Spark para especificar arquivos .jar, pacotes ou outra configuração personalizada para a sessão. Para especificar propriedades do Spark, use o console do Athena, a AWS CLI ou a API do Athena.

Usar o console do Athena para especificar as propriedades do Spark

No console do Athena, é possível especificar as propriedades do Spark ao criar um caderno ou editar uma sessão atual.

Para adicionar propriedades na caixa de diálogo Criar caderno ou Editar detalhes da sessão
  1. Expanda as propriedades do Spark.

  2. Para adicionar propriedades, use a opção Editar na tabela ou Editar em JSON.

    • Para a opção Editar na tabela, escolha Adicionar propriedade para adicionar uma propriedade, ou escolha Remover para remover uma propriedade. Use as caixas Chave e Valor para inserir os nomes das propriedades e os respectivos valores.

      • Para adicionar um arquivo .jar personalizado, use a propriedade spark.jars.

      • Para especificar um arquivo de pacote, especifique a propriedade spark.jars.packages.

    • Para inserir e editar sua configuração diretamente, escolha a opção Editar em JSON. No editor de texto JSON, você pode executar as seguintes tarefas:

      • Escolha Copiar para copiar o texto JSON para a área de transferência.

      • Escolha Limpar para remover todo o texto do editor JSON.

      • Escolha o ícone de configurações (engrenagem) para configurar a quebra de linha ou escolha um tema de cores para o editor JSON.

Observações

  • É possível definir propriedades no Athena para Spark, que é o mesmo que definir as propriedades do Spark diretamente em um objeto SparkConf.

  • Inicie todas as propriedades do Spark com o prefixo spark.. As propriedades com outros prefixos são ignoradas.

  • Nem todas as propriedades do Spark estão disponíveis para configuração personalizada no Athena. Se você enviar uma solicitação StartSession com uma configuração restrita, a sessão não será iniciada.

    • Não é possível usar o prefixo spark.athena. porque ele é reservado.

Usar a AWS CLI ou a API do Athena para fornecer uma configuração personalizada

Para usar a AWS CLI ou a API do Athena para fornecer sua configuração de sessão, use a ação de API StartSession ou o comando start-session da CLI. Em sua solicitação StartSession, use o campo SparkProperties do objeto EngineConfiguration para passar suas informações de configuração no formato JSON. Isso iniciará uma sessão com a configuração especificada. Para obter a sintaxe da solicitação, consulte StartSession na Amazon Athena API Reference.