Habilitar a criptografia do Apache Spark - Amazon Athena

Habilitar a criptografia do Apache Spark

Você pode habilitar a criptografia do Apache Spark no Athena. Essa ação criptografa dados em trânsito entre nós do Spark e criptografa dados em repouso armazenados localmente pelo Spark. Para aumentar a segurança desses dados, o Athena usa esta configuração de criptografia:

spark.io.encryption.keySizeBits="256" spark.io.encryption.keygen.algorithm="HmacSHA384"

Para habilitar a criptografia do Spark, você pode usar o console do  Athena, a AWS CLI ou a API do Athena.

Usar o console do Athena para habilitar a criptografia do Spark

Para criar um novo caderno que tenha a criptografia do Spark habilitada
  1. Abra o console do Athena em https://console.aws.amazon.com/athena/.

  2. Se o painel de navegação do console não estiver visível, escolha o menu de expansão à esquerda.

  3. Execute um destes procedimentos:

    • No Notebook explorer (Explorador de cadernos), escolha Create notebook (Criar caderno).

    • No Notebook editor (Editor de cadernos), escolha Create notebook (Criar caderno) ou selecione o ícone de adição (+) para adicionar um caderno.

  4. Em Nome do caderno, insira um nome para o caderno.

  5. Expanda a opção Propriedades do Spark.

  6. Selecione Ativar a criptografia do Spark.

  7. Escolha Criar.

A sessão do caderno que você cria é criptografada. Use o novo caderno como faria normalmente. Futuramente, quando você iniciar novas sessões que usarem o caderno, as novas sessões também serão criptografadas.

Você também pode usar o console do Athena para ativar a criptografia do Spark para um caderno existente.

Para habilitar a criptografia para um caderno existente
  1. Abra uma nova sessão para um caderno criado anteriormente.

  2. No editor do notebook, no menu Session (sessão) no canto superior direito, escolha Edit session (editar sessão).

  3. Na caixa de diálogo Editar detalhes da sessão, expanda Propriedades do Spark.

  4. Selecione Ativar a criptografia do Spark.

  5. Escolha Salvar.

O console inicia uma nova sessão que tem a criptografia habilitada. As sessões posteriores que você criar para o caderno também terão a criptografia habilitada.

Usar a AWS CLI para habilitar a criptografia do Spark

Você pode usar a AWS CLI para habilitar a criptografia ao iniciar uma sessão especificando as propriedades corretas do Spark.

Para usar a AWS CLI para habilitar a criptografia do Spark
  1. Use um comando como o exemplo a seguir para criar um objeto JSON de configuração do mecanismo que especifique as propriedades de criptografia do Spark.

    ENGINE_CONFIGURATION_JSON=$( cat <<EOF { "CoordinatorDpuSize": 1, "MaxConcurrentDpus": 20, "DefaultExecutorDpuSize": 1, "SparkProperties": { "spark.authenticate": "true", "spark.io.encryption.enabled": "true", "spark.network.crypto.enabled": "true" } } EOF )
  2. Na AWS CLI, use o comando athena start-session e passe o objeto JSON que você criou para o argumento --engine-configuration, como no seguinte exemplo:

    aws athena start-session \ --region "region" \ --work-group "your-work-group" \ --engine-configuration "$ENGINE_CONFIGURATION_JSON"

Usar a API do Athena para habilitar a criptografia do Spark

Para habilitar a criptografia do Spark com a API do Athena, use a ação StartSession e o respectivo parâmetro EngineConfiguration de SparkProperties para especificar a configuração de criptografia na solicitação StartSession.