Habilitar a criptografia do Apache Spark
Você pode habilitar a criptografia do Apache Spark no Athena. Essa ação criptografa dados em trânsito entre nós do Spark e criptografa dados em repouso armazenados localmente pelo Spark. Para aumentar a segurança desses dados, o Athena usa esta configuração de criptografia:
spark.io.encryption.keySizeBits="256"
spark.io.encryption.keygen.algorithm="HmacSHA384"
Para habilitar a criptografia do Spark, você pode usar o console do Athena, a AWS CLI ou a API do Athena.
Usar o console do Athena para habilitar a criptografia do Spark
Para criar um novo caderno que tenha a criptografia do Spark habilitada
Abra o console do Athena em https://console.aws.amazon.com/athena/
. -
Se o painel de navegação do console não estiver visível, escolha o menu de expansão à esquerda.
-
Execute um destes procedimentos:
-
No Notebook explorer (Explorador de cadernos), escolha Create notebook (Criar caderno).
-
No Notebook editor (Editor de cadernos), escolha Create notebook (Criar caderno) ou selecione o ícone de adição (+) para adicionar um caderno.
-
-
Em Nome do caderno, insira um nome para o caderno.
-
Expanda a opção Propriedades do Spark.
-
Selecione Ativar a criptografia do Spark.
-
Escolha Criar.
A sessão do caderno que você cria é criptografada. Use o novo caderno como faria normalmente. Futuramente, quando você iniciar novas sessões que usarem o caderno, as novas sessões também serão criptografadas.
Você também pode usar o console do Athena para ativar a criptografia do Spark para um caderno existente.
Para habilitar a criptografia para um caderno existente
-
Abra uma nova sessão para um caderno criado anteriormente.
-
No editor do notebook, no menu Session (sessão) no canto superior direito, escolha Edit session (editar sessão).
-
Na caixa de diálogo Editar detalhes da sessão, expanda Propriedades do Spark.
-
Selecione Ativar a criptografia do Spark.
-
Escolha Salvar.
O console inicia uma nova sessão que tem a criptografia habilitada. As sessões posteriores que você criar para o caderno também terão a criptografia habilitada.
Usar a AWS CLI para habilitar a criptografia do Spark
Você pode usar a AWS CLI para habilitar a criptografia ao iniciar uma sessão especificando as propriedades corretas do Spark.
Para usar a AWS CLI para habilitar a criptografia do Spark
-
Use um comando como o exemplo a seguir para criar um objeto JSON de configuração do mecanismo que especifique as propriedades de criptografia do Spark.
ENGINE_CONFIGURATION_JSON=$( cat <<EOF { "CoordinatorDpuSize": 1, "MaxConcurrentDpus": 20, "DefaultExecutorDpuSize": 1, "SparkProperties": { "spark.authenticate": "true", "spark.io.encryption.enabled": "true", "spark.network.crypto.enabled": "true" } } EOF )
-
Na AWS CLI, use o comando
athena start-session
e passe o objeto JSON que você criou para o argumento--engine-configuration
, como no seguinte exemplo:aws athena start-session \ --region "
region
" \ --work-group "your-work-group
" \ --engine-configuration "$ENGINE_CONFIGURATION_JSON"
Usar a API do Athena para habilitar a criptografia do Spark
Para habilitar a criptografia do Spark com a API do Athena, use a ação StartSession e o respectivo parâmetro EngineConfiguration de SparkProperties
para especificar a configuração de criptografia na solicitação StartSession
.