Activer le chiffrement Apache Spark - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Activer le chiffrement Apache Spark

Vous pouvez activer le chiffrement Apache Spark dans Athena. Cela chiffre les données en transit entre les nœuds Spark et chiffre également les données au repos stockées localement par Spark. Pour renforcer la sécurité de ces données, Athena utilise la configuration de chiffrement suivante :

spark.io.encryption.keySizeBits="256" spark.io.encryption.keygen.algorithm="HmacSHA384"

Pour activer le chiffrement Spark, vous pouvez utiliser la console Athena, AWS CLI, ou l'AthénaAPI.

Pour créer un nouveau bloc-notes sur lequel le chiffrement Spark est activé
  1. Ouvrez la console à l'adresse https://console.aws.amazon.com/athena/.

  2. Si le panneau de navigation de la console n'est pas visible, choisissez le menu d'extension sur la gauche.

  3. Effectuez l’une des actions suivantes :

    • Dans Notebook explorer (Explorateur de blocs-notes), choisissez Create notebook (Créer un bloc-notes).

    • Dans Notebook editor (Éditeur de bloc-notes), choisissez Create notebook (Créer un bloc-notes) ou cliquez sur l'icône plus (+) pour ajouter un bloc-notes.

  4. Dans Nom du bloc-notes, entrez le nom du bloc-notes.

  5. Développez l'option Propriétés Spark.

  6. Sélectionnez Activer le chiffrement Spark.

  7. Sélectionnez Create (Créer).

La session de bloc-notes que vous créez est chiffrée. Utilisez le nouveau bloc-notes comme vous le feriez normalement. Lorsque vous lancerez ultérieurement de nouvelles sessions utilisant le bloc-notes, les nouvelles sessions seront également chiffrées.

Vous pouvez également utiliser la console Athena pour activer le chiffrement Spark sur un bloc-notes existant.

Pour activer le chiffrement sur un bloc-notes existant
  1. Ouvrez une nouvelle session pour un bloc-notes créé précédemment.

  2. Dans l'éditeur de bloc-notes, dans le menu Session en haut à droite, choisissez Modifier la session.

  3. Dans la boîte de dialogue Modifier les détails de la session, développez Propriétés Spark.

  4. Sélectionnez Activer le chiffrement Spark.

  5. Choisissez Save (Enregistrer).

La console lance une nouvelle session dont le chiffrement est activé. Le chiffrement sera également activé pour les sessions ultérieures que vous créerez pour ce bloc-notes.

Vous pouvez utiliser le plugin AWS CLI pour activer le chiffrement lorsque vous lancez une session en spécifiant les propriétés Spark appropriées.

Pour utiliser le plugin AWS CLI pour activer le chiffrement Spark
  1. Utilisez une commande comme celle-ci pour créer un JSON objet de configuration du moteur qui spécifie les propriétés de chiffrement de Spark.

    ENGINE_CONFIGURATION_JSON=$( cat <<EOF { "CoordinatorDpuSize": 1, "MaxConcurrentDpus": 20, "DefaultExecutorDpuSize": 1, "SparkProperties": { "spark.authenticate": "true", "spark.io.encryption.enabled": "true", "spark.network.crypto.enabled": "true" } } EOF )
  2. Dans le volet AWS CLI, utilisez la athena start-session commande et transmettez l'JSONobjet que vous avez créé à l'--engine-configurationargument, comme dans l'exemple suivant :

    aws athena start-session \ --region "region" \ --work-group "your-work-group" \ --engine-configuration "$ENGINE_CONFIGURATION_JSON"

Pour activer le chiffrement Spark avec l'AthenaAPI, utilisez l'StartSessionaction et son EngineConfigurationSparkPropertiesparamètre pour spécifier la configuration de chiffrement dans votre StartSession demande.