暗号化クラス - AWS Glue

暗号化クラス

Encrypt 変換は、AWS Key Management Service キーを使用してソース列を暗号化します。Encrypt 変換は、セルあたり最大 128 MiB を暗号化できます。復号時にフォーマットを保持しようとします。データ型を保持するには、データ型メタデータを 1KB 未満にシリアル化する必要があります。それ以外の場合は、preserve_data_type パラメータを false に設定する必要があります。データ型メタデータは、暗号化コンテキストのプレーンテキストで保存されます。

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * kms = "${KMS}" sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ (1, "1234560000"), (2, "1234560001"), (3, "1234560002"), (4, "1234560003"), (5, "1234560004"), (6, "1234560005"), (7, "1234560006"), (8, "1234560007"), (9, "1234560008"), (10, "1234560009"), ], ["id", "phone"], ) try: df_encrypt = pii.Encrypt.apply( data_frame=input_df, spark_context=sc, source_columns=["phone"], kms_key_arn=kms ) except: print("Unexpected Error happened ") raise

出力

出力は、元の「id」列と「phone」列の暗号化された値を含む追加の列を持つ PySpark DataFrame になります。

``` +---+------------+-------------------------+ | id| phone | phone_encrypted | +---+------------+-------------------------+ | 1| 1234560000| EncryptedData1234...abc | | 2| 1234560001| EncryptedData5678...def | | 3| 1234560002| EncryptedData9012...ghi | | 4| 1234560003| EncryptedData3456...jkl | | 5| 1234560004| EncryptedData7890...mno | | 6| 1234560005| EncryptedData1234...pqr | | 7| 1234560006| EncryptedData5678...stu | | 8| 1234560007| EncryptedData9012...vwx | | 9| 1234560008| EncryptedData3456...yz0 | | 10| 1234560009| EncryptedData7890...123 | +---+------------+-------------------------+ ```

Encrypt 変換では、「source_columns」を「[phone]」「kms_key_arn」を「${KMS}」環境変数の値として受け取ります。変換は、指定された KMS キーを使用して、「phone」列の値を暗号化します。結果の「df_encrypt」 DataFrame には、元の「id」列、元の「phone」列、および「phone_encrypted」列の暗号化された値を含む「phone_encrypted」という名前の追加列が含まれます。

方法

__call__(spark_context, data_frame, source_columns, kms_key_arn, entity_type_filter=None, preserve_data_type=None)

Encrypt 変換は、AWS Key Management Service キーを使用してソース列を暗号化します。

  • source_columns – 既存の列の配列。

  • kms_key_arn – ソース列の暗号化に使用する AWS Key Management Service キーのキー ARN。

  • entity_type_filter – エンティティタイプのオプションの配列。検出された PII のみをフリーテキスト列で暗号化するために使用できます。

  • preserve_data_type – オプションのブール値。デフォルトは true です。false の場合、データ型は保存されません。

apply(cls, *args, **kwargs)

継承元は GlueTransform apply

name(cls)

継承元は GlueTransform name

describeArgs(cls)

継承元は GlueTransform describeArgs

describeReturn(cls)

継承元は GlueTransform describeReturn

describeTransform(cls)

継承元は GlueTransform describeTransform

describeErrors(cls)

継承元は GlueTransform describeErrors

describe(cls)

継承元は GlueTransform 説明