本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
解密類
轉Decrypt
換解密 AWS Glue 內部。您也可以使用 AWS 加密 SDK 在 AWS Glue 外部解密您的資料。如果提供的 KMS 金鑰 ARN 不符合用來加密資料行的項目,解密作業就會失敗。
範例
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * kms = "${KMS}" sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ (1, "1234560000"), (2, "1234560001"), (3, "1234560002"), (4, "1234560003"), (5, "1234560004"), (6, "1234560005"), (7, "1234560006"), (8, "1234560007"), (9, "1234560008"), (10, "1234560009"), ], ["id", "phone"], ) try: df_encrypt = pii.Encrypt.apply( data_frame=input_df, spark_context=sc, source_columns=["phone"], kms_key_arn=kms ) df_decrypt = pii.Decrypt.apply( data_frame=df_encrypt, spark_context=sc, source_columns=["phone"], kms_key_arn=kms ) df_decrypt.show() except: print("Unexpected Error happened ") raise
輸出
輸出將是一個原 PySpark DataFrame 始的 `id` 列和解密的「電話」列:
``` +---+------------+ | id| phone| +---+------------+ | 1| 1234560000| | 2| 1234560001| | 3| 1234560002| | 4| 1234560003| | 5| 1234560004| | 6| 1234560005| | 7| 1234560006| | 8| 1234560007| | 9| 1234560008| | 10| 1234560009| +---+------------+ ```
Encrypt
轉換程式會將「來源欄」作為「[電話」] `和「kms_key_arn」作為環境變數的值。轉換作業會使用指定的 KMS 金鑰加密 `phone` 資料行中的值。然後將加密的 DataFrame `df_加密` 傳遞給從 'awsglue.pii` 模塊的轉Decrypt
換。它需要「來源列」作為「[" 電話 "] `和 `kms_key_arn '作為環境變量的值。轉換作業會使用相同的 KMS 金鑰,將 `phone` 資料行中的加密值解密。產生的「df_crypt`」 DataFrame 包含原始的「ID」列和解密的「電話」列。
方法
__call__(閃光上下文,數據框架,源列,kms_key_arn)
轉Decrypt
換解密 AWS Glue 內部。您也可以使用 AWS 加密 SDK 在 AWS Glue 外部解密您的資料。如果提供的 KMS 金鑰 ARN 不符合用來加密資料行的項目,解密作業就會失敗。
-
source_columns
— 現有資料行的陣列。 -
kms_key_arn
— 用來解密來源資料行的 AWS 金鑰管理服務金鑰的金鑰 ARN。
apply(cls, *args, **kwargs)
繼承自 GlueTransform
apply。
name(cls)
繼承自 GlueTransform
name。
describeArgs(cls)
繼承自 GlueTransform
describeArgs。
describeReturn(cls)
繼承自 GlueTransform
describeReturn。
describeTransform(cls)
繼承自 GlueTransform
describeTransform。
describeErrors(cls)
繼承自 GlueTransform
describeErrors。
describe(cls)
繼承自 GlueTransform
describe。