DatasetMatch

檢查主資料集中的資料是否與參考資料集中的資料相符。系統會使用提供的索引鍵資料欄映射來聯結這兩個資料集。若您只想檢查這些資料欄中的資料是否相等，則可提供其他資料欄映射。請注意，DataSetMatch若要讓正常運作，您的聯結金鑰應該是唯一的，而且不應該是 NULL（必須是主金鑰）。如果不滿足這些條件，則會顯示以下錯誤訊息：「提供的索引鍵映射不適合指定的資料框架」。如果您無法加入唯一的金鑰，請考慮使用其他規則類型，例如 AggregateMatch 來比對摘要資料。

語法


DatasetMatch <REFERENCE_DATASET_ALIAS> <JOIN CONDITION WITH MAPPING> <OPTIONAL_MATCH_COLUMN_MAPPINGS> <EXPRESSION>

REFERENCE_DATASET_ALIAS – 參考資料集的別名，用於比較主要資料集中的資料。
KEY_COLUMN_MAPPINGS – 在資料集中形成索引鍵的以逗號分隔的資料欄名稱清單。如果兩個資料集中的資料欄名稱不相同，您必須使用 -> 加以分隔
OPTIONAL_MATCH_COLUMN_MAPPINGS – 如果只想檢查某些資料欄中的相符資料，則可以提供此參數。它使用與索引鍵資料欄映射相同的語法。如果未提供此參數，則會比對所有剩餘資料欄中的資料。其餘的非索引鍵資料欄在兩個資料集中必須具有相同的名稱。
EXPRESSION – 根據規則類型回應執行，以產生布林值的表達式。如需詳細資訊，請參閱表達式。

範例：使用 ID 資料欄比對集合資料集

下列範例規則會使用 "ID" 資料欄聯結兩個資料集，檢查是否有 90% 以上的主資料集與參考資料集相符。該規則會比較這種情況下的所有資料欄。


DatasetMatch "reference" "ID" >= 0.9

範例：使用多個索引鍵資料欄比對集合資料集

在下列範例中，主資料集與參考資料集的索引鍵資料欄名稱各不相同。ID_1 和 ID_2 會在主資料集中共同形成一個複合索引鍵。ID_ref1 和 ID_ref2 會在參考資料集中共同形成一個複合索引鍵。在此情況下，您可使用特殊語法來提供資料欄名稱。


DatasetMatch "reference" "ID_1->ID_ref1,ID_ref2->ID_ref2" >= 0.9

範例：使用多個索引鍵資料欄比對集合資料集，並檢查特定資料欄是否相符

此範例建立在前面的範例之上。我們僅會檢查包含相符數量的資料欄。此資料欄在主資料集中名為 Amount1，在參考資料集中名為 Amount2。您想要取得完全相符的結果。


DatasetMatch "reference" "ID_1->ID_ref1,ID_2->ID_ref2" "Amount1->Amount2" >= 0.9

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

DataFreshness

DistinctValuesCount