本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
JOIN
对两个数据集执行连接操作。
参数
-
joinKeys
— 一个 JSON 编码的字符串,表示每个数据集中用作联接键的列的列表。 -
joinType
— 要执行的联接类型。必须是以下之一:INNER_JOIN
|LEFT_JOIN
|RIGHT_JOIN
|OUTER_JOIN
|LEFT_EXCLUDING_JOIN
|RIGHT_EXCLUDING_JOIN
|OUTER_EXCLUDING_JOIN
-
leftColumns
— 一个 JSON 编码的字符串,表示当前活动数据集中的列列表。 -
rightColumns
— 一个 JSON 编码的字符串,表示来自另一个(辅助)数据集的列列表,以连接到当前数据集。 -
secondInputLocation
— 解析为辅助数据集数据文件的 Amazon S3 网址。 -
secondaryDatasetName
-辅助数据集的名称。
例 示例
{
"Action": {
"Operation": "JOIN",
"Parameters": {
"joinKeys": "[{\"key\":\"assembly_session\",\"value\":\"assembly_session\"},{\"key\":\"state_code\",\"value\":\"state_code\"}]",
"joinType": "INNER_JOIN",
"leftColumns": "[\"year\",\"assembly_session\",\"state_code\",\"state_name\",\"all_votes\",\"yes_votes\",\"no_votes\",\"abstain\",\"idealpoint_estimate\",\"affinityscore_usa\",\"affinityscore_russia\",\"affinityscore_china\",\"affinityscore_india\",\"affinityscore_brazil\",\"affinityscore_israel\"]",
"rightColumns": "[\"assembly_session\",\"vote_id\",\"resolution\",\"state_code\",\"state_name\",\"member\",\"vote\"]",
"secondInputLocation": "s3://databrew-public-datasets-us-east-1/votes.csv",
"secondaryDatasetName": "votes"
}
}
}