本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
步驟 2:啟動 Amazon EMR叢集
在此步驟中,您將設定並啟動 Amazon EMR叢集。DynamoDB 的 Hive 和儲存處理常式已安裝在叢集上。
在 https://console.aws.amazon.com/emr
開啟 Amazon EMR主控台。 -
選擇 Create Cluster (建立叢集)。
-
在 Create Cluster:Quick Options (建立叢集:快速選項) 頁面上,執行下列動作:
-
在 Cluster name (叢集名稱) 中,為叢集輸入名稱 (例如
My EMR cluster
)。 -
在EC2金鑰對中,選擇您先前建立的金鑰對。
將其他設定保留為各自的預設設定。
-
-
選擇 Create cluster (建立叢集)。
啟動叢集需要幾分鐘的時間。您可以使用 Amazon EMR主控台中的叢集詳細資訊頁面來監控其進度。
當狀態變更為 Waiting
時,即叢集已準備就緒。
叢集日誌檔案和 Amazon S3
Amazon EMR叢集會產生日誌檔案,其中包含叢集狀態和偵錯資訊的相關資訊。建立叢集 - 快速選項的預設設定包括設定 Amazon EMR記錄。
如果尚未存在, AWS Management Console 會建立 Amazon S3 儲存貯體。儲存貯體名稱為 aws-logs-
,其中 account-id
-region
是 AWS 您的帳戶號碼,而 account-id
是您啟動叢集的區域 (例如 region
aws-logs-123456789012-us-west-2
)。
注意
您可以使用 Amazon S3 主控台來檢視日誌檔案。如需詳細資訊,請參閱《Amazon EMR管理指南》中的檢視日誌檔案。
除了日誌記錄之外,您還可以將此儲存貯體用於其他目的。例如,您可以使用儲存貯體作為儲存 Hive 指令碼的位置,或將資料從 Amazon DynamoDB 匯出到 Amazon S3 時作為目的地。