步驟 2:啟動 Amazon EMR叢集 - Amazon DynamoDB

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 2:啟動 Amazon EMR叢集

在此步驟中,您將設定並啟動 Amazon EMR叢集。DynamoDB 的 Hive 和儲存處理常式已安裝在叢集上。

  1. https://console.aws.amazon.com/emr 開啟 Amazon EMR主控台。

  2. 選擇 Create Cluster (建立叢集)。

  3. Create Cluster:Quick Options (建立叢集:快速選項) 頁面上,執行下列動作:

    1. Cluster name (叢集名稱) 中,為叢集輸入名稱 (例如 My EMR cluster)。

    2. EC2金鑰對中,選擇您先前建立的金鑰對。

    將其他設定保留為各自的預設設定。

  4. 選擇 Create cluster (建立叢集)。

啟動叢集需要幾分鐘的時間。您可以使用 Amazon EMR主控台中的叢集詳細資訊頁面來監控其進度。

當狀態變更為 Waiting 時,即叢集已準備就緒。

叢集日誌檔案和 Amazon S3

Amazon EMR叢集會產生日誌檔案,其中包含叢集狀態和偵錯資訊的相關資訊。建立叢集 - 快速選項的預設設定包括設定 Amazon EMR記錄。

如果尚未存在, AWS Management Console 會建立 Amazon S3 儲存貯體。儲存貯體名稱為 aws-logs-account-id-region,其中 account-id 是 AWS 您的帳戶號碼,而 region是您啟動叢集的區域 (例如 aws-logs-123456789012-us-west-2)。

注意

您可以使用 Amazon S3 主控台來檢視日誌檔案。如需詳細資訊,請參閱《Amazon EMR管理指南》中的檢視日誌檔案

除了日誌記錄之外,您還可以將此儲存貯體用於其他目的。例如,您可以使用儲存貯體作為儲存 Hive 指令碼的位置,或將資料從 Amazon DynamoDB 匯出到 Amazon S3 時作為目的地。

下一步驟

步驟 3:連接到領導節點