建立短期 Amazon EMR 叢集並使用 a AWS SDK 執行步驟 - AWS SDK 程式碼範例

文件 AWS SDK AWS 範例 SDK 儲存庫中有更多可用的 GitHub 範例。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立短期 Amazon EMR 叢集並使用 a AWS SDK 執行步驟

下列程式碼範例示範如何建立執行步驟的短期 Amazon EMR 叢集,並在步驟完成後自動終止。

Python
SDK for Python (Boto3)

建立短期 Amazon EMR 叢集,使用 Apache Spark 來平行處理大量計算,以估算 pi 的值。任務會將輸出寫入 Amazon EMR 日誌和 Amazon Simple Storage Service (Amazon S3) 儲存貯體。叢集會在完成任務後自行終止。

  • 建立 Amazon S3 儲存貯體並上傳任務指令碼。

  • Create AWS Identity and Access Management (IAM) 角色。

  • 建立 Amazon Elastic Compute Cloud (Amazon EC2) 安全群組。

  • 建立短期叢集並執行單個任務步驟。

此範例最適合在 GitHub 上檢視。如需完整的原始程式碼和如何設定和執行的指示,請參閱 GitHub 上的完整範例。

此範例中使用的服務
  • Amazon EMR