本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon EMR Notebooks 概觀
注意
EMR 筆記本可在 主控台中作為 EMR Studio Workspaces 使用。主控台中的建立工作區按鈕可讓您建立新的筆記本。若要存取或建立 Workspaces,EMRNotebooks 使用者需要額外IAM的角色許可。如需詳細資訊,請參閱 主控台中的 Amazon EMR Notebooks 是 Amazon EMR Studio Workspaces 和 Amazon EMR主控台 。
您可以使用 Amazon EMR Notebook 搭配執行 Apache Spark
您可以啟動叢集、連接EMR筆記本進行分析,然後終止叢集。您也可以關閉連接到一個執行中叢集的筆記本,然後切換到另一個叢集。多位使用者可以同時將筆記本附接至同一個叢集,並彼此共用 Amazon S3 中的筆記本檔案。這些功能可讓您隨需執行叢集以節省成本,並減少針對不同叢集和資料集重新設定筆記本所花費的時間。
您也可以使用 Amazon EMR 以程式設計方式執行EMR筆記本API,而無需與 Amazon EMR主控台互動 (「無頭執行」)。您需要在筆記本中包含具有參數標籤EMR的儲存格。該儲存格允許指令碼將新輸入值傳遞至筆記本。參數化筆記本可以與不同的輸入值集一起重複使用。不需要製作相同筆記本的複本,即可使用新的輸入值進行編輯和執行。Amazon 會針對參數化筆記本的每次執行,在 S3 上EMR建立並儲存輸出筆記本。如需EMR筆記本API程式碼範例,請參閱 EMR Notebook 的程式設計命令範例。
重要
EMR Notebooks 功能支援使用 Amazon 5.18.0 EMR版及更新的叢集。建議您將EMR筆記本與使用最新版本 Amazon 的叢集搭配使用EMR,或至少 5.30.0、5.32.0 或 6.2.0。使用這些版本,Jupyter 核心在附接的叢集上執行,而不是在 Jupyter 執行個體上。這可改善效能,並增強您自訂核心和程式庫的能力。如需詳細資訊,請參閱依叢集發行版本分類的功能差異。
適用 Amazon S3 儲存體和 Amazon EMR叢集的費用。