Amazon EMR Notebooks 概觀 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon EMR Notebooks 概觀

注意

EMR 筆記本可在 主控台中作為 EMR Studio Workspaces 使用。主控台中的建立工作區按鈕可讓您建立新的筆記本。若要存取或建立 Workspaces,EMRNotebooks 使用者需要額外IAM的角色許可。如需詳細資訊,請參閱 主控台中的 Amazon EMR Notebooks 是 Amazon EMR Studio WorkspacesAmazon EMR主控台

您可以使用 Amazon EMR Notebook 搭配執行 Apache Spark 的 Amazon EMR叢集,在 Amazon EMR主控台內建立和開啟 Jupyter Notebook 和 JupyterLab介面。EMR 筆記本是「無伺服器」筆記本,可用來執行查詢和程式碼。與傳統筆記本不同,EMR筆記本的內容 - 筆記本儲存格內的方程式、查詢、模型、程式碼和敘述文字 - 會在用戶端中執行。使用EMR叢集上的核心執行命令。筆記本的內容也會與叢集資料分開儲存到 Amazon S3,以提供耐用性並彈性地重複使用。

您可以啟動叢集、連接EMR筆記本進行分析,然後終止叢集。您也可以關閉連接到一個執行中叢集的筆記本,然後切換到另一個叢集。多位使用者可以同時將筆記本附接至同一個叢集,並彼此共用 Amazon S3 中的筆記本檔案。這些功能可讓您隨需執行叢集以節省成本,並減少針對不同叢集和資料集重新設定筆記本所花費的時間。

您也可以使用 Amazon EMR 以程式設計方式執行EMR筆記本API,而無需與 Amazon EMR主控台互動 (「無頭執行」)。您需要在筆記本中包含具有參數標籤EMR的儲存格。該儲存格允許指令碼將新輸入值傳遞至筆記本。參數化筆記本可以與不同的輸入值集一起重複使用。不需要製作相同筆記本的複本,即可使用新的輸入值進行編輯和執行。Amazon 會針對參數化筆記本的每次執行,在 S3 上EMR建立並儲存輸出筆記本。如需EMR筆記本API程式碼範例,請參閱 EMR Notebook 的程式設計命令範例

重要

EMR Notebooks 功能支援使用 Amazon 5.18.0 EMR版及更新的叢集。建議您將EMR筆記本與使用最新版本 Amazon 的叢集搭配使用EMR,或至少 5.30.0、5.32.0 或 6.2.0。使用這些版本,Jupyter 核心在附接的叢集上執行,而不是在 Jupyter 執行個體上。這可改善效能,並增強您自訂核心和程式庫的能力。如需詳細資訊,請參閱依叢集發行版本分類的功能差異

適用 Amazon S3 儲存體和 Amazon EMR叢集的費用。