限制和考量事項 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

限制和考量事項

檢閱下列限制條件,確保您的筆記本工作順利完成。Studio 使用 Papermill 執行筆記本。您可能需要更新 Jupyter 筆記本以符合 Papermill 的要求。LCC 指令碼的內容也有限制,以及需要了解VPC組態的重要詳細資訊。

JupyterLab 版本

JupyterLab 支援 3.0 版和更新版本。

安裝需要重新啟動核心的套件

Papermill 不支援調用 pip install 來安裝需要重新啟動內核的軟體套件。在此情況下,請在初始化指令碼中使用 pip install。對於不需要重新啟動核心的套件安裝,您仍然可以在筆記本中包含 pip install

使用 Jupyter 註冊的核心和語言名稱

Papermill 會為特定內核和語言註冊翻譯器。如果您攜帶自己的執行個體 (BYOI),請使用標準核心名稱,如下列程式碼片段所示:

papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)

參數和環境變數限制

參數和環境變數限制。您建立筆記本工作時,該工作會接收您指定的參數和環境變數。您最多可以傳遞 100 個參數。每個參數名稱最多可以有 256 個字元,相關聯的值最多可以有 2500 個字元。如果傳遞環境變數,您最多可以傳遞 28 個變數。變數名稱和相關聯值的最多可以有 512 個字元。如果您需要的環境變數數量超過 28 個,請在對您可以使用的環境變數沒有數量限制的初始化指令碼中使用其他環境變數。

檢視任務和任務定義

檢視任務和任務定義。如果您在筆記本的 Studio UI 中排程 JupyterLab 筆記本任務,您可以在 Studio UI 中檢視筆記本任務筆記本任務定義。如果您使用 SageMaker Python 排程筆記本任務SDK,您只能檢視任務, SageMaker Python SDK 筆記本任務步驟不會建立任務定義。若要檢視您的任務,您也需要為筆記本任務步驟執行個體提供額外的標籤。如需詳細資訊,請參閱 在 Studio UI 儀表板中檢視您的筆記本任務

映像

您需要管理映像限制,這取決於您在 Studio 中執行筆記本任務,還是在管道中執行 SageMaker Python SDK 筆記本任務步驟。

SageMaker AI 筆記本任務 (Studio) 的影像限制

映像和內核支援。啟動筆記本工作的驅動程式假設存在下列事實:

  • 基礎 Python 執行期環境安裝在 Studio 或 bring-your-own(BYO) 映像中,且是 shell 中的預設值。

  • 基本 Python 執行期環境包括 Jupyter 用戶端,其中包含正確設定的核心核規格。

  • 基本 Python 執行期環境包括 pip 函式,因此筆記本工作可以安裝系統依賴項。

  • 對於具有多個環境的映像,您的初始化指令碼應該在安裝特定於筆記本的套件之前,切換到適當的核心特定環境。在設定核心 Python 執行期環境之後,您應該切換回預設的 Python 執行期環境 (如果與核心執行期環境不同)。

啟動筆記本任務的驅動程式是 bash 指令碼,Bash v4 必須可用at /bin/bash。

() 上的 bring-your-own-images根權限BYOI。您必須擁有自己 Studio 映像的 root 權限,無論是具有 root 使用者身分還是擁有 sudo 存取權。如果您不是 root 使用者,而是能夠透過 sudo 存取 root 權限,請使用 1000/100 作為 UID/GID

SageMaker AI Python SDK筆記本任務的影像限制

筆記本任務步驟支援下列映像:

  • SageMaker 中列出的分佈映像Amazon SageMaker AI 映像可與 Studio Classic 搭配使用

  • 根據上一個清單中 SageMaker 分佈映像的自訂映像。使用SageMaker 分佈映像做為基礎。

  • 預先安裝筆記本任務相依性的自訂映像 (BYOI) (即 sagemaker-headless-execution-driver。您的映像必須符合下列要求:

    • 映像會預先安裝筆記本任務相依性。

    • 基本 Python 執行期環境已安裝,且預設為 shell 環境。

    • 基本 Python 執行期環境包括 Jupyter 用戶端,其中包含正確設定的核心核規格。

    • 您具有根權限,無論是以根使用者身分或透過sudo存取。如果您不是 root 使用者,而是能夠透過 sudo 存取 root 權限,請使用 1000/100 作為 UID/GID

VPC 任務建立期間使用的子網路

如果您使用 VPC,Studio 會使用私有子網路來建立您的任務。指定一到五個私有子網路 (和 1-15 個安全群組)。

如果您使用VPC具有私有子網路的 ,則必須選擇下列其中一個選項,以確保筆記本任務可以連線至相依服務或資源:

  • 如果任務需要存取支援介面VPC端點 AWS 的服務,請建立端點以連線至服務。如需支援介面端點的服務清單,請參閱 AWS 整合的 服務 AWS PrivateLink。如需建立介面VPC端點的相關資訊,請參閱使用介面VPC端點存取 AWS 服務。至少必須提供 Amazon S3 VPC端點閘道。

  • 如果筆記本任務需要存取不支援介面VPC端點 AWS 的服務,或存取 外部的資源 AWS,請建立NAT閘道並設定安全群組以允許傳出連線。如需設定 NAT閘道的相關資訊VPC,請參閱《Amazon Virtual Private Cloud 使用者指南》中的VPC使用公有和私有子網路 (NAT)

服務限制

由於筆記本任務排程器是由管道、 SageMaker 訓練和 Amazon EventBridge 服務建置,因此您的筆記本任務受限於其服務特定的配額。如果超出這些配額,您可能會看到與這些服務相關的錯誤訊息。例如,與一次可以執行的管道數量,以及單一事件匯流排可以設定的規則數量相關的限制。如需 SageMaker AI 配額的詳細資訊,請參閱 Amazon SageMaker AI 端點和配額。如需 EventBridge 配額的詳細資訊,請參閱 Amazon EventBridge Quotas