存取適用於 Scikit-learn 和 Spark ML 的 Docker 映像 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

存取適用於 Scikit-learn 和 Spark ML 的 Docker 映像

SageMaker 提供預先建置的 Docker 映像,用於安裝 scikit-learn 和 Spark ML 程式庫。這些程式庫也包含建置 Docker 映像所需的相依性,這些映像與 SageMaker 使用 Amazon SageMaker Python SDK的 相容。透過 SDK,您可以使用 scikit-learn 進行機器學習任務,並使用 Spark ML 建立和調整機器學習管道。如需安裝和使用 的指示SDK,請參閱 SageMaker Python SDK

您也可以在自己的環境中從 Amazon ECR儲存庫存取映像。

使用以下命令來尋找可用的映像版本。例如,使用下列指令尋找 ca-central-1 區域中的可用 sagemaker-sparkml-serving 映像:

aws \ ecr describe-images \ --region ca-central-1 \ --registry-id 341280168497 \ --repository-name sagemaker-sparkml-serving

從 SageMaker Python 存取映像 SDK

下表包含 GitHub 儲存庫的連結,其中包含 scikit-learn 和 Spark ML 容器的原始程式碼。此資料表也包含說明的連結,說明如何將這些容器與 Python SDK 估算器搭配使用,以執行您自己的訓練演算法並託管您自己的模型。

有關 GitHub 儲存庫的更多資訊和連結,請參閱搭配 Amazon 使用 Scikit-learn 的資源 SageMaker搭配 Amazon 使用 SparkML Serving 的資源 SageMaker

手動指定預先建置的映像

如果您未使用 SageMaker Python 及其SDK其中一個估算器來管理容器,則必須手動擷取相關的預先建置容器。預先建置的 SageMaker Docker 映像會儲存在 Amazon Elastic Container Registry (Amazon ) 中ECR。您可以使用其全名登錄檔地址來推送或提取它們。 SageMaker 會將下列 Docker 映像URL模式用於 scikit-learn 和 Spark ML:

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>-cpu-py<PYTHON_VERSION>

    例如 746614075791.dkr.ecr.us-west-1.amazonaws.com/sagemaker-scikit-learn:1.2-1-cpu-py3

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>

    例如 341280168497.dkr.ecr.ca-central-1.amazonaws.com/sagemaker-sparkml-serving:2.4

如需帳戶IDs和 AWS 區域名稱,請參閱 Docker 登錄檔路徑和範例程式碼