选择您的 Cookie 首选项

我们使用必要 Cookie 和类似工具提供我们的网站和服务。我们使用性能 Cookie 收集匿名统计数据,以便我们可以了解客户如何使用我们的网站并进行改进。必要 Cookie 无法停用,但您可以单击“自定义”或“拒绝”来拒绝性能 Cookie。

如果您同意,AWS 和经批准的第三方还将使用 Cookie 提供有用的网站功能、记住您的首选项并显示相关内容,包括相关广告。要接受或拒绝所有非必要 Cookie,请单击“接受”或“拒绝”。要做出更详细的选择,请单击“自定义”。

Neptune ML 模型训练 API

聚焦模式
Neptune ML 模型训练 API - Amazon Neptune

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

模型训练操作:

模型训练结构:

开始 MLModelTrainingJob (操作)

        此 AP AWS I 的 CLI 名称是:start-ml-model-training-job

创建新的 Neptune ML 模型训练任务。请参阅使用 modeltraining 命令进行模型训练

在启用了 IAM 身份验证的 Neptune 集群中调用此操作时,发出请求的 IAM 用户或角色必须附加允许在该集群中执行 Ne MLModel TrainingJob ptune-db: Start IAM 操作策略。

请求

  • baseProcessingInstanceType(在 CLI 中:--base-processing-instance-type)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    用于准备和管理机器学习模型训练的机器学习实例的类型。这是根据用于处理训练数据和模型的内存要求选择的 CPU 实例。

  • customModelTrainingParameters(在 CLI 中:--custom-model-training-parameters) – CustomModelTrainingParameters 对象。

    自定义模型训练的配置。这是 JSON 对象。

  • dataProcessingJobId(在 CLI 中:--data-processing-job-id)– 必需:一个字符串,类型为:string(UTF-8 编码的字符串)。

    已完成的数据处理任务的任务 ID,该任务已创建训练将使用的数据。

  • enableManagedSpotTraining(在 CLI 中:--enable-managed-spot-training)– 一个布尔值,类型为:boolean [布尔值(true 或 false)]。

    使用 Amazon Elastic Compute Cloud 竞价型实例优化训练机器学习模型的成本。默认为 False

  • id(在 CLI 中:--id)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    新任务的唯一标识符。默认值为自动生成的 UUID。

  • maxHPONumberOfTrainingJobs(在 CLI 中:--max-hpo-number-of-training-jobs)– 一个整数,类型为:integer(带符号的 32 位整数)。

    超参数调整任务要启动的最大训练任务总数。默认值为 2。Neptune ML 会自动调整机器学习模型的超参数。要获得性能良好的模型,请至少使用 10 个任务(换句话说,将 maxHPONumberOfTrainingJobs 设置为 10)。通常,调整次数越多,结果越好。

  • maxHPOParallelTrainingJobs(在 CLI 中:--max-hpo-parallel-training-jobs)– 一个整数,类型为:integer(带符号的 32 位整数)。

    为超参数调整任务启动的最大并行训练任务数。默认值为 2。您可以运行的并行任务数量受训练实例上可用资源的限制。

  • neptuneIamRoleArn(在 CLI 中:--neptune-iam-role-arn)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    向 Neptune 提供对 A SageMaker mazon S3 资源的访问权限的 IAM 角色的 ARN。必须将其列在您的数据库集群参数组中,否则将发生错误。

  • previousModelTrainingJobId(在 CLI 中:--previous-model-training-job-id)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    已完成的模型训练任务的任务 ID,您要根据更新的数据以递增方式更新该任务。

  • s3OutputEncryptionKMSKey(在 CLI 中:--s-3-output-encryption-kms-key)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    SageMaker 用于加密处理任务输出的亚马逊密钥管理服务 (KMS) 密钥。默认值为“无”。

  • sagemakerIamRoleArn(在 CLI 中:--sagemaker-iam-role-arn)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    用于 SageMaker 执行的 IAM 角色的 ARN。必须将其列在您的数据库集群参数组中,否则会出现错误。

  • securityGroupIds(在 CLI 中:--security-group-ids)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    VPC 安全组 IDs。默认值为 None (无)。

  • subnets(在 CLI 中:--subnets)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    Ne IDs ptune VPC 中的子网。默认值为 None (无)。

  • trainingInstanceType(在 CLI 中:--training-instance-type)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    用于模型训练的 ML 实例的类型。所有 Neptune ML 模型都支持 CPU、GPU 和多 GPU 训练。默认为 ml.p3.2xlarge。为训练选择正确的实例类型取决于任务类型、图形大小和预算。

  • trainingInstanceVolumeSizeInGB(在 CLI 中:--training-instance-volume-size-in-gb)– 一个整数,类型为:integer(带符号的 32 位整数)。

    训练实例的磁盘卷大小。输入数据和输出模型都存储在磁盘上,因此卷大小必须足够大,以容纳两个数据集。默认值是 0。如果未指定或为 0,Neptune ML 会根据数据处理步骤中生成的建议选择磁盘卷大小。

  • trainingTimeOutInSeconds(在 CLI 中:--training-time-out-in-seconds)– 一个整数,类型为:integer(带符号的 32 位整数)。

    训练任务的超时(以秒为单位)。默认值为 86400(1 天)。

  • trainModelS3Location(在 CLI 中:--train-model-s3-location)– 必需:一个字符串,类型为:string(UTF-8 编码的字符串)。

    Amazon S3 中要存储模型构件的位置。

  • volumeEncryptionKMSKey(在 CLI 中:--volume-encryption-kms-key)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    Amazon 密钥管理服务 (KMS) 密钥, SageMaker 用于加密连接到运行训练作业的 ML 计算实例的存储卷上的数据。默认值为 None (无)。

响应

  • arn – 一个字符串,类型为:string(UTF-8 编码的字符串)。

    新模型训练任务的 ARN。

  • creationTimeInMillis – 长整型,类型为:long(有符号的 64 位整数)。

    模型训练任务创建时间,以毫秒为单位。

  • id – 一个字符串,类型为:string(UTF-8 编码的字符串)。

    新模型训练任务的唯一 ID。

清单 MLModelTrainingJobs (操作)

        此 AP AWS I 的 CLI 名称是:list-ml-model-training-jobs

列出 Neptune ML 模型训练任务。请参阅使用 modeltraining 命令进行模型训练

在启用了 IAM 身份验证的 Neptune 集群中调用此操作时,发出请求的 IAM 用户或角色必须附加允许在该集群中执行 neptune-db: ne MLModel TrainingJobs ptune-db: List IAM 操作的策略。

请求

  • maxItems(在 CLI 中:--max-items)— 列表 MLModelTrainingJobsInputMaxItemsInteger,类型为:integer(带符号的 32 位整数),不小于 1 或大于 1024? st? s。

    要返回的最大项目数(从 1 到 1024;默认值为 10)。

  • neptuneIamRoleArn(在 CLI 中:--neptune-iam-role-arn)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    向 Neptune 提供对 A SageMaker mazon S3 资源的访问权限的 IAM 角色的 ARN。必须将其列在您的数据库集群参数组中,否则将发生错误。

响应

  • ids – 一个字符串,类型为:string(UTF-8 编码的字符串)。

    模型训练作业列表的页面 IDs。

获取 MLModelTrainingJob (操作)

        此 AP AWS I 的 CLI 名称是:get-ml-model-training-job

检索有关 Neptune ML 模型训练任务的信息。请参阅使用 modeltraining 命令进行模型训练

在启用了 IAM 身份验证的 Neptune 集群中调用此操作时,发出请求的 IAM 用户或角色必须附加允许在该集群中执行 Ne MLModel TrainingJobStatus ptune-db: Get IAM 操作策略。

请求

  • id(在 CLI 中:--id)– 必需:一个字符串,类型为:string(UTF-8 编码的字符串)。

    要检索的模型训练任务的唯一标识符。

  • neptuneIamRoleArn(在 CLI 中:--neptune-iam-role-arn)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    向 Neptune 提供对 A SageMaker mazon S3 资源的访问权限的 IAM 角色的 ARN。必须将其列在您的数据库集群参数组中,否则将发生错误。

响应

  • hpoJob – 一个 MlResourceDefinition 对象。

    HPO 任务。

  • id – 一个字符串,类型为:string(UTF-8 编码的字符串)。

    此模型训练任务的唯一标识符。

  • mlModelsMlConfigDefinition 对象的数组。

    正在使用的机器学习模型的配置列表。

  • modelTransformJob – 一个 MlResourceDefinition 对象。

    模型转换任务。

  • processingJob – 一个 MlResourceDefinition 对象。

    数据处理任务。

  • status – 一个字符串,类型为:string(UTF-8 编码的字符串)。

    模型训练任务的状态。

取消 MLModelTrainingJob (操作)

        此 AP AWS I 的 CLI 名称是:cancel-ml-model-training-job

取消 Neptune ML 模型训练任务。请参阅使用 modeltraining 命令进行模型训练

在启用了 IAM 身份验证的 Neptune 集群中调用此操作时,发出请求的 IAM 用户或角色必须附加允许在该集群中执行 Ne MLModel TrainingJob ptune-db: Cancel IAM 操作策略。

请求

  • clean(在 CLI 中:--clean)– 一个布尔值,类型为:boolean [布尔值(true 或 false)]。

    如果设置为 TRUE,则此标志指定在任务停止时应删除所有 Amazon S3 构件。默认为 FALSE

  • id(在 CLI 中:--id)– 必需:一个字符串,类型为:string(UTF-8 编码的字符串)。

    要取消的模型训练任务的唯一标识符。

  • neptuneIamRoleArn(在 CLI 中:--neptune-iam-role-arn)– 一个字符串,类型为:string(UTF-8 编码的字符串)。

    向 Neptune 提供对 A SageMaker mazon S3 资源的访问权限的 IAM 角色的 ARN。必须将其列在您的数据库集群参数组中,否则将发生错误。

响应

  • status – 一个字符串,类型为:string(UTF-8 编码的字符串)。

    取消的状态。

模型训练结构:

CustomModelTrainingParameters (结构)

包含自定义模型训练参数。请参阅 Neptune ML 中的自定义模型

字段
  • sourceS3DirectoryPath – 这是必需的:一个字符串,类型为:string(UTF-8 编码的字符串)。

    实现您的模型的 Python 模块所在的 Amazon S3 位置的路径。这必须指向有效的现有 Amazon S3 位置,其中至少包含训练脚本、转换脚本和 model-hpo-configuration.json 文件。

  • trainingEntryPointScript – 这是一个字符串,类型为:string(UTF-8 编码的字符串)。

    执行模型训练并将超参数作为命令行参数(包括固定的超参数)的脚本模块中入口点的名称。默认为 training.py

  • transformEntryPointScript – 这是一个字符串,类型为:string(UTF-8 编码的字符串)。

    脚本模块中入口点的名称,该脚本应在确定超参数搜索中的最佳模型之后运行,以计算模型部署所需的模型构件。它应该能够在没有命令行参数的情况下运行。默认值为 transform.py

隐私网站条款Cookie 首选项
© 2025, Amazon Web Services, Inc. 或其附属公司。保留所有权利。