使用创建流式标注 Job SageMaker API - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用创建流式标注 Job SageMaker API

以下是 AWS Python SDK (Boto3) 请求的示例,您可以使用该请求为美国东部(弗吉尼亚北部)区域的内置任务类型启动流式标签作业。有关以下每个参数的更多详细信息,请参阅 CreateLabelingJob。要了解如何使用此语言API和相关语言创建标签任务SDKs,请参阅创建标注任务 (API)

在此示例中,请注意以下参数:

  • SnsDataSource— 此参数出现在InputConfigOutputConfig和中,用于分别识别您的输入和输出 Amazon SNS 主题。要创建流式标签任务,您需要提供一个 Amazon SNS 输入主题。或者,您也可以提供 Amazon SNS 输出主题。

  • S3DataSource – 此参数为可选参数。如果您想在标注作业开始后立即包括要标注的数据对象的输入清单文件,请使用此参数。

  • StoppingConditions – 创建流式标注作业时,将忽略此参数。要了解有关停止流式标注作业的更多信息,请参阅停止流式标注作业

  • 流式标注作业不支持自动数据标注。不要包括 LabelingJobAlgorithmsConfig 参数。

response = client.create_labeling_job( LabelingJobName= 'example-labeling-job', LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json' }, 'SnsDataSource': { 'SnsTopicArn': 'arn:aws:sns:us-east-1:123456789012:your-sns-input-topic' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://bucket/path/file-to-store-output-data', 'KmsKeyId': 'string', 'SnsTopicArn': 'arn:aws:sns:us-east-1:123456789012:your-sns-output-topic' }, RoleArn='arn:aws:iam::*:role/*', LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json', HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:us-east-1:*:workteam/private-crowd/*', 'UiConfig': { 'UiTemplateS3Uri': 's3://bucket/path/custom-worker-task-template.html' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-tasktype', 'TaskKeywords': [ 'Example key word', ], 'TaskTitle': 'Multi-label image classification task', 'TaskDescription': 'Select all labels that apply to the images shown', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-tasktype' } }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )