Creación de un trabajo de etiquetado en transmisión con la API de SageMaker - Amazon SageMaker

Creación de un trabajo de etiquetado en transmisión con la API de SageMaker

A continuación se ofrece un ejemplo de solicitud del SDK de AWS Python (Boto3) para puede emplear para iniciar un trabajo de etiquetado en streaming para un tipo de tarea integrada en la región Este de EE. UU. (Norte de Virginia). Para obtener más información sobre cada uno de los parámetros, consulte CreateLabelingJob. Para aprender a crear un trabajo de etiquetado con esta API y los SDK específicos del idioma asociados, consulte Creación de un trabajo de etiquetado (API).

Este ejemplo contiene los siguientes parámetros:

  • SnsDataSource: este parámetro aparece en InputConfig y OutputConfig y se utiliza para identificar los temas de entrada y salida de Amazon SNS, respectivamente. Para crear un trabajo de etiquetado en streaming, debe proporcionar un tema de entrada de Amazon SNS. Si lo desea, también puede proporcionar un tema de salida de Amazon SNS.

  • S3DataSource: este parámetro es opcional. Utilice este parámetro si desea incluir un archivo de manifiesto de entrada con los objetos de datos que desea etiquetar en cuanto comience el trabajo de etiquetado.

  • StoppingConditions: este parámetro no se tiene en cuenta al crear un trabajo de etiquetado en streaming. Para aprender a detener un trabajo de etiquetado en streaming, consulte Detener un trabajo de etiquetado en streaming.

  • Los trabajos de etiquetado en streaming no admiten etiquetado de datos automatizado. No incluya el parámetro LabelingJobAlgorithmsConfig.

response = client.create_labeling_job( LabelingJobName= 'example-labeling-job', LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json' }, 'SnsDataSource': { 'SnsTopicArn': 'arn:aws:sns:us-east-1:123456789012:your-sns-input-topic' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://bucket/path/file-to-store-output-data', 'KmsKeyId': 'string', 'SnsTopicArn': 'arn:aws:sns:us-east-1:123456789012:your-sns-output-topic' }, RoleArn='arn:aws:iam::*:role/*', LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json', HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:us-east-1:*:workteam/private-crowd/*', 'UiConfig': { 'UiTemplateS3Uri': 's3://bucket/path/custom-worker-task-template.html' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-tasktype', 'TaskKeywords': [ 'Example key word', ], 'TaskTitle': 'Multi-label image classification task', 'TaskDescription': 'Select all labels that apply to the images shown', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-tasktype' } }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )