Crea un modello di lavoro di valutazione che utilizzi lavoratori umani

Modalità Focus

Crea un modello di lavoro di valutazione che utilizzi lavoratori umani - Amazon SageMaker AI

Importante

Le politiche IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L'autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic taggano automaticamente tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente l'aggiunta di tag, si possono verificare errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornisci le autorizzazioni per SageMaker etichettare le risorse AI.

AWS politiche gestite per Amazon SageMaker AIche danno i permessi per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Per creare un processo di valutazione del modello che utilizzi lavoratori umani, è necessario configurare l'ambiente in modo da disporre delle autorizzazioni corrette. È quindi possibile utilizzare la procedura guidata per il processo di valutazione dei modelli in Studio per selezionare i modelli da utilizzare e quindi definire i parametri e la forza lavoro da utilizzare nel processo di valutazione del modello.

Una volta completato il lavoro, è possibile visualizzare un rapporto per comprendere in che modo la forza lavoro ha valutato i modelli selezionati. I risultati vengono inoltre salvati in Amazon S3 come file di jsonlines output.

In un processo di valutazione dei modelli che utilizza lavoratori umani, hai la possibilità di importare dati di inferenza da modelli ospitati al di fuori dell' SageMaker intelligenza artificiale e da modelli ospitati all'esterno di. AWS Per ulteriori informazioni, consulta Utilizzo dei dati di inferenza personali in lavori di valutazione dei modelli che utilizzano lavoratori umani.

Una volta completati i processi, i risultati vengono salvati nel bucket Amazon S3 specificato al momento della creazione del lavoro. Per informazioni su come interpretare i risultati, consulta. Comprendi i risultati del tuo lavoro di valutazione del modello

Prerequisiti

Per eseguire una valutazione del modello nell'interfaccia utente di Amazon SageMaker Studio, il tuo ruolo AWS Identity and Access Management (IAM) e tutti i set di dati di input devono disporre delle autorizzazioni corrette. Se non disponi di un dominio SageMaker AI o di un ruolo IAM, segui i passaggi indicati. Guida alla configurazione con Amazon SageMaker AI

Configurazione delle autorizzazioni

La sezione seguente mostra come creare un bucket Amazon S3 e come specificare le autorizzazioni CORS (Cross-Origin Resource Sharing) corrette.

Per creare un bucket Amazon S3 e specificare le autorizzazioni CORS

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nel riquadro di navigazione, S3 accedi alla barra di ricerca nella parte superiore della pagina.
Scegli S3 in Servizi.
Scegli Bucket dal pannello di navigazione.
Nella sezione General Purpose Bucket, sotto Nome, scegli il nome del bucket S3 che desideri utilizzare per memorizzare l'input e l'output del modello nella console. Se non disponi di un bucket S3, procedi come segue.
1. Seleziona Crea bucket per aprire una nuova pagina Crea bucket.
2. Nella sezione Configurazione generale, in AWS Regione, seleziona la AWS regione in cui si trova il modello di base.
3. Assegna un nome al bucket S3 nella casella di immissione sotto Nome del bucket.
4. Accetta tutte le scelte predefinite.
5. Seleziona Crea bucket.
6. Nella sezione General Purpose bucket, sotto Nome, seleziona il nome del bucket S3 che hai creato.
Scegli la scheda Autorizzazioni.
Scorri fino alla sezione Cross-origin resource sharing (CORS) nella parte inferiore della finestra. Scegli Modifica.

Di seguito è riportata la policy CORS minima richiesta da aggiungere al bucket Amazon S3. Copia e incolla quanto segue nella casella di input.


[
{
    "AllowedHeaders": ["*"],
    "AllowedMethods": [
        "GET",
        "HEAD",
        "PUT"
    ],
    "AllowedOrigins": [
        "*"
    ],
    "ExposeHeaders": [
      "Access-Control-Allow-Origin"
    ],
    "MaxAgeSeconds": 3000
}
]

Scegli Save changes (Salva modifiche).

Per aggiungere autorizzazioni alla tua policy IAM

Potresti prendere in considerazione il livello di autorizzazioni da assegnare al tuo ruolo IAM.

Puoi creare una policy IAM personalizzata che consenta le autorizzazioni minime richieste su misura per questo servizio.
Puoi collegare le AmazonS3FullAccesspolitiche esistenti AmazonSageMakerFullAccesse al tuo ruolo IAM esistente, che è più permissivo. Per ulteriori informazioni sulla AmazonSageMakerFullAccess policy, consulta. AmazonSageMakerFullAccess

Se desideri allegare le policy esistenti al tuo ruolo IAM, puoi saltare le istruzioni qui riportate e continuare a seguire le istruzioni riportate nella sezione Per aggiungere autorizzazioni al tuo ruolo IAM.

Le seguenti istruzioni creano una policy IAM personalizzata su misura per questo servizio con autorizzazioni minime.

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciIAM.
In Servizi, seleziona Identity and Access Management (IAM).
Scegli Politiche dal riquadro di navigazione.
Scegli Create Policy (Crea policy). Quando si apre l'editor delle politiche, scegli JSON.

Assicurati che le seguenti autorizzazioni siano visualizzate nell'editor delle politiche. Puoi anche copiare e incollare quanto segue nell'editor delle politiche.


{
"Version": "2012-10-17",
"Statement":
    [{
        "Effect": "Allow",
        "Action": [
            "s3:GetObject",
            "s3:PutObject",
            "s3:ListBucket"
        ],
        "Resource": [
            "arn:aws:s3:::{input_bucket}/*",
            "arn:aws:s3:::{input_bucket}",
            "arn:aws:s3:::{output_bucket}/*",
            "arn:aws:s3:::{output_bucket}",
            "arn:aws:s3:::jumpstart-cache-prod-{region}/*",
            "arn:aws:s3:::jumpstart-cache-prod-{region}"
        ]
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:CreateEndpoint",
            "sagemaker:DeleteEndpoint",
            "sagemaker:CreateEndpointConfig",
            "sagemaker:DeleteEndpointConfig"
        ],
        "Resource": [
            "arn:aws:sagemaker:{region}:{account-id}:endpoint/sm-margaret-*",
            "arn:aws:sagemaker:{region}:{account-id}:endpoint-config/sm-margaret-*"
        ],
        "Condition": {
            "ForAnyValue:StringEquals": {
                "aws:TagKeys": "sagemaker-sdk:jumpstart-model-id"
            }
        }
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:DescribeProcessingJob",
            "sagemaker:DescribeEndpoint",
            "sagemaker:InvokeEndpoint"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:DescribeInferenceComponent",
            "sagemaker:AddTags",
            "sagemaker:CreateModel",
            "sagemaker:DeleteModel"
        ],
        "Resource": "arn:aws:sagemaker:{region}:{account-id}:model/*",
        "Condition": {
            "ForAnyValue:StringEquals": {
                "aws:TagKeys": "sagemaker-sdk:jumpstart-model-id"
            }
        }
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:DescribeFlowDefinition",
            "sagemaker:StartHumanLoop",
            "sagemaker:DescribeHumanLoop"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "logs:CreateLogStream",
            "logs:PutLogEvents",
            "logs:CreateLogGroup",
            "logs:DescribeLogStreams"
        ],
        "Resource": "arn:aws:logs:{region}:{account-id}:log-group:/aws/sagemaker/ProcessingJobs:*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "cloudwatch:PutMetricData"
        ],
        "Resource":"*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "ecr:GetAuthorizationToken",
            "ecr:BatchCheckLayerAvailability",
            "ecr:GetDownloadUrlForLayer",
            "ecr:BatchGetImage"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "kms:DescribeKey",
            "kms:GetPublicKey",
            "kms:Decrypt",
            "kms:Encrypt"
        ],
        "Resource": [
            "arn:aws:kms:{region}:{account-id}:key/{kms-key-id}"
        ]
    },
    {
        "Effect": "Allow",
        "Action": [
            "iam:PassRole"
        ],
        "Resource": "arn:aws:iam::{account-id}:role/{this-role-created-by-customer}",
        "Condition": {
            "StringEquals": {
                "aws:PrincipalAccount": [
                    "account-id"
                ]
            }
        }
    }]
}

Scegli Next (Successivo).
Inserisci il nome di una politica nella sezione Dettagli della politica, sotto Nome della politica. Facoltativamente, è possibile inserire una descrizione. Cercherai il nome di questo criterio quando lo assegni a un ruolo.
Scegli Create Policy (Crea policy).

Per aggiungere autorizzazioni al tuo ruolo IAM

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciIAM.
In Servizi, seleziona Identity and Access Management (IAM).
Nel riquadro di navigazione scegliere Roles (Ruoli).
Se stai creando un nuovo ruolo:
1. Scegliere Crea ruolo.
2. Nel passaggio Seleziona entità attendibile, in Tipo di entità affidabile scegli Politica di attendibilità personalizzata.
3. Nell'editor di criteri di fiducia personalizzati, accanto a Aggiungi principale scegli Aggiungi.
4. Nella casella pop-up Aggiungi principale, in Tipo principale, seleziona AWS i servizi dall'elenco a discesa delle opzioni.
5. In ARN sostituire {ServiceName} con. sagemaker
6. Scegli Aggiungi principale.
7. Scegli Next (Successivo).
8. (Facoltativo) In Politiche di autorizzazione seleziona le politiche che desideri aggiungere al tuo ruolo.
9. (Facoltativo) In Imposta i limiti delle autorizzazioni: facoltativo, scegli l'impostazione dei limiti delle autorizzazioni.
10. Scegli Next (Successivo).
11. Nella fase Nome, revisione e creazione, in Dettagli del ruolo inserisci il nome e la descrizione del ruolo.
12. (Facoltativo) In Aggiungi tag - opzionale, puoi aggiungere tag scegliendo Aggiungi nuovo tag e inserisci una chiave e un valore, coppia opzionale.
13. Verificare le impostazioni.
14. Scegliere Crea ruolo.
Se stai aggiungendo la politica a un ruolo esistente:
1. Seleziona il nome del ruolo in Nome ruolo. La finestra principale cambia per mostrare le informazioni sul tuo ruolo.
2. Nella sezione Politiche di autorizzazione, scegli la freccia rivolta verso il basso accanto a Aggiungi autorizzazioni.
3. Tra le opzioni visualizzate, scegli Allega politiche.
4. Dall'elenco delle policy visualizzate, cerca e seleziona la policy che hai creato in Per aggiungere autorizzazioni alla tua policy IAM e seleziona la casella di controllo accanto al nome della tua policy. Se non hai creato una policy IAM personalizzata, cerca e seleziona le caselle di controllo accanto a quelle AWS fornite AmazonSageMakerFullAccesse alle AmazonS3FullAccesspolicy. Potresti prendere in considerazione il livello di autorizzazioni da assegnare al tuo ruolo IAM. Le istruzioni per la policy IAM personalizzata sono meno permissive, mentre quest'ultima è più permissiva. Per ulteriori informazioni sulla policy, consulta. AmazonSageMakerFullAccess AmazonSageMakerFullAccess
5. Scegli Aggiungi autorizzazioni. Un banner nella parte superiore della pagina dovrebbe indicare che Policy è stata correttamente associata al ruolo. una volta completato.

Per aggiungere una politica di fiducia al tuo ruolo IAM

La seguente politica di fiducia consente agli amministratori di consentire all' SageMaker IA di assumere il ruolo. Devi aggiungere la policy al tuo ruolo IAM. Utilizza i seguenti passaggi per farlo.

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciIAM.
In Servizi, seleziona Identity and Access Management (IAM).
Nel riquadro di navigazione scegliere Roles (Ruoli).
Seleziona il nome del ruolo in Nome ruolo. La finestra principale cambia per mostrare le informazioni sul tuo ruolo.
Scegli la scheda Relazione di fiducia.
Seleziona Modifica policy di attendibilità.

Assicurati che la seguente politica sia visualizzata in Modifica politica di fiducia. Puoi anche copiare e incollare quanto segue nell'editor.


{
"Version": "2012-10-17",
"Statement": [
    {
        "Sid": "",
        "Effect": "Allow",
        "Principal": {
            "Service": [
                "sagemaker.amazonaws.com"
            ]
        },
        "Action": "sts:AssumeRole"
    }
]
}

Scegli Aggiorna policy. Un banner nella parte superiore della pagina dovrebbe indicare che la politica di fiducia è stata aggiornata. una volta completata.

Configurazione dell'ambiente

Prerequisiti

Configurazione delle autorizzazioni

La sezione seguente mostra come creare un bucket Amazon S3 e come specificare le autorizzazioni CORS (Cross-Origin Resource Sharing) corrette.

Per creare un bucket Amazon S3 e specificare le autorizzazioni CORS

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nel riquadro di navigazione, S3 accedi alla barra di ricerca nella parte superiore della pagina.
Scegli S3 in Servizi.
Scegli Bucket dal pannello di navigazione.
Nella sezione General Purpose Bucket, sotto Nome, scegli il nome del bucket S3 che desideri utilizzare per memorizzare l'input e l'output del modello nella console. Se non disponi di un bucket S3, procedi come segue.
1. Seleziona Crea bucket per aprire una nuova pagina Crea bucket.
2. Nella sezione Configurazione generale, in AWS Regione, seleziona la AWS regione in cui si trova il modello di base.
3. Assegna un nome al bucket S3 nella casella di immissione sotto Nome del bucket.
4. Accetta tutte le scelte predefinite.
5. Seleziona Crea bucket.
6. Nella sezione General Purpose bucket, sotto Nome, seleziona il nome del bucket S3 che hai creato.
Scegli la scheda Autorizzazioni.
Scorri fino alla sezione Cross-origin resource sharing (CORS) nella parte inferiore della finestra. Scegli Modifica.

Di seguito è riportata la policy CORS minima richiesta da aggiungere al bucket Amazon S3. Copia e incolla quanto segue nella casella di input.


[
{
    "AllowedHeaders": ["*"],
    "AllowedMethods": [
        "GET",
        "HEAD",
        "PUT"
    ],
    "AllowedOrigins": [
        "*"
    ],
    "ExposeHeaders": [
      "Access-Control-Allow-Origin"
    ],
    "MaxAgeSeconds": 3000
}
]

Scegli Save changes (Salva modifiche).

Per aggiungere autorizzazioni alla tua policy IAM

Potresti prendere in considerazione il livello di autorizzazioni da assegnare al tuo ruolo IAM.

Puoi creare una policy IAM personalizzata che consenta le autorizzazioni minime richieste su misura per questo servizio.
Puoi collegare le AmazonS3FullAccesspolitiche esistenti AmazonSageMakerFullAccesse al tuo ruolo IAM esistente, che è più permissivo. Per ulteriori informazioni sulla AmazonSageMakerFullAccess policy, consulta. AmazonSageMakerFullAccess

Le seguenti istruzioni creano una policy IAM personalizzata su misura per questo servizio con autorizzazioni minime.

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciIAM.
In Servizi, seleziona Identity and Access Management (IAM).
Scegli Politiche dal riquadro di navigazione.
Scegli Create Policy (Crea policy). Quando si apre l'editor delle politiche, scegli JSON.

Assicurati che le seguenti autorizzazioni siano visualizzate nell'editor delle politiche. Puoi anche copiare e incollare quanto segue nell'editor delle politiche.


{
"Version": "2012-10-17",
"Statement":
    [{
        "Effect": "Allow",
        "Action": [
            "s3:GetObject",
            "s3:PutObject",
            "s3:ListBucket"
        ],
        "Resource": [
            "arn:aws:s3:::{input_bucket}/*",
            "arn:aws:s3:::{input_bucket}",
            "arn:aws:s3:::{output_bucket}/*",
            "arn:aws:s3:::{output_bucket}",
            "arn:aws:s3:::jumpstart-cache-prod-{region}/*",
            "arn:aws:s3:::jumpstart-cache-prod-{region}"
        ]
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:CreateEndpoint",
            "sagemaker:DeleteEndpoint",
            "sagemaker:CreateEndpointConfig",
            "sagemaker:DeleteEndpointConfig"
        ],
        "Resource": [
            "arn:aws:sagemaker:{region}:{account-id}:endpoint/sm-margaret-*",
            "arn:aws:sagemaker:{region}:{account-id}:endpoint-config/sm-margaret-*"
        ],
        "Condition": {
            "ForAnyValue:StringEquals": {
                "aws:TagKeys": "sagemaker-sdk:jumpstart-model-id"
            }
        }
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:DescribeProcessingJob",
            "sagemaker:DescribeEndpoint",
            "sagemaker:InvokeEndpoint"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:DescribeInferenceComponent",
            "sagemaker:AddTags",
            "sagemaker:CreateModel",
            "sagemaker:DeleteModel"
        ],
        "Resource": "arn:aws:sagemaker:{region}:{account-id}:model/*",
        "Condition": {
            "ForAnyValue:StringEquals": {
                "aws:TagKeys": "sagemaker-sdk:jumpstart-model-id"
            }
        }
    },
    {
        "Effect": "Allow",
        "Action": [
            "sagemaker:DescribeFlowDefinition",
            "sagemaker:StartHumanLoop",
            "sagemaker:DescribeHumanLoop"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "logs:CreateLogStream",
            "logs:PutLogEvents",
            "logs:CreateLogGroup",
            "logs:DescribeLogStreams"
        ],
        "Resource": "arn:aws:logs:{region}:{account-id}:log-group:/aws/sagemaker/ProcessingJobs:*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "cloudwatch:PutMetricData"
        ],
        "Resource":"*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "ecr:GetAuthorizationToken",
            "ecr:BatchCheckLayerAvailability",
            "ecr:GetDownloadUrlForLayer",
            "ecr:BatchGetImage"
        ],
        "Resource": "*"
    },
    {
        "Effect": "Allow",
        "Action": [
            "kms:DescribeKey",
            "kms:GetPublicKey",
            "kms:Decrypt",
            "kms:Encrypt"
        ],
        "Resource": [
            "arn:aws:kms:{region}:{account-id}:key/{kms-key-id}"
        ]
    },
    {
        "Effect": "Allow",
        "Action": [
            "iam:PassRole"
        ],
        "Resource": "arn:aws:iam::{account-id}:role/{this-role-created-by-customer}",
        "Condition": {
            "StringEquals": {
                "aws:PrincipalAccount": [
                    "account-id"
                ]
            }
        }
    }]
}

Scegli Next (Successivo).
Inserisci il nome di una politica nella sezione Dettagli della politica, sotto Nome della politica. Facoltativamente, è possibile inserire una descrizione. Cercherai il nome di questo criterio quando lo assegni a un ruolo.
Scegli Create Policy (Crea policy).

Per aggiungere autorizzazioni al tuo ruolo IAM

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciIAM.
In Servizi, seleziona Identity and Access Management (IAM).
Nel riquadro di navigazione scegliere Roles (Ruoli).
Se stai creando un nuovo ruolo:
1. Scegliere Crea ruolo.
2. Nel passaggio Seleziona entità attendibile, in Tipo di entità affidabile scegli Politica di attendibilità personalizzata.
3. Nell'editor di criteri di fiducia personalizzati, accanto a Aggiungi principale scegli Aggiungi.
4. Nella casella pop-up Aggiungi principale, in Tipo principale, seleziona AWS i servizi dall'elenco a discesa delle opzioni.
5. In ARN sostituire {ServiceName} con. sagemaker
6. Scegli Aggiungi principale.
7. Scegli Next (Successivo).
8. (Facoltativo) In Politiche di autorizzazione seleziona le politiche che desideri aggiungere al tuo ruolo.
9. (Facoltativo) In Imposta i limiti delle autorizzazioni: facoltativo, scegli l'impostazione dei limiti delle autorizzazioni.
10. Scegli Next (Successivo).
11. Nella fase Nome, revisione e creazione, in Dettagli del ruolo inserisci il nome e la descrizione del ruolo.
12. (Facoltativo) In Aggiungi tag - opzionale, puoi aggiungere tag scegliendo Aggiungi nuovo tag e inserisci una chiave e un valore, coppia opzionale.
13. Verificare le impostazioni.
14. Scegliere Crea ruolo.
Se stai aggiungendo la politica a un ruolo esistente:
1. Seleziona il nome del ruolo in Nome ruolo. La finestra principale cambia per mostrare le informazioni sul tuo ruolo.
2. Nella sezione Politiche di autorizzazione, scegli la freccia rivolta verso il basso accanto a Aggiungi autorizzazioni.
3. Tra le opzioni visualizzate, scegli Allega politiche.
4. Dall'elenco delle policy visualizzate, cerca e seleziona la policy che hai creato in Per aggiungere autorizzazioni alla tua policy IAM e seleziona la casella di controllo accanto al nome della tua policy. Se non hai creato una policy IAM personalizzata, cerca e seleziona le caselle di controllo accanto a quelle AWS fornite AmazonSageMakerFullAccesse alle AmazonS3FullAccesspolicy. Potresti prendere in considerazione il livello di autorizzazioni da assegnare al tuo ruolo IAM. Le istruzioni per la policy IAM personalizzata sono meno permissive, mentre quest'ultima è più permissiva. Per ulteriori informazioni sulla policy, consulta. AmazonSageMakerFullAccess AmazonSageMakerFullAccess
5. Scegli Aggiungi autorizzazioni. Un banner nella parte superiore della pagina dovrebbe indicare che Policy è stata correttamente associata al ruolo. una volta completato.

Per aggiungere una politica di fiducia al tuo ruolo IAM

La seguente politica di fiducia consente agli amministratori di consentire all' SageMaker IA di assumere il ruolo. Devi aggiungere la policy al tuo ruolo IAM. Utilizza i seguenti passaggi per farlo.

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciIAM.
In Servizi, seleziona Identity and Access Management (IAM).
Nel riquadro di navigazione scegliere Roles (Ruoli).
Seleziona il nome del ruolo in Nome ruolo. La finestra principale cambia per mostrare le informazioni sul tuo ruolo.
Scegli la scheda Relazione di fiducia.
Seleziona Modifica policy di attendibilità.

Assicurati che la seguente politica sia visualizzata in Modifica politica di fiducia. Puoi anche copiare e incollare quanto segue nell'editor.


{
"Version": "2012-10-17",
"Statement": [
    {
        "Sid": "",
        "Effect": "Allow",
        "Principal": {
            "Service": [
                "sagemaker.amazonaws.com"
            ]
        },
        "Action": "sts:AssumeRole"
    }
]
}

Scegli Aggiorna policy. Un banner nella parte superiore della pagina dovrebbe indicare che la politica di fiducia è stata aggiornata. una volta completata.

Puoi creare un lavoro di valutazione umana utilizzando un modello basato su testo disponibile in JumpStart oppure puoi utilizzare un JumpStart modello che hai precedentemente distribuito su un endpoint.

Per avviare JumpStart

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciSageMaker AI.
In Servizi, seleziona Amazon SageMaker AI.
Scegli Studio dal pannello di navigazione.
Scegli il tuo dominio dalla sezione Guida introduttiva, dopo aver espanso la freccia rivolta verso il basso sotto Seleziona dominio.
Scegli il tuo profilo utente dalla sezione Guida introduttiva dopo aver espanso la freccia rivolta verso il basso sotto Seleziona profilo utente.
Scegli Open Studio per aprire la pagina di destinazione di Studio.
Scegli Jobs dal pannello di navigazione.

Per impostare un lavoro di valutazione

Nella home page di valutazione del modello, scegli Valuta un modello
Specificate i dettagli del lavoro.
1. Immettete il nome di valutazione del modello di valutazione. Questo nome consente di identificare il lavoro di valutazione del modello dopo l'invio.
2. Immettete una descrizione per aggiungere altro contesto al nome.
3. Scegli Next (Successivo).
Imposta la valutazione
1. In Scegli un tipo di valutazione, seleziona il pulsante di opzione accanto a Umano.
2. In Scegli il modello o i modelli che desideri valutare, scegli Aggiungi modello alla valutazione. Puoi valutare fino a due modelli per ogni valutazione.
  1. Per utilizzare un modello pre-addestrato, scegli JumpStart Modello di JumpStart base pre-addestrato. Se desideri utilizzare un JumpStart modello che hai precedentemente distribuito su un endpoint, scegli Endpoints with Foundation models. JumpStart
  2. Se il modello richiede un accordo legale, seleziona la casella di controllo per confermare che sei d'accordo.
  3. Se desideri aggiungere un altro modello, ripeti il passaggio precedente.
3. Per modificare il comportamento del modello durante l'inferenza, scegliete, Imposta parametri.
  
  Set parameters contiene un elenco di parametri di inferenza che influiscono sul grado di casualità nell'output del modello, sulla lunghezza dell'output del modello e sulle parole che il modello sceglierà successivamente.
4. Quindi, seleziona un tipo di attività. È possibile selezionare una delle seguenti opzioni:
  - Riepilogo del testo
  - Risposta alle domande (domande e risposte)
  - Classificazione del testo
  - Generazione aperta
  - Personalizza
5. Nella sezione Metriche di valutazione, scegli una dimensione di valutazione e inserisci un contesto aggiuntivo sulla dimensione nella casella di testo sotto Descrizione. Puoi scegliere tra le seguenti dimensioni:
  - Fluidità: misura la qualità linguistica di un testo generato.
  - Coerenza: misura l'organizzazione e la struttura di un testo generato.
  - Tossicità: misura la nocività di un testo generato.
  - Precisione: indica la precisione di un testo generato.
  - Una dimensione di valutazione personalizzata di cui puoi definire il nome e la descrizione per il tuo team di lavoro.
    
    Per aggiungere una dimensione di valutazione personalizzata, procedi come segue:
    Scegli Aggiungi una dimensione di valutazione.
    
    Nella casella di testo contenente Fornisci la dimensione di valutazione, inserisci il nome della dimensione personalizzata.
    
    Nella casella di testo contenente Fornisci una descrizione per questa dimensione di valutazione, inserisci una descrizione in modo che il team di lavoro comprenda come valutare la dimensione personalizzata.
  Sotto ciascuna di queste metriche ci sono metriche di reporting che puoi scegliere dalla freccia rivolta verso il basso Scegli un tipo di metrica. Se hai due modelli da valutare, puoi scegliere metriche di reporting comparative o individuali. Se hai un modello da valutare, puoi scegliere solo metriche di reporting individuali. Puoi scegliere i seguenti tipi di metriche di reporting per ciascuna delle metriche precedenti.
  - Scala Likert (comparativa) - confronto: un valutatore umano indicherà la propria preferenza tra due risposte su una scala Likert a 5 punti in base alle istruzioni fornite. I risultati del report finale verranno visualizzati sotto forma di istogramma delle valutazioni di intensità delle preferenze fornite dai valutatori sull'intero set di dati. Definite i punti importanti della scala a 5 punti nelle vostre istruzioni in modo che i valutatori sappiano come valutare le risposte in base alle vostre aspettative. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ComparisonLikertScale come coppia chiave-valore. "evaluationResults":"ComparisonLikertScale"
  - Pulsanti di scelta (comparativi): consentono a un valutatore umano di indicare la propria risposta preferita rispetto a un'altra risposta. I valutatori indicano la loro preferenza tra due risposte in base alle istruzioni fornite dall'utente utilizzando i pulsanti di opzione. I risultati del report finale verranno visualizzati come percentuale delle risposte preferite dai lavoratori per ciascun modello. Spiegate chiaramente il vostro metodo di valutazione nelle istruzioni. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ComparisonChoice come coppia chiave-valore. "evaluationResults":"ComparisonChoice"
  - Classificazione ordinale (comparativa): consente a un valutatore umano di classificare le proprie risposte preferite a un prompt in ordine, a partire da, in base alle 1 istruzioni fornite. I risultati del report finale verranno visualizzati sotto forma di istogramma delle classificazioni fornite dai valutatori sull'intero set di dati. Definisci il 1 significato di un rango nelle tue istruzioni. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ComparisonRank come coppia chiave-valore. "evaluationResults":"ComparisonRank"
  - (Individuale) Pollice su/giù: consente a un valutatore umano di valutare ogni risposta di un modello come accettabile o inaccettabile in base alle tue istruzioni. I risultati del report finale saranno mostrati come percentuale del numero totale di valutazioni da parte dei valutatori che hanno ricevuto un pollice in su per ciascun modello. Puoi utilizzare questo metodo di valutazione per valutare uno o più modelli. Se lo utilizzate in una valutazione che contiene due modelli, al team di lavoro verrà mostrato un pollice rivolto verso l'alto o verso il basso per ogni risposta del modello e il rapporto finale mostrerà i risultati aggregati per ogni modello individualmente. Definisci cosa è accettabile come valutazione con il pollice su o il pollice verso il basso nelle tue istruzioni. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ThumbsUpDown come coppia chiave-valore. "evaluationResults":"ThumbsUpDown"
  - Scala Likert (individuale) - individuale: consente a un valutatore umano di indicare in che misura approva la risposta del modello in base alle tue istruzioni su una scala Likert a 5 punti. I risultati del rapporto finale verranno visualizzati sotto forma di istogramma delle valutazioni a 5 punti fornite dai valutatori sull'intero set di dati. È possibile utilizzare questa scala per una valutazione contenente uno o più modelli. Se selezionate questo metodo di valutazione in una valutazione che contiene più di un modello, al team di lavoro verrà presentata una scala Likert a 5 punti per ogni risposta del modello e il rapporto finale mostrerà i risultati aggregati per ogni modello individualmente. Definite i punti importanti sulla scala a 5 punti nelle vostre istruzioni in modo che i vostri valutatori sappiano come valutare le risposte in base alle vostre aspettative. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata IndividualLikertScale come coppia chiave-valore. "evaluationResults":"IndividualLikertScale"
6. Scegli un set di dati Prompt. Questo set di dati è obbligatorio e verrà utilizzato dal team di lavoro umano per valutare le risposte del modello. Fornisci l'URI S3 a un bucket Amazon S3 che contiene il tuo set di dati prompt nella casella di testo sotto S3 URI per il file del set di dati di input. Il set di dati deve essere in jsonlines formato e contenere le seguenti chiavi per identificare quali parti del set di dati verranno utilizzate dall'interfaccia utente per valutare il modello:
  - prompt— La richiesta a cui desideri che il modello generi una risposta.
  - (Facoltativo) category — - Le etichette delle categorie per il tuo prompt. La category chiave viene utilizzata per classificare i prompt in modo da poter filtrare i risultati della valutazione in un secondo momento per categoria per una comprensione più approfondita dei risultati della valutazione. Non partecipa alla valutazione stessa e gli operatori non lo vedono nell'interfaccia utente di valutazione.
  - (Facoltativo)referenceResponse: la risposta di riferimento per i valutatori umani. La risposta di riferimento non viene valutata dai dipendenti, ma può essere utilizzata per capire quali risposte sono accettabili o inaccettabili, in base alle istruzioni fornite.
  - (Facoltativo)responses: utilizzato per specificare inferenze da un modello esterno all' SageMaker IA o all'esterno di. AWS
    
    Questo oggetto richiede due coppie chiave-valore aggiuntive, "modelIdentifier ovvero una stringa che identifica il modello e l'"text"inferenza del modello.
    
    Se si specifica una "responses" chiave in qualsiasi input del set di dati del prompt personalizzato, questa deve essere specificata in tutti gli input.
  - Il seguente esempio di json codice mostra le coppie chiave-valore accettate in un set di dati prompt personalizzato. La casella di controllo Bring your own inference deve essere selezionata se viene fornita una chiave di risposta. Se selezionata, la responses chiave deve essere sempre specificata in ogni prompt. L'esempio seguente potrebbe essere utilizzato in uno scenario di domande e risposte.
```
{
    "prompt": {
        "text": "Aurillac is the capital of"
    },
    "category": "Capitals",
    "referenceResponse": {
        "text": "Cantal"
    },
    "responses": [
        // All responses must come from a single model. If specified it must be present in all JSON objects. modelIdentifier and text are then also required.
        {
            "modelIdentifier": "meta-textgeneration-llama-codellama-7b",
            "text": "The capital of Aurillac is Cantal."
        }
    ]
}
```
7. Inserisci la posizione del bucket S3 in cui desideri salvare i risultati della valutazione in uscita nella casella di testo sotto Scegli una posizione S3 per salvare i risultati della valutazione. Il file di output scritto in questa posizione S3 sarà in JSON formato e terminerà con l'estensione,. .json
8. Nota
  Se desideri includere i dati di inferenza personalizzati nel processo di valutazione del modello, puoi utilizzare un solo modello.
  
  (Facoltativo) Scegliete la casella di controllo sotto Porta la vostra inferenza per indicare che il set di dati del prompt contiene la chiave. responses Se specificate la responses chiave come parte di un prompt, deve essere presente in tutti i prompt.
9. Configura il processore nella sezione Configurazione del processore utilizzando i seguenti parametri:
  - Utilizza Instance count per specificare il numero di istanze di calcolo da utilizzare per eseguire il modello. Se utilizzi più di 1 un'istanza, il tuo modello verrà eseguito in istanze parallele.
  - Usa il tipo di istanza per scegliere il tipo di istanza di calcolo che desideri utilizzare per eseguire il tuo modello. AWS dispone di istanze di calcolo generali e istanze ottimizzate per l'elaborazione e la memoria. Per ulteriori informazioni sui tipi di istanze, consulta. Tipi di istanze disponibili per l'uso con Studio Classic
  - Se desideri che l' SageMaker IA utilizzi la tua chiave di crittografia AWS Key Management Service (AWS KMS) anziché la chiave di servizio AWS gestito predefinita, seleziona Attiva nella chiave Volume KMS e inserisci la chiave. AWS KMS SageMaker L'IA utilizzerà la tua AWS KMS chiave per crittografare i dati sul volume di archiviazione. Per ulteriori informazioni sulle chiavi, consulta AWS Key Management Service.
  - Se desideri che l' SageMaker IA utilizzi la tua chiave di crittografia AWS Key Management Service (AWS KMS) anziché la chiave di servizio AWS gestito predefinita, seleziona Attiva nella chiave Output KMS e inserisci la chiave. AWS KMS SageMaker L'IA utilizzerà la tua AWS KMS chiave per crittografare l'output del processo di elaborazione.
  - Utilizza un ruolo IAM per specificare l'accesso e le autorizzazioni per il processore predefinito. Inserisci il ruolo IAM che hai impostato nella sezione Configura il tuo ruolo IAM in questa sezione Esegui una valutazione umana.
10. Dopo aver specificato il modello e i criteri, seleziona Avanti.

Il tuo team di lavoro è composto dalle persone che stanno valutando il tuo modello. Una volta creato, il team di lavoro persiste all'infinito e non è possibile modificarne gli attributi. Di seguito viene illustrato come iniziare a lavorare con il team di lavoro.

Configura il tuo team di lavoro

Scegli un team esistente o crea un nuovo team nella casella di testo di input Seleziona team.
Specificate un nome della vostra organizzazione in Nome dell'organizzazione. Questo campo viene visualizzato solo quando crei il primo team di lavoro nell'account.
Specificare un'email di contatto. I tuoi dipendenti utilizzeranno questa e-mail per comunicare con te in merito all'attività di valutazione che fornirai loro. Questo campo viene visualizzato solo quando crei il primo team di lavoro nell'account.
Specificare il nome del team. Non è possibile modificare questo nome in un secondo momento.
Specificate un elenco di indirizzi e-mail per ciascuno dei vostri collaboratori umani che valuteranno il vostro Large Language Model (LLM). Quando specifichi gli indirizzi e-mail per il tuo team, questi ricevono una notifica di un nuovo lavoro solo quando vengono aggiunti di recente a un team di lavoro. Se utilizzi lo stesso team per un lavoro successivo, devi notificarlo manualmente.
Quindi, specifica il numero di lavoratori per prompt

Fornisci istruzioni per il tuo team di lavoro

Fornisci istruzioni dettagliate alla tua forza lavoro umana in modo che possa valutare il tuo modello in base alle tue metriche e ai tuoi standard. Un modello nella finestra principale mostra esempi di istruzioni che puoi fornire. Per ulteriori informazioni su come fornire istruzioni, vedi Creazione di buone istruzioni per i lavoratori.
Per ridurre al minimo le distorsioni nella valutazione umana, seleziona la casella di controllo accanto a Randomizza le posizioni di risposta.
Seleziona Avanti.

Puoi rivedere il riepilogo delle selezioni effettuate per il tuo lavoro umano. Se devi cambiare lavoro, scegli Precedente per tornare a una selezione precedente.

Invia la tua richiesta di lavoro di valutazione e visualizza lo stato di avanzamento del lavoro

Per inviare la tua richiesta di lavoro di valutazione, scegli Crea risorsa.
Per visualizzare lo stato di tutti i tuoi lavori, scegli Lavori nel pannello di navigazione. Quindi, scegli Valutazione del modello. Lo stato di valutazione viene visualizzato come Completato, Non riuscito o In corso.

Viene inoltre visualizzato quanto segue:
- Esempi di notebook per eseguire una valutazione del modello in AI SageMaker e Amazon Bedrock.
- Collegamenti a informazioni aggiuntive tra cui documentazione, video, notizie e blog sul processo di valutazione del modello.
- È disponibile anche l'URL del portale per i lavoratori privati.
Seleziona la valutazione del modello in Nome per visualizzare un riepilogo della valutazione.
- Il riepilogo fornisce informazioni sullo stato del lavoro, sul tipo di attività di valutazione eseguita su quale modello e quando è stata eseguita. Dopo il riepilogo, i punteggi della valutazione umana vengono ordinati e riepilogati per metrica.

Visualizza la pagella del tuo lavoro di valutazione modello che utilizza lavoratori umani

Per visualizzare il rapporto relativo ai tuoi lavori, scegli Lavori nel riquadro di navigazione.
Quindi, scegli Valutazione del modello. Nella home page delle valutazioni dei modelli, utilizza la tabella per trovare il lavoro di valutazione del modello. Una volta che lo stato del lavoro è passato a Completato, puoi visualizzare la tua pagella.
Scegli il nome del lavoro di valutazione del modello nella sua pagella.

Creazione di un processo di valutazione del modello che utilizza lavoratori umani

Per avviare JumpStart

Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.
Nella barra di ricerca nella parte superiore della pagina, inserisciSageMaker AI.
In Servizi, seleziona Amazon SageMaker AI.
Scegli Studio dal pannello di navigazione.
Scegli il tuo dominio dalla sezione Guida introduttiva, dopo aver espanso la freccia rivolta verso il basso sotto Seleziona dominio.
Scegli il tuo profilo utente dalla sezione Guida introduttiva dopo aver espanso la freccia rivolta verso il basso sotto Seleziona profilo utente.
Scegli Open Studio per aprire la pagina di destinazione di Studio.
Scegli Jobs dal pannello di navigazione.

Per impostare un lavoro di valutazione

Nella home page di valutazione del modello, scegli Valuta un modello
Specificate i dettagli del lavoro.
1. Immettete il nome di valutazione del modello di valutazione. Questo nome consente di identificare il lavoro di valutazione del modello dopo l'invio.
2. Immettete una descrizione per aggiungere altro contesto al nome.
3. Scegli Next (Successivo).
Imposta la valutazione
1. In Scegli un tipo di valutazione, seleziona il pulsante di opzione accanto a Umano.
2. In Scegli il modello o i modelli che desideri valutare, scegli Aggiungi modello alla valutazione. Puoi valutare fino a due modelli per ogni valutazione.
  1. Per utilizzare un modello pre-addestrato, scegli JumpStart Modello di JumpStart base pre-addestrato. Se desideri utilizzare un JumpStart modello che hai precedentemente distribuito su un endpoint, scegli Endpoints with Foundation models. JumpStart
  2. Se il modello richiede un accordo legale, seleziona la casella di controllo per confermare che sei d'accordo.
  3. Se desideri aggiungere un altro modello, ripeti il passaggio precedente.
3. Per modificare il comportamento del modello durante l'inferenza, scegliete, Imposta parametri.
  
  Set parameters contiene un elenco di parametri di inferenza che influiscono sul grado di casualità nell'output del modello, sulla lunghezza dell'output del modello e sulle parole che il modello sceglierà successivamente.
4. Quindi, seleziona un tipo di attività. È possibile selezionare una delle seguenti opzioni:
  - Riepilogo del testo
  - Risposta alle domande (domande e risposte)
  - Classificazione del testo
  - Generazione aperta
  - Personalizza
5. Nella sezione Metriche di valutazione, scegli una dimensione di valutazione e inserisci un contesto aggiuntivo sulla dimensione nella casella di testo sotto Descrizione. Puoi scegliere tra le seguenti dimensioni:
  - Fluidità: misura la qualità linguistica di un testo generato.
  - Coerenza: misura l'organizzazione e la struttura di un testo generato.
  - Tossicità: misura la nocività di un testo generato.
  - Precisione: indica la precisione di un testo generato.
  - Una dimensione di valutazione personalizzata di cui puoi definire il nome e la descrizione per il tuo team di lavoro.
    
    Per aggiungere una dimensione di valutazione personalizzata, procedi come segue:
    Scegli Aggiungi una dimensione di valutazione.
    
    Nella casella di testo contenente Fornisci la dimensione di valutazione, inserisci il nome della dimensione personalizzata.
    
    Nella casella di testo contenente Fornisci una descrizione per questa dimensione di valutazione, inserisci una descrizione in modo che il team di lavoro comprenda come valutare la dimensione personalizzata.
  Sotto ciascuna di queste metriche ci sono metriche di reporting che puoi scegliere dalla freccia rivolta verso il basso Scegli un tipo di metrica. Se hai due modelli da valutare, puoi scegliere metriche di reporting comparative o individuali. Se hai un modello da valutare, puoi scegliere solo metriche di reporting individuali. Puoi scegliere i seguenti tipi di metriche di reporting per ciascuna delle metriche precedenti.
  - Scala Likert (comparativa) - confronto: un valutatore umano indicherà la propria preferenza tra due risposte su una scala Likert a 5 punti in base alle istruzioni fornite. I risultati del report finale verranno visualizzati sotto forma di istogramma delle valutazioni di intensità delle preferenze fornite dai valutatori sull'intero set di dati. Definite i punti importanti della scala a 5 punti nelle vostre istruzioni in modo che i valutatori sappiano come valutare le risposte in base alle vostre aspettative. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ComparisonLikertScale come coppia chiave-valore. "evaluationResults":"ComparisonLikertScale"
  - Pulsanti di scelta (comparativi): consentono a un valutatore umano di indicare la propria risposta preferita rispetto a un'altra risposta. I valutatori indicano la loro preferenza tra due risposte in base alle istruzioni fornite dall'utente utilizzando i pulsanti di opzione. I risultati del report finale verranno visualizzati come percentuale delle risposte preferite dai lavoratori per ciascun modello. Spiegate chiaramente il vostro metodo di valutazione nelle istruzioni. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ComparisonChoice come coppia chiave-valore. "evaluationResults":"ComparisonChoice"
  - Classificazione ordinale (comparativa): consente a un valutatore umano di classificare le proprie risposte preferite a un prompt in ordine, a partire da, in base alle 1 istruzioni fornite. I risultati del report finale verranno visualizzati sotto forma di istogramma delle classificazioni fornite dai valutatori sull'intero set di dati. Definisci il 1 significato di un rango nelle tue istruzioni. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ComparisonRank come coppia chiave-valore. "evaluationResults":"ComparisonRank"
  - (Individuale) Pollice su/giù: consente a un valutatore umano di valutare ogni risposta di un modello come accettabile o inaccettabile in base alle tue istruzioni. I risultati del report finale saranno mostrati come percentuale del numero totale di valutazioni da parte dei valutatori che hanno ricevuto un pollice in su per ciascun modello. Puoi utilizzare questo metodo di valutazione per valutare uno o più modelli. Se lo utilizzate in una valutazione che contiene due modelli, al team di lavoro verrà mostrato un pollice rivolto verso l'alto o verso il basso per ogni risposta del modello e il rapporto finale mostrerà i risultati aggregati per ogni modello individualmente. Definisci cosa è accettabile come valutazione con il pollice su o il pollice verso il basso nelle tue istruzioni. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata ThumbsUpDown come coppia chiave-valore. "evaluationResults":"ThumbsUpDown"
  - Scala Likert (individuale) - individuale: consente a un valutatore umano di indicare in che misura approva la risposta del modello in base alle tue istruzioni su una scala Likert a 5 punti. I risultati del rapporto finale verranno visualizzati sotto forma di istogramma delle valutazioni a 5 punti fornite dai valutatori sull'intero set di dati. È possibile utilizzare questa scala per una valutazione contenente uno o più modelli. Se selezionate questo metodo di valutazione in una valutazione che contiene più di un modello, al team di lavoro verrà presentata una scala Likert a 5 punti per ogni risposta del modello e il rapporto finale mostrerà i risultati aggregati per ogni modello individualmente. Definite i punti importanti sulla scala a 5 punti nelle vostre istruzioni in modo che i vostri valutatori sappiano come valutare le risposte in base alle vostre aspettative. Nell'output JSON salvato in Amazon S3 questa scelta è rappresentata IndividualLikertScale come coppia chiave-valore. "evaluationResults":"IndividualLikertScale"
6. Scegli un set di dati Prompt. Questo set di dati è obbligatorio e verrà utilizzato dal team di lavoro umano per valutare le risposte del modello. Fornisci l'URI S3 a un bucket Amazon S3 che contiene il tuo set di dati prompt nella casella di testo sotto S3 URI per il file del set di dati di input. Il set di dati deve essere in jsonlines formato e contenere le seguenti chiavi per identificare quali parti del set di dati verranno utilizzate dall'interfaccia utente per valutare il modello:
  - prompt— La richiesta a cui desideri che il modello generi una risposta.
  - (Facoltativo) category — - Le etichette delle categorie per il tuo prompt. La category chiave viene utilizzata per classificare i prompt in modo da poter filtrare i risultati della valutazione in un secondo momento per categoria per una comprensione più approfondita dei risultati della valutazione. Non partecipa alla valutazione stessa e gli operatori non lo vedono nell'interfaccia utente di valutazione.
  - (Facoltativo)referenceResponse: la risposta di riferimento per i valutatori umani. La risposta di riferimento non viene valutata dai dipendenti, ma può essere utilizzata per capire quali risposte sono accettabili o inaccettabili, in base alle istruzioni fornite.
  - (Facoltativo)responses: utilizzato per specificare inferenze da un modello esterno all' SageMaker IA o all'esterno di. AWS
    
    Questo oggetto richiede due coppie chiave-valore aggiuntive, "modelIdentifier ovvero una stringa che identifica il modello e l'"text"inferenza del modello.
    
    Se si specifica una "responses" chiave in qualsiasi input del set di dati del prompt personalizzato, questa deve essere specificata in tutti gli input.
  - Il seguente esempio di json codice mostra le coppie chiave-valore accettate in un set di dati prompt personalizzato. La casella di controllo Bring your own inference deve essere selezionata se viene fornita una chiave di risposta. Se selezionata, la responses chiave deve essere sempre specificata in ogni prompt. L'esempio seguente potrebbe essere utilizzato in uno scenario di domande e risposte.
```
{
    "prompt": {
        "text": "Aurillac is the capital of"
    },
    "category": "Capitals",
    "referenceResponse": {
        "text": "Cantal"
    },
    "responses": [
        // All responses must come from a single model. If specified it must be present in all JSON objects. modelIdentifier and text are then also required.
        {
            "modelIdentifier": "meta-textgeneration-llama-codellama-7b",
            "text": "The capital of Aurillac is Cantal."
        }
    ]
}
```
7. Inserisci la posizione del bucket S3 in cui desideri salvare i risultati della valutazione in uscita nella casella di testo sotto Scegli una posizione S3 per salvare i risultati della valutazione. Il file di output scritto in questa posizione S3 sarà in JSON formato e terminerà con l'estensione,. .json
8. Nota
  Se desideri includere i dati di inferenza personalizzati nel processo di valutazione del modello, puoi utilizzare un solo modello.
  
  (Facoltativo) Scegliete la casella di controllo sotto Porta la vostra inferenza per indicare che il set di dati del prompt contiene la chiave. responses Se specificate la responses chiave come parte di un prompt, deve essere presente in tutti i prompt.
9. Configura il processore nella sezione Configurazione del processore utilizzando i seguenti parametri:
  - Utilizza Instance count per specificare il numero di istanze di calcolo da utilizzare per eseguire il modello. Se utilizzi più di 1 un'istanza, il tuo modello verrà eseguito in istanze parallele.
  - Usa il tipo di istanza per scegliere il tipo di istanza di calcolo che desideri utilizzare per eseguire il tuo modello. AWS dispone di istanze di calcolo generali e istanze ottimizzate per l'elaborazione e la memoria. Per ulteriori informazioni sui tipi di istanze, consulta. Tipi di istanze disponibili per l'uso con Studio Classic
  - Se desideri che l' SageMaker IA utilizzi la tua chiave di crittografia AWS Key Management Service (AWS KMS) anziché la chiave di servizio AWS gestito predefinita, seleziona Attiva nella chiave Volume KMS e inserisci la chiave. AWS KMS SageMaker L'IA utilizzerà la tua AWS KMS chiave per crittografare i dati sul volume di archiviazione. Per ulteriori informazioni sulle chiavi, consulta AWS Key Management Service.
  - Se desideri che l' SageMaker IA utilizzi la tua chiave di crittografia AWS Key Management Service (AWS KMS) anziché la chiave di servizio AWS gestito predefinita, seleziona Attiva nella chiave Output KMS e inserisci la chiave. AWS KMS SageMaker L'IA utilizzerà la tua AWS KMS chiave per crittografare l'output del processo di elaborazione.
  - Utilizza un ruolo IAM per specificare l'accesso e le autorizzazioni per il processore predefinito. Inserisci il ruolo IAM che hai impostato nella sezione Configura il tuo ruolo IAM in questa sezione Esegui una valutazione umana.
10. Dopo aver specificato il modello e i criteri, seleziona Avanti.

Configura il tuo team di lavoro

Scegli un team esistente o crea un nuovo team nella casella di testo di input Seleziona team.
Specificate un nome della vostra organizzazione in Nome dell'organizzazione. Questo campo viene visualizzato solo quando crei il primo team di lavoro nell'account.
Specificare un'email di contatto. I tuoi dipendenti utilizzeranno questa e-mail per comunicare con te in merito all'attività di valutazione che fornirai loro. Questo campo viene visualizzato solo quando crei il primo team di lavoro nell'account.
Specificare il nome del team. Non è possibile modificare questo nome in un secondo momento.
Specificate un elenco di indirizzi e-mail per ciascuno dei vostri collaboratori umani che valuteranno il vostro Large Language Model (LLM). Quando specifichi gli indirizzi e-mail per il tuo team, questi ricevono una notifica di un nuovo lavoro solo quando vengono aggiunti di recente a un team di lavoro. Se utilizzi lo stesso team per un lavoro successivo, devi notificarlo manualmente.
Quindi, specifica il numero di lavoratori per prompt

Fornisci istruzioni per il tuo team di lavoro

Fornisci istruzioni dettagliate alla tua forza lavoro umana in modo che possa valutare il tuo modello in base alle tue metriche e ai tuoi standard. Un modello nella finestra principale mostra esempi di istruzioni che puoi fornire. Per ulteriori informazioni su come fornire istruzioni, vedi Creazione di buone istruzioni per i lavoratori.
Per ridurre al minimo le distorsioni nella valutazione umana, seleziona la casella di controllo accanto a Randomizza le posizioni di risposta.
Seleziona Avanti.

Puoi rivedere il riepilogo delle selezioni effettuate per il tuo lavoro umano. Se devi cambiare lavoro, scegli Precedente per tornare a una selezione precedente.

Invia la tua richiesta di lavoro di valutazione e visualizza lo stato di avanzamento del lavoro

Per inviare la tua richiesta di lavoro di valutazione, scegli Crea risorsa.
Per visualizzare lo stato di tutti i tuoi lavori, scegli Lavori nel pannello di navigazione. Quindi, scegli Valutazione del modello. Lo stato di valutazione viene visualizzato come Completato, Non riuscito o In corso.

Viene inoltre visualizzato quanto segue:
- Esempi di notebook per eseguire una valutazione del modello in AI SageMaker e Amazon Bedrock.
- Collegamenti a informazioni aggiuntive tra cui documentazione, video, notizie e blog sul processo di valutazione del modello.
- È disponibile anche l'URL del portale per i lavoratori privati.
Seleziona la valutazione del modello in Nome per visualizzare un riepilogo della valutazione.
- Il riepilogo fornisce informazioni sullo stato del lavoro, sul tipo di attività di valutazione eseguita su quale modello e quando è stata eseguita. Dopo il riepilogo, i punteggi della valutazione umana vengono ordinati e riepilogati per metrica.

Visualizza la pagella del tuo lavoro di valutazione modello che utilizza lavoratori umani

Per visualizzare il rapporto relativo ai tuoi lavori, scegli Lavori nel riquadro di navigazione.
Quindi, scegli Valutazione del modello. Nella home page delle valutazioni dei modelli, utilizza la tabella per trovare il lavoro di valutazione del modello. Una volta che lo stato del lavoro è passato a Completato, puoi visualizzare la tua pagella.
Scegli il nome del lavoro di valutazione del modello nella sua pagella.

Quando crei un processo di valutazione del modello che utilizza lavoratori umani, hai la possibilità di portare i tuoi dati di inferenza e fare in modo che i tuoi lavoratori umani confrontino tali dati di inferenza con i dati prodotti da un altro JumpStart modello o da un JumpStart modello che hai distribuito su un endpoint.

Questo argomento descrive il formato richiesto per i dati di inferenza e una procedura semplificata per aggiungere tali dati al processo di valutazione del modello.

Scegliete un set di dati Prompt. Questo set di dati è obbligatorio e verrà utilizzato dal team di lavoro umano per valutare le risposte del modello. Fornisci l'URI S3 a un bucket Amazon S3 che contiene il set di dati del prompt nella casella di testo sotto Scegli una posizione S3 per salvare i risultati della valutazione. Il set di dati deve essere in formato. .jsonl Ogni record deve essere un oggetto JSON valido e contenere le seguenti chiavi obbligatorie:

prompt— Un oggetto JSON che contiene il testo da passare al modello.
(Facoltativo) category — - Le etichette delle categorie per il prompt. La category chiave viene utilizzata per classificare i prompt in modo da poter filtrare i risultati della valutazione in un secondo momento per categoria per una comprensione più approfondita dei risultati della valutazione. Non partecipa alla valutazione stessa e gli operatori non lo vedono nell'interfaccia utente di valutazione.
(Facoltativo)referenceResponse: un oggetto JSON che contiene la risposta di riferimento per i valutatori umani. La risposta di riferimento non viene valutata dai dipendenti, ma può essere utilizzata per capire quali risposte sono accettabili o inaccettabili, in base alle istruzioni fornite.
responses— Utilizzato per specificare inferenze individuali da un modello esterno all' SageMaker IA o al di fuori di. AWS

Questo oggetto richiede due coppie chiave-valore aggiuntive"modelIdentifier, che è una stringa che identifica il modello e "text" che è l'inferenza del modello.

Se si specifica una "responses" chiave in qualsiasi input del set di dati del prompt personalizzato, questa deve essere specificata in tutti gli input.

Il seguente esempio di json codice mostra le coppie chiave-valore accettate in un set di dati di prompt personalizzato che contiene i propri dati di inferenza.


{
    "prompt": {
        "text": "Who invented the airplane?"
    },
    "category": "Airplanes",
    "referenceResponse": {
        "text": "Orville and Wilbur Wright"
    },
    "responses":
        // All inference must come from a single model
        [{
            "modelIdentifier": "meta-textgeneration-llama-codellama-7b" ,
            "text": "The Wright brothers, Orville and Wilbur Wright are widely credited with inventing and manufacturing the world's first successful airplane."
        }]

}

Per iniziare, avvia Studio e nella sezione Valutazione del modello in Jobs nella navigazione principale.

Per aggiungere i tuoi dati di inferenza a un lavoro di valutazione di modelli umani.

Nella Fase 1: Specificate i dettagli del lavoro aggiungete il nome del lavoro di valutazione del modello e una descrizione facoltativa.
Nel Passaggio 2: Imposta la valutazione scegli Human.
Successivamente, in Scegli il modello o i modelli che desideri valutare, puoi scegliere il modello che desideri utilizzare. Puoi utilizzare un JumpStart modello già distribuito oppure puoi scegliere un modello base Jumpstart pre-addestrato.
Quindi, scegli un tipo di attività.
Successivamente, puoi aggiungere metriche di valutazione.
Successivamente, in Richiedi set di dati, seleziona la casella di controllo sotto Porta la tua inferenza per indicare che i prompt contengono chiavi di risposta.
Quindi continua a configurare il tuo lavoro di valutazione del modello.

Per ulteriori informazioni su come vengono salvate le risposte del processo di valutazione dei modelli che utilizza lavoratori umani, consulta Comprendi i risultati di un lavoro di valutazione umana

Utilizzo dei dati di inferenza personali in lavori di valutazione dei modelli che utilizzano lavoratori umani

Questo argomento descrive il formato richiesto per i dati di inferenza e una procedura semplificata per aggiungere tali dati al processo di valutazione del modello.

prompt— Un oggetto JSON che contiene il testo da passare al modello.
(Facoltativo) category — - Le etichette delle categorie per il prompt. La category chiave viene utilizzata per classificare i prompt in modo da poter filtrare i risultati della valutazione in un secondo momento per categoria per una comprensione più approfondita dei risultati della valutazione. Non partecipa alla valutazione stessa e gli operatori non lo vedono nell'interfaccia utente di valutazione.
(Facoltativo)referenceResponse: un oggetto JSON che contiene la risposta di riferimento per i valutatori umani. La risposta di riferimento non viene valutata dai dipendenti, ma può essere utilizzata per capire quali risposte sono accettabili o inaccettabili, in base alle istruzioni fornite.
responses— Utilizzato per specificare inferenze individuali da un modello esterno all' SageMaker IA o al di fuori di. AWS

Questo oggetto richiede due coppie chiave-valore aggiuntive"modelIdentifier, che è una stringa che identifica il modello e "text" che è l'inferenza del modello.

Se si specifica una "responses" chiave in qualsiasi input del set di dati del prompt personalizzato, questa deve essere specificata in tutti gli input.

Il seguente esempio di json codice mostra le coppie chiave-valore accettate in un set di dati di prompt personalizzato che contiene i propri dati di inferenza.


{
    "prompt": {
        "text": "Who invented the airplane?"
    },
    "category": "Airplanes",
    "referenceResponse": {
        "text": "Orville and Wilbur Wright"
    },
    "responses":
        // All inference must come from a single model
        [{
            "modelIdentifier": "meta-textgeneration-llama-codellama-7b" ,
            "text": "The Wright brothers, Orville and Wilbur Wright are widely credited with inventing and manufacturing the world's first successful airplane."
        }]

}

Per iniziare, avvia Studio e nella sezione Valutazione del modello in Jobs nella navigazione principale.

Per aggiungere i tuoi dati di inferenza a un lavoro di valutazione di modelli umani.

Nella Fase 1: Specificate i dettagli del lavoro aggiungete il nome del lavoro di valutazione del modello e una descrizione facoltativa.
Nel Passaggio 2: Imposta la valutazione scegli Human.
Successivamente, in Scegli il modello o i modelli che desideri valutare, puoi scegliere il modello che desideri utilizzare. Puoi utilizzare un JumpStart modello già distribuito oppure puoi scegliere un modello base Jumpstart pre-addestrato.
Quindi, scegli un tipo di attività.
Successivamente, puoi aggiungere metriche di valutazione.
Successivamente, in Richiedi set di dati, seleziona la casella di controllo sotto Porta la tua inferenza per indicare che i prompt contengono chiavi di risposta.
Quindi continua a configurare il tuo lavoro di valutazione del modello.

Per ulteriori informazioni su come vengono salvate le risposte del processo di valutazione dei modelli che utilizza lavoratori umani, consulta Comprendi i risultati di un lavoro di valutazione umana

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Tossicità

Valutazione automatica del modello

Seleziona le tue preferenze relative ai cookie

Crea un modello di lavoro di valutazione che utilizzi lavoratori umani

Importante

Prerequisiti

Configurazione delle autorizzazioni

Per creare un bucket Amazon S3 e specificare le autorizzazioni CORS

Per aggiungere autorizzazioni alla tua policy IAM

Per aggiungere autorizzazioni al tuo ruolo IAM

Per aggiungere una politica di fiducia al tuo ruolo IAM

Configurazione dell'ambiente

Prerequisiti

Configurazione delle autorizzazioni

Per creare un bucket Amazon S3 e specificare le autorizzazioni CORS

Per aggiungere autorizzazioni alla tua policy IAM

Per aggiungere autorizzazioni al tuo ruolo IAM

Per aggiungere una politica di fiducia al tuo ruolo IAM

Per avviare JumpStart

Per impostare un lavoro di valutazione

Nota

Configura il tuo team di lavoro

Fornisci istruzioni per il tuo team di lavoro

Invia la tua richiesta di lavoro di valutazione e visualizza lo stato di avanzamento del lavoro

Visualizza la pagella del tuo lavoro di valutazione modello che utilizza lavoratori umani

Creazione di un processo di valutazione del modello che utilizza lavoratori umani

Per avviare JumpStart

Per impostare un lavoro di valutazione

Nota

Configura il tuo team di lavoro

Fornisci istruzioni per il tuo team di lavoro

Invia la tua richiesta di lavoro di valutazione e visualizza lo stato di avanzamento del lavoro

Visualizza la pagella del tuo lavoro di valutazione modello che utilizza lavoratori umani

Per aggiungere i tuoi dati di inferenza a un lavoro di valutazione di modelli umani.

Utilizzo dei dati di inferenza personali in lavori di valutazione dei modelli che utilizzano lavoratori umani

Per aggiungere i tuoi dati di inferenza a un lavoro di valutazione di modelli umani.

Related resources

Questa pagina ti è stata utile?

Related resources

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?