Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Formato de datos para inferencia de Object2Vec
En la siguiente página se describen los formatos de solicitud de entrada y respuesta de salida para obtener inferencias de puntuación a partir del modelo Amazon SageMaker Object2Vec.
GPUoptimización: clasificación o regresión
Debido a la escasez de GPU memoria, la variable de INFERENCE_PREFERRED_MODE
entorno se puede especificar para optimizar si la red de clasificación/regresión o la red de Salida: integraciones de codificador inferencia están cargadas. GPU Si la mayor parte de su inferencia está destinada a su clasificación o regresión, especifique INFERENCE_PREFERRED_MODE=classification
. A continuación se muestra un ejemplo de transformación por lotes de cómo utilizar 4 instancias de p3.2xlarge, que se optimiza para la inferencia de clasificación o regresión:
transformer = o2v.transformer(instance_count=4, instance_type="ml.p2.xlarge", max_concurrent_transforms=2, max_payload=1, # 1MB strategy='MultiRecord', env={'INFERENCE_PREFERRED_MODE': 'classification'}, # only useful with GPU output_path=output_s3_path)
Entrada: formato de solicitud de clasificación o regresión
Content-type: application/json
{ "instances" : [ {"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]}, {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]}, {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]} ] }
Content-type: application/jsonlines
{"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]} {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]} {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}
Para problemas de clasificación, la longitud del vector de puntuaciones corresponde a num_classes
. Para problemas de regresión, la longitud es 1.
Salida: formato de respuesta de regresión o clasificación
ACCEPT: application/json
{ "predictions": [ { "scores": [ 0.6533935070037842, 0.07582679390907288, 0.2707797586917877 ] }, { "scores": [ 0.026291321963071823, 0.6577019095420837, 0.31600672006607056 ] } ] }
ACCEPT: application/jsonlines
{"scores":[0.195667684078216,0.395351558923721,0.408980727195739]} {"scores":[0.251988261938095,0.258233487606048,0.489778339862823]} {"scores":[0.280087798833847,0.368331134319305,0.351581096649169]}
En los formatos de clasificación y de regresión, las puntuaciones se aplican a etiquetas individuales.