

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Ejemplos de código para Rendimiento aprovisionado
<a name="prov-thru-code-examples"></a>

Los siguientes ejemplos de código muestran cómo crear un rendimiento aprovisionado y cómo administrarlo e invocarlo mediante AWS CLI el SDK de Python. Puede crear un rendimiento aprovisionado a partir de un modelo básico o de un modelo que ya haya personalizado. Antes de empezar, cumpla los siguientes requisitos previos:

**Requisitos previos**

En los ejemplos siguientes se utiliza el Amazon Nova Lite modelo, cuyo identificador de modelo es`amazon.nova-lite-v1:0:24k`. Si aún no lo has hecho, solicita acceso al Amazon Nova Lite siguiendo los pasos que se indican en[Administre el acceso a los modelos mediante el SDK y la CLI](model-access.md#model-access-modify).

Si quiere adquirir Provisioned Throughput para un modelo básico diferente o un modelo personalizado, tendrá que hacer lo siguiente:

1. Busque el ID del modelo (para los modelos de base), el nombre (para los modelos personalizados) o el ARN (para cualquiera de los dos) mediante una de las siguientes acciones:
   + Si va a adquirir un rendimiento aprovisionado para un modelo básico, busque el ID o el nombre de recurso de Amazon (ARN) de un modelo que admita el aprovisionamiento de una de las siguientes maneras:
     + Busque el valor en la tabla.
     + Envíe una [ListFoundationModels](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListFoundationModels.html)solicitud y especifique el `byInferenceType` valor `PROVISIONED` para ver una lista de modelos que admiten el aprovisionamiento. Busque el valor en el `modelArn` campo `modelId` o.
   + Si va a adquirir un rendimiento aprovisionado para un modelo personalizado, busque el nombre o el nombre de recurso de Amazon (ARN) del modelo que ha personalizado de una de las siguientes maneras:
     + En la consola de Amazon Bedrock, seleccione **Modelos personalizados** en el panel de navegación izquierdo. Busque el nombre de su modelo personalizado en la lista de **modelos** o selecciónelo y busque el ARN del **modelo en los detalles** del **modelo**.
     + Envíe una [ListCustomModels](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListCustomModels.html)solicitud y busque el `modelArn` valor `modelName` o el valor de su modelo personalizado en la respuesta.

1. Modifique la [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)solicitud `body` de los ejemplos siguientes para que coincida con el formato del cuerpo del modelo buscándolo en[Parámetros de solicitud de inferencia y campos de respuesta para los modelos fundacionales](model-parameters.md).

Elija la pestaña del método que prefiera y siga estos pasos:

------
#### [ AWS CLI ]

1. Envíe una [CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html)solicitud para crear un rendimiento aprovisionado sin compromiso. Para ello*MyPT*, ejecute el siguiente comando en una terminal:

   ```
   aws bedrock create-provisioned-model-throughput \
      --model-units 1 \
      --provisioned-model-name MyPT \
      --model-id amazon.nova-lite-v1:0:24k
   ```

1. La respuesta devuelve un `provisioned-model-arn`. La creación puede tardar unos minutos en completarse. Para comprobar su estado, envíe una [GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html)solicitud y proporcione el nombre o el ARN del modelo aprovisionado como`provisioned-model-id`, ejecutando el siguiente comando:

   ```
   aws bedrock get-provisioned-model-throughput \
       --provisioned-model-id ${provisioned-model-arn}
   ```

1. Ejecute una inferencia con el modelo aprovisionado enviando una solicitud. [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) Proporcione el ARN del modelo aprovisionado que se devolvió en la `CreateProvisionedModelThroughput` respuesta, como. `model-id` El resultado se escribe en un archivo con el nombre de *output.txt* la carpeta actual.

   ```
   aws bedrock-runtime invoke-model \
       --model-id ${provisioned-model-arn} \
       --body '{
                   "messages": [{
                       "role": "user",
                       "content": [{
                           "text": "Hello"
                       }]
                   }],
                   "inferenceConfig": {
                       "temperature":0.7
                   }
               }' \
       --cli-binary-format raw-in-base64-out \
       output.txt
   ```

1. Envíe una [DeleteProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_DeleteProvisionedModelThroughput.html)solicitud para eliminar el rendimiento aprovisionado mediante el siguiente comando. Ya no se le cobrará por el rendimiento aprovisionado.

   ```
   aws bedrock delete-provisioned-model-throughput 
     --provisioned-model-id MyPT
   ```

------
#### [ Python (Boto) ]

En los siguientes fragmentos de código se explica cómo crear un rendimiento aprovisionado, obtener información al respecto e invocar el rendimiento aprovisionado.

1. Para crear un rendimiento aprovisionado llamado sin compromiso *MyPT* y asignar el ARN del rendimiento aprovisionado a una variable llamada, envíe la siguiente solicitud: *provisioned\$1model\$1arn* [CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html)

   ```
   import boto3 
   
   provisioned_model_name = 'MyPT'
   
   bedrock = boto3.client(service_name='bedrock')
   response = bedrock.create_provisioned_model_throughput(
       modelUnits=1,
       provisionedModelName=provisioned_model_name, 
       modelId='amazon.nova-lite-v1:0:24k' 
   )
                           
   provisioned_model_arn = response['provisionedModelArn']
   ```

1. La creación puede tardar unos minutos en completarse. Puede comprobar el estado con el siguiente fragmento de código. Puede proporcionar el nombre del rendimiento aprovisionado o el ARN devuelto por la [CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html)respuesta como. `provisionedModelId`

   ```
   bedrock.get_provisioned_model_throughput(provisionedModelId=provisioned_model_name)
   ```

1. Ejecute la inferencia con su modelo aprovisionado actualizado con el siguiente comando y utilizando el ARN del modelo aprovisionado como. `modelId`

   ```
   import json
   import logging
   import boto3
   
   from botocore.exceptions import ClientError
   
   
   class ImageError(Exception):
       "Custom exception for errors returned by the model"
   
       def __init__(self, message):
           self.message = message
   
   
   logger = logging.getLogger(__name__)
   logging.basicConfig(level=logging.INFO)
   
   
   def generate_text(model_id, body):
       """
       Generate text using your provisioned custom model.
       Args:
           model_id (str): The model ID to use.
           body (str) : The request body to use.
       Returns:
           response (json): The response from the model.
       """
   
       logger.info(
           "Generating text with your provisioned custom model %s", model_id)
   
       brt = boto3.client(service_name='bedrock-runtime')
   
       accept = "application/json"
       content_type = "application/json"
   
       response = brt.invoke_model(
           body=body, modelId=model_id, accept=accept, contentType=content_type
       )
       response_body = json.loads(response.get("body").read())
   
       finish_reason = response_body.get("error")
   
       if finish_reason is not None:
           raise ImageError(f"Text generation error. Error is {finish_reason}")
   
       logger.info(
           "Successfully generated text with provisioned custom model %s", model_id)
   
       return response_body
   
   
   def main():
       """
       Entrypoint for example.
       """
       try:
           logging.basicConfig(level=logging.INFO,
                               format="%(levelname)s: %(message)s")
   
           model_id = provisioned-model-arn
   
           body = json.dumps({
               "inputText": "what isAWS?"
           })
   
           response_body = generate_text(model_id, body)
           print(f"Input token count: {response_body['inputTextTokenCount']}")
   
           for result in response_body['results']:
               print(f"Token count: {result['tokenCount']}")
               print(f"Output text: {result['outputText']}")
               print(f"Completion reason: {result['completionReason']}")
   
       except ClientError as err:
           message = err.response["Error"]["Message"]
           logger.error("A client error occurred: %s", message)
           print("A client error occured: " +
                 format(message))
       except ImageError as err:
           logger.error(err.message)
           print(err.message)
   
       else:
           print(
               f"Finished generating text with your provisioned custom model {model_id}.")
   
   
   if __name__ == "__main__":
       main()
   ```

1. Elimine el rendimiento aprovisionado mediante el siguiente fragmento de código. Ya no se le cobrará por el rendimiento aprovisionado.

   ```
   bedrock.delete_provisioned_model_throughput(provisionedModelId=provisioned_model_name)
   ```

------