

# 使用 Invoke API
<a name="using-invoke-api"></a>

**注意**  
本文档适用于 Amazon Nova 版本 1。有关如何在 Amazon Nova 2 中使用 Invoke API 的信息，请访问[使用 Invoke API](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-invoke-api.html)。

调用 Amazon Nova 理解模型（Amazon Nova Micro、Lite、Pro 和 Premier）的另一种方法是通过 Invoke API 进行调用。Amazon Nova 模型的 Invoke API 旨在与 Converse API 保持一致，允许扩展相同的统一以支持使用 Invoke API 的用户（*Converse API 特有的文档理解功能除外*）。将使用前面讨论的组件，同时在模型提供者之间保持一致的架构。Invoke API 支持以下模型功能：
+ **InvokeModel：**支持带有缓冲（而不是流式传输）回复的基本多轮对话
+ **带回复流的 InvokeModel：**具有流式回复的多轮对话，可实现更多的增量生成并更具交互性
+ **系统提示：**系统指令，例如角色或回复指南
+ **视觉：**图像和视频输入
+ **工具使用：**通过函数调用来选择各种外部工具
+ **流式工具使用：**将工具使用与实时生成流相结合
+ **护栏：**防止不恰当或有害的内容

**重要**  
对 Amazon Nova 进行推理调用的超时时间为 60 分钟。默认情况下，AWS SDK 客户端在 1 分钟后超时。建议将 AWS SDK 客户端的读取超时时间延长至至少 60 分钟。例如，在 AWS Python botocore SDK 中，请将 [botocore.config](https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html#) 中的 `read_timeout` 字段值更改为至少 3600。  

```
client = boto3.client(
    "bedrock-runtime",
    region_name="us-east-1",
    config=Config(
        connect_timeout=3600,  # 60 minutes
        read_timeout=3600,     # 60 minutes
        retries={'max_attempts': 1}
    )
)
```

以下是如何在 boto3 中使用 Invoke Streaming API 的示例，boto3 是搭载 Amazon Nova Lite 的适用于 Python 的 AWS SDK：

```
# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0
import boto3
import json
from datetime import datetime

# Create a Bedrock Runtime client in the AWS Region of your choice.
client = boto3.client("bedrock-runtime", region_name="us-east-1")

LITE_MODEL_ID = "us.amazon.nova-lite-v1:0"

# Define your system prompt(s).
system_list = [
            {
                "text": "Act as a creative writing assistant. When the user provides you with a topic, write a short story about that topic."
            }
]

# Define one or more messages using the "user" and "assistant" roles.
message_list = [{"role": "user", "content": [{"text": "A camping trip"}]}]

# Configure the inference parameters.
inf_params = {"maxTokens": 500, "topP": 0.9, "topK": 20, "temperature": 0.7}

request_body = {
    "schemaVersion": "messages-v1",
    "messages": message_list,
    "system": system_list,
    "inferenceConfig": inf_params,
}

start_time = datetime.now()

# Invoke the model with the response stream
response = client.invoke_model_with_response_stream(
    modelId=LITE_MODEL_ID, body=json.dumps(request_body)
)

request_id = response.get("ResponseMetadata").get("RequestId")
print(f"Request ID: {request_id}")
print("Awaiting first token...")

chunk_count = 0
time_to_first_token = None

# Process the response stream
stream = response.get("body")
if stream:
    for event in stream:
        chunk = event.get("chunk")
        if chunk:
            # Print the response chunk
            chunk_json = json.loads(chunk.get("bytes").decode())
            # Pretty print JSON
            # print(json.dumps(chunk_json, indent=2, ensure_ascii=False))
            content_block_delta = chunk_json.get("contentBlockDelta")
            if content_block_delta:
                if time_to_first_token is None:
                    time_to_first_token = datetime.now() - start_time
                    print(f"Time to first token: {time_to_first_token}")

                chunk_count += 1
                current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S:%f")
                # print(f"{current_time} - ", end="")
                print(content_block_delta.get("delta").get("text"), end="")
    print(f"Total chunks: {chunk_count}")
else:
    print("No response stream received.")
```

有关 Invoke API 操作的更多信息，包括请求和回复语法，请参阅 Amazon Bedrock API 文档中的 [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)。