As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Os modelos de compreensão multimodal do Amazon Nova estão disponíveis para uso na inferência por meio da API Invoke (InvokeModel, InvokeModelWithResponseStream) e da API Converse (Converse e). ConverseStream Para criar aplicativos de conversação, consulte Realizar uma conversa com as operações da API inversa. Ambos os métodos da API (Invoke e Converse) seguem um padrão de solicitação muito semelhante, conforme detalhado abaixo
As principais diferenças entre a API Invoke e a API Converse são as seguintes:
-
Parâmetros de inferência como TopK não são suportados no Converse e precisam ser transmitidos
additionalModelRequestFields
, enquanto na API Invoke eles podem ser transmitidos diretamente nos parâmetros de inferência. -
O Document Support é limitado somente à API Converse e não é compatível com a API Invoke.
-
Os formatos de análise de resposta são diferentes entre as construções da API Invoke e da API Converse.
-
O streaming de resposta é diferente entre
ConverseStream
InvokeModelWithStreaming
e.
Tópicos
Visão geral da API Messages do da
Os modelos Amazon Nova Understanding utilizam a API de mensagens, que permite o envio de listas estruturadas de mensagens de entrada contendo texto, imagens, vídeos e documentos. O modelo então gera a próxima mensagem na conversa. A API de mensagens suporta consultas únicas e conversas sem estado em vários turnos, permitindo a criação de chatbots e aplicativos de assistente virtual. A API gerencia as trocas conversacionais entre um usuário e um modelo Amazon Nova (assistente).
Os modelos Amazon Nova são treinados para operar alternadamente em turnos de conversação entre usuários e assistentes. Ao criar uma mensagem, você especifica os turnos de conversação anteriores com o parâmetro messages. O modelo então gera as próximas mensagens na conversa.
Cada mensagem de entrada deve ser um objeto contendo uma função e um conteúdo. Os usuários podem especificar uma única mensagem com a função de usuário ou incluir várias mensagens com as funções de usuário e assistente. No entanto, a primeira mensagem deve sempre usar a função de usuário. Se a técnica de pré-preencher a resposta da Amazon Nova for empregada (incluindo uma mensagem final com a função de assistente), o modelo continuará sua resposta a partir do conteúdo fornecido. Essa abordagem ainda resultará em uma resposta com a função de assistente.
O seguinte representa uma única mensagem de usuário:
[{
"role": "user",
"content": [{"text":"Hello, Nova"}]
}]
Aqui está um exemplo com vários turnos de conversação:
[
{"role": "user", "content": [{"text": "Hello there."}]},
{"role": "assistant", "content": [{"text": "Hi, I'm Chatbot trained to answer your questions. How can I help you?"}]},
{"role": "user", "content": [{"text": "Can you explain LLMs in plain English?"}]}
]
Aqui está um exemplo com uma resposta parcialmente preenchida da Amazon Nova:
[
{"role": "user", "content": [{"text":"Please describe yourself using only JSON"}]},
{"role": "assistant", "content": [{"text":"Here is my JSON description:\n{"}]}
]
Para obter informações sobre a criação de prompts para modelos Amazon Nova, consulteCompreensão de texto que estimula as melhores práticas.
Utilizando o prompt do sistema
Você pode incluir um prompt do sistema na solicitação. Um prompt do sistema permite que você forneça contexto e instruções para o Amazon Nova, como especificar uma meta ou função específica. Especifique um prompt do sistema no system
campo, conforme mostrado no exemplo a seguir:
[
{"text": "You are an expert SaS analyst......"}
]