NOVO Anthropic Claude 3.7 Soneto

Modo de foco

*NOVO* Anthropic Claude 3.7 Soneto - Amazon Bedrock

Uso de ferramentas com raciocínio Uso atualizado do computador (beta) Blocos de pensamento Solicitação e reposta

Anthropic Claude 3.7 Sonnet é o primeiro modelo de Claude a oferecer step-by-step raciocínio, que Anthropic denominou “pensamento estendido”. With Claude 3.7 Sonnet, o uso do step-by-step raciocínio é opcional. Você pode escolher entre o pensamento padrão e o pensamento estendido para o raciocínio avançado. Junto com o pensamento ampliado, Claude 3.7 Sonnet permite até 128K tokens de saída por solicitação (até 64K tokens de saída são considerados geralmente disponíveis, mas saídas entre 64K e 128K estão na versão beta). Além disso, Anthropic aprimorou sua versão beta de uso do computador com suporte para novas ações.

With Claude 3.7 Sonnet, max_tokens (que inclui seu orçamento de pensamento quando o pensamento está ativado) é aplicado como um limite estrito. O sistema agora retornará um erro de validação se o prompt tokens + max_tokens exceder o tamanho da janela de contexto. Ao calcular o uso da janela de contexto com o pensamento ativado, há algumas considerações que você deve considerar:

Os blocos de pensamento dos turnos anteriores são removidos e não são contados na sua janela de contexto.
O pensamento do turno atual conta para max_tokens o limite desse turno.
Os blocos de pensamento dos turnos anteriores geralmente são removidos e não são contados na janela de contexto, exceto no último turno, se for um turno auxiliar.
Os blocos atuais de Turn Thinking podem ser incluídos em cenários específicos, como uso de ferramentas e pré-preenchimento com assistentes, e somente esses blocos incluídos contam para o uso do token.
Os usuários são cobrados apenas pelos blocos de pensamento que são realmente mostrados ao modelo.
É recomendável sempre enviar blocos de pensamento de volta com suas solicitações, pois o sistema os usará e os validará conforme necessário para o comportamento ideal do modelo.

Raciocínio (pensamento estendido)

Pensamento ampliado sobre Claude 3.7 Sonnet permite que chain-of-thought os recursos de raciocínio aumentem a precisão em tarefas complexas, ao mesmo tempo em que fornece transparência em seu processo de step-by-step pensamento antes de fornecer uma resposta final. Quando você ativa o pensamento estendido, Claude mostra seu processo de raciocínio por meio de blocos de thinking conteúdo na resposta. Esses thinking blocos representam o processo interno de solução de problemas de Claude usado para informar a resposta. Claude 3.7 SonnetO modo de raciocínio (ou pensamento) está desativado por padrão. Sempre que você ativar o thinking modo Claude, você precisará definir um orçamento para o número máximo de tokens que Claude pode usar para seu processo interno de raciocínio. Seu thinking budget_tokens deve sempre ser menor do max_tokens que o especificado em sua solicitação. Você pode ver blocos de pensamento redigidos aparecerem em sua saída quando a saída de raciocínio não atende aos padrões de segurança. Esse comportamento é esperado. O modelo ainda pode usar esse pensamento redigido para informar suas respostas e, ao mesmo tempo, manter as barreiras de segurança. Ao passar thinking e redacted_thinking bloquear de volta para a API em uma conversa de vários turnos, você deve fornecer o bloco completo e não modificado.

Os tokens de pensamento em sua resposta contam para a janela de contexto e são cobrados como tokens de saída. Como os tokens pensantes são tratados como tokens de saída normais, eles também contam para seu limite de token de cota de serviço por minuto (TPM). Em conversas de vários turnos, os blocos de pensamento associados às mensagens anteriores do assistente não são cobrados como tokens de entrada.

Trabalhando com o orçamento pensante:

O mínimo budget_tokens é 1.024 tokens. Anthropic sugere tentar pelo menos 4.000 tokens para obter um raciocínio mais abrangente e diferenciado.

budget_tokensé uma meta, não um limite estrito. O uso real do token pode variar de acordo com a tarefa.
Esteja preparado para tempos de resposta potencialmente mais longos devido ao processamento adicional necessário para o raciocínio.

Compatibilidade do raciocínio com outros parâmetros:

Pensar não é compatível com modificações de temperatura, top_p ou top_k, bem como com o uso forçado de ferramentas.
Você não pode preencher previamente as respostas quando o pensamento está ativado.

Raciocínio e cache imediato (pré-visualização limitada)

Inclusão do Thinking Block:

O pensamento só é incluído ao gerar um turno de assistente e não deve ser armazenado em cache.
Os bloqueios de pensamento dos turnos anteriores são ignorados.
Se o pensamento estiver desativado, qualquer conteúdo de pensamento passado para a API será ignorado.

O cache é invalidado quando:

Possibilitando ou incapacitando o pensamento.
Modificando o pensamentobudget_tokens.

Limitações de persistência:

Somente as instruções e ferramentas do sistema mantêm o cache quando os parâmetros de pensamento mudam.
A continuação do turno de uso da ferramenta não se beneficia do cache imediato.

Uso de ferramentas com raciocínio

Ao passar os blocos thinking e redacted_thinking de volta para a API em uma conversa de vários turnos, você deve fornecer o bloco completo e não modificado. Isso requer a preservação dos blocos de pensamento durante o uso da ferramenta, por dois motivos:

Continuidade do raciocínio — Os blocos de pensamento capturam o step-by-step raciocínio de Claude que levou às solicitações de ferramentas. Quando você publica os resultados da ferramenta, a inclusão do pensamento original garante que Claude possa continuar seu raciocínio de onde parou.
Manutenção do contexto — Embora os resultados do uso da ferramenta apareçam como mensagens do usuário na estrutura da API, eles fazem parte de um fluxo contínuo de raciocínio. A preservação dos blocos de pensamento mantém esse fluxo conceitual em várias chamadas de API.

Ao usar o pensamento com o uso de ferramentas, esteja ciente do seguinte padrão de comportamento:

Primeiro turno do assistente — Quando você envia uma mensagem inicial ao usuário, a resposta do assistente incluirá blocos de pensamento seguidos por solicitações de uso da ferramenta.
Mudança do resultado da ferramenta — Quando você passa a mensagem do usuário com blocos de resultados da ferramenta, a mensagem subsequente do assistente não conterá nenhum bloco de raciocínio adicional.

A ordem normal de uso de uma ferramenta para conversar com o pensamento segue estas etapas:

O usuário envia a mensagem inicial.
O Assistente responde com blocos de pensamento e solicitações de ferramentas.
O usuário envia mensagem com os resultados da ferramenta.
O Assistente responde com mais chamadas de ferramentas ou apenas mensagens de texto (sem bloqueios de pensamento nessa resposta).
Se mais ferramentas forem solicitadas, repita as etapas de 3 a 4 até que a conversa seja concluída.

Esse design permite que o assistente mostre seu processo de raciocínio antes de fazer solicitações de ferramentas, mas não repita o processo de raciocínio após receber os resultados da ferramenta.

With Anthropic Claude 3.7 Sonnet modelo, você pode especificar uma ferramenta que o modelo pode usar para responder a uma mensagem. Para obter mais informações, consulte Uso de ferramentas (chamada de função) no Anthropic Claude documentação.

dica

Recomendamos que você use o Converse API para integrar o uso de ferramentas em seu aplicativo. Para obter mais informações, consulte Use uma ferramenta para concluir uma resposta do modelo do Amazon Bedrock.

Uso atualizado do computador (beta)

Com o uso do computador, Claude pode ajudá-lo a automatizar tarefas por meio de ações básicas da GUI.

Atenção

O recurso Computer Use é disponibilizado para você como um “Serviço beta”, conforme definido nos Termos de Serviço da AWS. Ele está sujeito ao seu contrato com a AWS e aos Termos de Serviço da AWS e ao modelo de EULA aplicável. Esteja ciente de que a API Computer Use apresenta riscos exclusivos que são distintos dos recursos padrão de API ou das interfaces de chat. Esses riscos aumentam ao usar a API Computer Use para interagir com a internet. Para minimizar os riscos, considere tomar precauções, como:

Operar a funcionalidade Computer Use em uma máquina virtual ou contêiner dedicado com privilégios mínimos para evitar acidentes ou ataques diretos ao sistema.
Para evitar o roubo de informações, evite fornecer à API Computer Use acesso a contas ou dados confidenciais.
Limitar o acesso à internet da API Computer Use aos domínios necessários para reduzir a exposição a conteúdo mal-intencionado.
Para garantir a supervisão adequada, mantenha uma pessoa informada sobre tarefas confidenciais (como tomar decisões que possam ter consequências significativas no mundo real) e sobre qualquer coisa que exija consentimento afirmativo (como aceitar cookies, executar transações financeiras ou concordar com os termos de serviço).

Qualquer conteúdo que você habilitar Claude ver ou acessar pode potencialmente substituir as instruções ou a causa Claude cometer erros ou realizar ações não intencionais. Tomando as devidas precauções, como isolar Claude de superfícies sensíveis, é essencial — inclusive para evitar riscos relacionados à injeção imediata. Antes de habilitar ou solicitar as permissões necessárias para habilitar os recursos do Computer Use em seus próprios produtos, informe os usuários finais sobre quaisquer riscos relevantes e obtenha o consentimento deles conforme apropriado.

A API de uso do computador oferece várias ferramentas predefinidas de uso do computador para você usar. É possível criar um prompt com sua solicitação, como “enviar um e-mail para Ben com as anotações da minha última reunião” e uma captura de tela (quando necessário). A resposta contém uma lista de ações de tool_use no formato JSON (por exemplo, scroll_down, left_button_press, screenshot). Seu código executa as ações do computador e fornece Claude com captura de tela mostrando as saídas (quando solicitado).

O Claude 3.7 Sonnet permite recursos expandidos de uso do computador com uma nova versão da ferramenta beta de uso do computador existente. Para usar essas novas ferramentas, você deve especificar o parâmetro de inferência beta antrópica “anthropic_beta”: ["computer-use-2025-01-24"]. O conjunto de ações de retorno possíveis do uso do computador inclui: rolar, esperar, pressionar o botão esquerdo do mouse, levantar o botão esquerdo do mouse, segurar a tecla e clicar três vezes. Ele continuará seguindo o mesmo formato de uso da ferramenta nas saídas.

Para obter mais informações, consulte Uso do computador (beta) no Anthropic documentação.

Esta é uma resposta de exemplo que pressupõe que a solicitação continha uma captura de tela da área de trabalho com um ícone do Firefox.


{
    "id": "msg_123",
    "type": "message",
    "role": "assistant",
    "model": "anthropic.claude-3-7-sonnet-20250219-v1:0",
    "anthropic_beta": ["computer-use-2025-01-24"] ,
    "content": [
        {
            "type": "text",
            "text": "I see the Firefox icon. Let me click on it and then navigate to a weather website."
        },
        {
            "type": "tool_use",
            "id": "toolu_123",
            "name": "computer",
            "input": {
                "action": "mouse_move",
                "coordinate": [
                    708,
                    736
                ]
            }
        },
        {
            "type": "tool_use",
            "id": "toolu_234",
            "name": "computer",
            "input": {
                "action": "left_click"
            }
        }
    ],
    "stop_reason": "tool_use",
    "stop_sequence": null,
    "usage": {
        "input_tokens": 3391,
        "output_tokens": 132
    }
}

Blocos de pensamento

Os blocos de pensamento representam Claude 3.7 Sonnetdo processo de pensamento interno.

InvokeModel Solicitação


{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 24000,
    "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
    },
    "messages": [
        {
            "role": "user",
            "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        }
    ]
}

InvokeModel Resposta


{
    "content": [
        {
            "type": "thinking",
            "thinking": "To approach this, let's think about what we know about prime numbers...",
            "signature": "eyJhbGciOiJFUzI1NiIsImtpZCI6ImtleS0xMjM0In0.eyJoYXNoIjoiYWJjMTIzIiwiaWF0IjoxNjE0NTM0NTY3fQ...."
        },
        {
            "type": "text",
            "text": "Yes, there are infinitely many prime numbers such that..."
        }
    ]
}

Para permitir que Claude resolva problemas com restrições internas mínimas, mantendo os padrões de segurança, a Anthropic definiu o seguinte:

Os blocos de pensamento contêm um campo de assinatura. Esse campo contém um token criptográfico que verifica se o bloco de pensamento foi gerado por Claude e é verificado quando os blocos de pensamento são passados de volta para a API. Ao transmitir respostas, a assinatura é adicionada com um signature_delta dentro de um evento content_block_delta pouco antes do evento content_block_stop.

Ocasionalmente, o raciocínio interno de Claude será sinalizado por sistemas de segurança automatizados. Quando isso ocorre, todo o bloco de pensamento é criptografado e devolvido a você como um bloco redacted_thinking. Esses blocos de pensamento redigidos são decifrados quando devolvidos ao modelo, permitindo que Claude continue sua resposta sem perder o contexto.

Aqui está um exemplo de resposta do InvokeModel mostrando blocos de pensamento normais e editados:


{
  "content": [
    {
      "type": "thinking",
      "thinking": "Let me analyze this step by step...",
      "signature": "WaUjzkypQ2mUEVM36O2TxuC06KN8xyfbJwyem2dw3URve/op91XWHOEBLLqIOMfFG/UvLEczmEsUjavL...."
    },
    {
      "type": "redacted_thinking",
      "data": "EmwKAhgBEgy3va3pzix/LafPsn4aDFIT2Xlxh0L5L8rLVyIwxtE3rAFBa8cr3qpP..."
    },
    {
      "type": "text",
      "text": "Based on my analysis..."
    }
  ]
}

Você pode ver blocos de pensamento redigidos aparecerem em sua saída quando a saída de raciocínio não atende aos padrões de segurança. Esse comportamento é esperado. O modelo ainda pode usar esse pensamento redigido para informar suas respostas e, ao mesmo tempo, manter as barreiras de segurança. Ao passar os blocos thinking e redacted_thinking de volta para a API em uma conversa de vários turnos, você deve fornecer o bloco completo e não modificado.

InvokeModelWithResponseStream

Quando o streaming estiver ativado, você receberá conteúdo inteligente dos eventos thinking_delta. Veja como lidar com o streaming pensando:

Solicitação


{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 24000,
    "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
    },
    "messages": [
        {
            "role": "user",
            "content": "What is 27 * 453?"
        }
    ]
}

Resposta


event: message_start
data: {"type": "message_start", "message": {"id": "msg_01...", "type": "message", "role": "assistant", "content": [], "model": "claude-3-7-sonnet-20250219", "stop_reason": null, "stop_sequence": null}}

event: content_block_start
data: {"type": "content_block_start", "index": 0, "content_block": {"type": "thinking", "thinking": ""}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "Let me solve this step by step:\n\n1. First break down 27 * 453"}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "thinking_delta", "thinking": "\n2. 453 = 400 + 50 + 3"}}

// Additional thinking deltas...

event: content_block_delta
data: {"type": "content_block_delta", "index": 0, "delta": {"type": "signature_delta", "signature": "EqQBCgIYAhIM1gbcDa9GJwZA2b3hGgxBdjrkzLoky3dl1pkiMOYds..."}}

event: content_block_stop
data: {"type": "content_block_stop", "index": 0}

event: content_block_start
data: {"type": "content_block_start", "index": 1, "content_block": {"type": "text", "text": ""}}

event: content_block_delta
data: {"type": "content_block_delta", "index": 1, "delta": {"type": "text_delta", "text": "27 * 453 = 12,231"}}

// Additional text deltas...

event: content_block_stop
data: {"type": "content_block_stop", "index": 1}

event: message_delta
data: {"type": "message_delta", "delta": {"stop_reason": "end_turn", "stop_sequence": null}}

event: message_stop
data: {"type": "message_stop"}

Comprimento de saída estendido (beta)

O Claude 3.7 Sonnet pode produzir respostas substancialmente mais longas do que os modelos Claude anteriores, com suporte para até 128K tokens de saída (beta). Esse comprimento de saída estendido pode ser usado com os novos recursos de raciocínio. Esse recurso pode ser ativado passando um parâmetro de anthropic-beta inferência deoutput-128k-2025-02-19.

Atenção

O recurso de comprimento de saída estendido é disponibilizado para você como um “Serviço Beta”, conforme definido nos Termos de Serviço da AWS. Ele está sujeito ao seu contrato com a AWS e aos Termos de Serviço da AWS e ao modelo de EULA aplicável.

Uso atualizado do computador (beta)

O Claude 3.7 Sonnet permite recursos expandidos de uso do computador com uma nova versão da ferramenta beta de uso do computador existente. Para usar essas novas ferramentas, você deve especificar o parâmetro computer_20250212 de anthropic-beta inferência. O conjunto de ações de retorno possíveis do uso do computador inclui: rolar, esperar, pressionar o botão esquerdo do mouse, levantar o botão esquerdo do mouse, segurar a tecla e clicar três vezes. Ele continuará seguindo o mesmo formato de uso da ferramenta nas saídas.

Atenção

Operar a funcionalidade Computer Use em uma máquina virtual ou contêiner dedicado com privilégios mínimos para evitar acidentes ou ataques diretos ao sistema.
Para evitar o roubo de informações, evite fornecer à API Computer Use acesso a contas ou dados confidenciais.
Limitar o acesso à internet da API Computer Use aos domínios necessários para reduzir a exposição a conteúdo mal-intencionado.
Para garantir a supervisão adequada, mantenha uma pessoa informada sobre tarefas confidenciais (como tomar decisões que possam ter consequências significativas no mundo real) e sobre qualquer coisa que exija consentimento afirmativo (como aceitar cookies, executar transações financeiras ou concordar com os termos de serviço).

Novas ferramentas antrópicas definidas

Anteriormente, o editor de texto e as ferramentas bash estavam disponíveis apenas como parte da computer-use-20241022 versão beta. Como parte do Claude 3.7 Sonnet, eles agora também estarão disponíveis como ferramentas autônomas definidas pela Anthropic:

A ferramenta de edição de texto (que realiza a substituição de strings) agora também estará disponível como sua própria ferramentatext_editor_20250124.
A ferramenta Bash (que permite que o modelo faça comandos de terminal) agora também estará disponível como sua própria ferramentabash_20250124.

Nem a ferramenta de substituição de caracteres nem a ferramenta bash requerem um parâmetro de inferência beta antrópica.

Solicitação e reposta

O corpo da solicitação é passado no body campo de uma solicitação para InvokeModelou InvokeModelWithResponseStream. O tamanho máximo da carga útil que você pode enviar em uma solicitação é de 20 MB.

Para obter mais informações, consulte https://docs.anthropic.com/claude/reference/messages_post.

Request

Claude 3.7 Sonnet tem os seguintes parâmetros de inferência para uma chamada de inferência de mensagens.


{
    "anthropic_version": "bedrock-2023-05-31", 
    "anthropic_beta": ["computer-use-2025-01-24"] 
    "max_tokens": int,
    "system": string,    
    "messages": [
        {
            "role": string,
            "content": [
                { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } },
                { "type": "text", "text": "content text" }
      ]
        }
    ],
    "temperature": float,
    "top_p": float,
    "top_k": int,
    "tools": [
        {
                "type": "custom",
                "name": string,
                "description": string,
                "input_schema": json
            
        },
        { 
            "type": "computer_20250212",  
            "name": "computer", 
            "display_height_px": int,
            "display_width_px": int,
            "display_number": 0 int
        },
        { 
            "type": "bash_20250124", 
            "name": "bash"
        },
        { 
            "type": "text_editor_20250124",
            "name": "str_replace_editor"
        }
        
    ],
    "tool_choice": {
        "type" :  string,
        "name" : string,
    },
    

 
    "stop_sequences": [string]
}

Veja a seguir os parâmetros necessários.

anthropic_version: (obrigatório) a versão da Anthropic. O valor deve ser bedrock-2023-05-31.
anthropic_beta: (obrigatório, se estiver usando a API Computer Use) O beta da Anthropic a ser usado. Para usar a API de uso do computador, o valor deve sercomputer-use-2024-10-22. anthropic_betatambém deve ter o output-128k-2025-02-19 parâmetro para o comprimento estendido do contexto.
max_tokens: (obrigatório) o número máximo de tokens a serem gerados antes de parar.

Observe que Anthropic Claude os modelos podem parar de gerar tokens antes de atingir o valor demax_tokens. Diferente Anthropic Claude os modelos têm valores máximos diferentes para esse parâmetro. Para obter mais informações, consulte Model comparison.
messages: (obrigatório) as mensagens de entrada.
- role: o perfil do turno da conversa. Os valores válidos são user e assistant.
- conteúdo — (obrigatório) O conteúdo do turno da conversa, como uma matriz de objetos. Cada objeto contém um campo de tipo, no qual você pode especificar um dos seguintes valores:
  - text— Se você especificar esse tipo, deverá incluir um campo de texto e especificar o prompt de texto como seu valor. Se outro objeto na matriz for uma imagem, esse prompt de texto se aplicará às imagens.
  - image— Se você especificar esse tipo, deverá incluir um campo de origem mapeado para um objeto com os seguintes campos:
    
    type: (obrigatório) o tipo de codificação da imagem. Você pode especificar base64.
    
    media_type: (obrigatório) o tipo da imagem. Você pode especificar os seguintes formatos de imagem:
    
    image/jpeg
    image/png
    image/webp
    image/gif
    
    data: (obrigatório) os bytes de imagem codificados em base64 para a imagem. O tamanho máximo da imagem é 3,75 MB. O valor da altura e da largura máximas de uma imagem é 8.000 pixels.
  - pensamento — Claude mostrará seu processo de raciocínio por meio de blocos de thinking conteúdo na resposta. thinkingnão é compatível com modificações de temperatura, top_p ou top_k, bem como com o uso forçado de ferramentas.
  - redacted_thinking — Quando o raciocínio interno de Claude é sinalizado por sistemas de segurança automatizados, o bloco de pensamento é criptografado e devolvido a você como um bloco redacted_thinking.

Veja a seguir os parâmetros opcionais.

system: (opcional) o prompt do sistema para a solicitação.

Um prompt do sistema é uma forma de fornecer contexto e instruções para Anthropic Claude, como especificar uma meta ou função específica. Para obter mais informações, consulte Solicitações do sistema no Anthropic documentação.

nota
Você pode usar os prompts do sistema com Anthropic Claude versão 2.1 ou superior.
stop_sequences — (Opcional) Sequências de texto personalizadas que fazem com que o modelo pare de gerar. Anthropic Claude os modelos normalmente param quando completam naturalmente seu turno; nesse caso, o valor do campo de stop_reason resposta éend_turn. Se quiser que o modelo deixe de ser gerado ao encontrar strings de texto personalizadas, você poderá usar o parâmetro stop_sequences. Se o modelo encontrar uma das strings de texto personalizadas, o valor do campo de resposta stop_reason será stop_sequence e o valor de stop_sequence conterá a sequência de parada correspondente.

O número máximo de entradas é 8.191.

temperature: (opcional) a aleatoriedade injetada na resposta.

Padrão	Mínimo	Máximo
1	0	1

top_p: (opcional) use amostragem de núcleo.

Na amostragem do núcleo, Anthropic Claude calcula a distribuição cumulativa de todas as opções para cada token subsequente em ordem decrescente de probabilidade e a interrompe quando atinge uma probabilidade específica especificada por. top_p Você deve alterar temperature ou top_p, mas não ambos.

Padrão	Mínimo	Máximo
0,999	0	1

top_k: (opcional) somente um exemplo das opções K principais para cada token subsequente.

Use top_k para remover respostas de baixa probabilidade de cauda longa.

Padrão	Mínimo	Máximo
Desabilitado por padrão.	0	500

tools: (opcional) definições de ferramentas que o modelo pode usar.

nota

Requer um Anthropic Claude Modelo 3.

Se você incluir tools na solicitação, o modelo poderá retornar blocos de conteúdo tool_use que representam o uso dessas ferramentas do modelo. É possível executar essas ferramentas usando a entrada de ferramenta gerada pelo modelo e, opcionalmente, retornar os resultados ao modelo usando blocos de conteúdo de tool_result.

Você pode passar os seguintes tipos de ferramenta:

Personalizada

Definição de uma ferramenta personalizada.

(opcional) type: o tipo da ferramenta. Se definido, use o valor custom.
name: o nome da ferramenta.
description: (opcional, mas altamente recomendado) a descrição da ferramenta.
input_schema: o esquema JSON da ferramenta.

Computação

Definição da ferramenta de computação usada por você com a API Computer Use.

type: o valor deve ser computer_20250212.
name: o valor deve ser computer.

(Obrigatório) display_height_px: a altura da tela que está sendo controlada pelo modelo, em pixels.

Padrão	Mínimo	Máximo
Nenhum	1	Sem máximo

(Obrigatório) display_width_px: a largura da tela que está sendo controlada pelo modelo, em pixels.

Padrão	Mínimo	Máximo
Nenhum	1	Sem máximo

(Opcional) display_number: o número de exibição a ser controlado (só relevante para ambientes X11). Se especificada, a ferramenta receberá um número de exibição na definição da ferramenta.

Padrão	Mínimo	Máximo
Nenhum	0	N

bash

Definição da ferramenta de bash usada por você com a API Computer Use.

(opcional) type: o valor deve ser bash_20250124.
name: o valor deve ser bash.

text editor

Definição da ferramenta de edição de texto usada por você com a API Computer Use.

(opcional) type: o valor deve ser text_editor_20250124.
name: o valor deve ser str_replace_editor.

tool_choice — (Opcional) Especifica como o modelo deve usar as ferramentas fornecidas. O modelo pode usar uma ferramenta específica, qualquer ferramenta disponível ou decidir por conta própria.

nota
Requer um Anthropic Claude Modelo 3.
- type: o tipo de opção de ferramenta. Os valores possíveis são any (use qualquer ferramenta disponível), auto (o modelo decide) e tool (use a ferramenta especificada).
- name: (opcional) o nome da ferramenta a ser usada. Obrigatório se você especificar tool no campo type.

Response

A ferramenta Anthropic Claude O modelo retorna os seguintes campos para uma chamada de inferência de mensagens.


{
    "id": string,
    "model": string,
    "type" : "message",
    "role" : "assistant",
    "content": [
        {
            "type": string,
            "text": string,
            "image" :json,
            "id": string,
            "name":string,
            "input": json
        }
    ],
    "stop_reason": string,
    "stop_sequence": string,
    "usage": {
        "input_tokens": integer,
        "output_tokens": integer
    }
    
}

id: o identificador exclusivo da resposta. O formato e o tamanho do ID podem mudar com o passar do tempo.
modelo — O ID do Anthropic Claude modelo que fez a solicitação.
stop_reason — A razão pela qual Anthropic Claude parou de gerar a resposta.
- end_turn: o modelo atingiu um ponto de parada natural
- max_tokens: o texto gerado excedeu o valor do campo de entrada max_tokens ou excedeu o número máximo de tokens compatíveis com o modelo.
- stop_sequence: o modelo gerou uma das sequências de parada especificadas por você no campo de entrada stop_sequences.
stop_sequence: a sequência de parada que encerrou a geração.
type: o tipo de resposta. O valor é sempre message.
role: a função conversacional da mensagem gerada. O valor é sempre assistant.
content: o conteúdo gerado pelo modelo. Retornado como uma matriz. Há três tipos de conteúdo: texto, uso de ferramentas e imagem.
- text: uma resposta em texto.
  - tipo — O tipo do conteúdo. Este valor é text.
  - texto — Se o valor de type for texto, conterá o texto do conteúdo.
- uso da ferramenta — Uma solicitação do modelo para usar uma ferramenta.
  - tipo — O tipo do conteúdo. Este valor é tool_use.
  - id: o ID da ferramenta cujo uso o modelo está solicitando.
  - nome — Contém o nome da ferramenta solicitada.
  - input: os parâmetros de entrada a serem passados para a ferramenta.
- Imagem — Uma solicitação do modelo para usar uma ferramenta.
  - tipo — O tipo do conteúdo. Este valor é image.
usage: contêiner para o número de tokens fornecidos por você na solicitação e o número de tokens que o modelo gerou na resposta.
- input_tokens: o número de tokens de entrada na solicitação.
- output_tokens: o número de tokens gerados pelo modelo na resposta.
- stop_sequence: o modelo gerou uma das sequências de parada especificadas por você no campo de entrada stop_sequences.

anchor anchor

Claude 3.7 Sonnet tem os seguintes parâmetros de inferência para uma chamada de inferência de mensagens.


{
    "anthropic_version": "bedrock-2023-05-31", 
    "anthropic_beta": ["computer-use-2025-01-24"] 
    "max_tokens": int,
    "system": string,    
    "messages": [
        {
            "role": string,
            "content": [
                { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } },
                { "type": "text", "text": "content text" }
      ]
        }
    ],
    "temperature": float,
    "top_p": float,
    "top_k": int,
    "tools": [
        {
                "type": "custom",
                "name": string,
                "description": string,
                "input_schema": json
            
        },
        { 
            "type": "computer_20250212",  
            "name": "computer", 
            "display_height_px": int,
            "display_width_px": int,
            "display_number": 0 int
        },
        { 
            "type": "bash_20250124", 
            "name": "bash"
        },
        { 
            "type": "text_editor_20250124",
            "name": "str_replace_editor"
        }
        
    ],
    "tool_choice": {
        "type" :  string,
        "name" : string,
    },
    

 
    "stop_sequences": [string]
}

Veja a seguir os parâmetros necessários.

anthropic_version: (obrigatório) a versão da Anthropic. O valor deve ser bedrock-2023-05-31.
anthropic_beta: (obrigatório, se estiver usando a API Computer Use) O beta da Anthropic a ser usado. Para usar a API de uso do computador, o valor deve sercomputer-use-2024-10-22. anthropic_betatambém deve ter o output-128k-2025-02-19 parâmetro para o comprimento estendido do contexto.
max_tokens: (obrigatório) o número máximo de tokens a serem gerados antes de parar.

Observe que Anthropic Claude os modelos podem parar de gerar tokens antes de atingir o valor demax_tokens. Diferente Anthropic Claude os modelos têm valores máximos diferentes para esse parâmetro. Para obter mais informações, consulte Model comparison.
messages: (obrigatório) as mensagens de entrada.
- role: o perfil do turno da conversa. Os valores válidos são user e assistant.
- conteúdo — (obrigatório) O conteúdo do turno da conversa, como uma matriz de objetos. Cada objeto contém um campo de tipo, no qual você pode especificar um dos seguintes valores:
  - text— Se você especificar esse tipo, deverá incluir um campo de texto e especificar o prompt de texto como seu valor. Se outro objeto na matriz for uma imagem, esse prompt de texto se aplicará às imagens.
  - image— Se você especificar esse tipo, deverá incluir um campo de origem mapeado para um objeto com os seguintes campos:
    
    type: (obrigatório) o tipo de codificação da imagem. Você pode especificar base64.
    
    media_type: (obrigatório) o tipo da imagem. Você pode especificar os seguintes formatos de imagem:
    
    image/jpeg
    image/png
    image/webp
    image/gif
    
    data: (obrigatório) os bytes de imagem codificados em base64 para a imagem. O tamanho máximo da imagem é 3,75 MB. O valor da altura e da largura máximas de uma imagem é 8.000 pixels.
  - pensamento — Claude mostrará seu processo de raciocínio por meio de blocos de thinking conteúdo na resposta. thinkingnão é compatível com modificações de temperatura, top_p ou top_k, bem como com o uso forçado de ferramentas.
  - redacted_thinking — Quando o raciocínio interno de Claude é sinalizado por sistemas de segurança automatizados, o bloco de pensamento é criptografado e devolvido a você como um bloco redacted_thinking.

Veja a seguir os parâmetros opcionais.

system: (opcional) o prompt do sistema para a solicitação.

Um prompt do sistema é uma forma de fornecer contexto e instruções para Anthropic Claude, como especificar uma meta ou função específica. Para obter mais informações, consulte Solicitações do sistema no Anthropic documentação.

nota
Você pode usar os prompts do sistema com Anthropic Claude versão 2.1 ou superior.
stop_sequences — (Opcional) Sequências de texto personalizadas que fazem com que o modelo pare de gerar. Anthropic Claude os modelos normalmente param quando completam naturalmente seu turno; nesse caso, o valor do campo de stop_reason resposta éend_turn. Se quiser que o modelo deixe de ser gerado ao encontrar strings de texto personalizadas, você poderá usar o parâmetro stop_sequences. Se o modelo encontrar uma das strings de texto personalizadas, o valor do campo de resposta stop_reason será stop_sequence e o valor de stop_sequence conterá a sequência de parada correspondente.

O número máximo de entradas é 8.191.

temperature: (opcional) a aleatoriedade injetada na resposta.

Padrão	Mínimo	Máximo
1	0	1

top_p: (opcional) use amostragem de núcleo.

Padrão	Mínimo	Máximo
0,999	0	1

top_k: (opcional) somente um exemplo das opções K principais para cada token subsequente.

Use top_k para remover respostas de baixa probabilidade de cauda longa.

Padrão	Mínimo	Máximo
Desabilitado por padrão.	0	500

tools: (opcional) definições de ferramentas que o modelo pode usar.

nota

Requer um Anthropic Claude Modelo 3.

Você pode passar os seguintes tipos de ferramenta:

Personalizada

Definição de uma ferramenta personalizada.

(opcional) type: o tipo da ferramenta. Se definido, use o valor custom.
name: o nome da ferramenta.
description: (opcional, mas altamente recomendado) a descrição da ferramenta.
input_schema: o esquema JSON da ferramenta.

Computação

Definição da ferramenta de computação usada por você com a API Computer Use.

type: o valor deve ser computer_20250212.
name: o valor deve ser computer.

(Obrigatório) display_height_px: a altura da tela que está sendo controlada pelo modelo, em pixels.

Padrão	Mínimo	Máximo
Nenhum	1	Sem máximo

(Obrigatório) display_width_px: a largura da tela que está sendo controlada pelo modelo, em pixels.

Padrão	Mínimo	Máximo
Nenhum	1	Sem máximo

Padrão	Mínimo	Máximo
Nenhum	0	N

bash

Definição da ferramenta de bash usada por você com a API Computer Use.

(opcional) type: o valor deve ser bash_20250124.
name: o valor deve ser bash.

text editor

Definição da ferramenta de edição de texto usada por você com a API Computer Use.

(opcional) type: o valor deve ser text_editor_20250124.
name: o valor deve ser str_replace_editor.

tool_choice — (Opcional) Especifica como o modelo deve usar as ferramentas fornecidas. O modelo pode usar uma ferramenta específica, qualquer ferramenta disponível ou decidir por conta própria.

nota
Requer um Anthropic Claude Modelo 3.
- type: o tipo de opção de ferramenta. Os valores possíveis são any (use qualquer ferramenta disponível), auto (o modelo decide) e tool (use a ferramenta especificada).
- name: (opcional) o nome da ferramenta a ser usada. Obrigatório se você especificar tool no campo type.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Anthropic Claude Modelos da

Anthropic Claude API Text Completions do da

Nesta página

Selecione suas preferências de cookies

Personalizar preferências de cookies

Essenciais

Desempenho

Funcionais

Publicidade

Não foi possível salvar as preferências de cookie

NOVO Anthropic Claude 3.7 Soneto

Tópicos

Uso de ferramentas com raciocínio

dica

Uso atualizado do computador (beta)

Atenção

Blocos de pensamento

Atenção

Atenção

Solicitação e reposta

nota

nota

Personalizada

Computação

bash

text editor

nota

nota

nota

Personalizada

Computação

bash

text editor

nota

Nesta página

Related resources

Esta página foi útil?

Related resources

Próximo tópico:

Tópico anterior:

Precisa de ajuda?