As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Tutoriais de caderno de avaliação de modelos
Esta seção fornece os seguintes tutoriais do caderno, incluindo exemplos de código e explicações:
-
Como avaliar um JumpStart modelo para estereotipagem imediata.
-
Como avaliar um modelo do Amazon Bedrock para precisão de resumo de texto.
Tópicos
Cadernos adicionais
O GitHub diretório fmeval
-
bedrock-claude-factual-knowledge.ipnyb
— Avalia um modelo Anthropic Claude 2 hospedado no Amazon Bedrock para obter conhecimento factual. -
byo-model-outputs.ipynb
— Avalia um modelo Falcon 7b hospedado JumpStart para conhecimento factual, onde você traz suas próprias saídas de modelo em vez de enviar solicitações de inferência para seu modelo. -
custom_model_runner_chat_gpt.ipnyb
: Avalia um modelo personalizado do ChatGPT 3.5
hospedado emHugging Face
para conhecimento fatual.