As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Tutoriais do caderno de avaliação de modelos
Esta seção fornece os seguintes tutoriais do notebook, que incluem exemplos de código e explicações:
-
Como avaliar um JumpStart modelo para estereotipagem imediata.
-
Como avaliar a precisão do resumo do texto em um modelo Amazon Bedrock.
Tópicos
Cadernos adicionais
O GitHub diretório fmeval
-
bedrock-claude-factual-knowledge.ipnyb
— Avalia um modelo Anthropic Claude 2 hospedado no Amazon Bedrock para obter conhecimento factual. -
byo-model-outputs.ipynb
— Avalia um modelo Falcon 7b hospedado JumpStart para conhecimento factual, onde você traz suas próprias saídas de modelo em vez de enviar solicitações de inferência para seu modelo. -
custom_model_runner_chat_gpt.ipnyb
— Avalia um modelo personalizado hospedado em busca de conhecimento factual. ChatGPT 3.5
Hugging Face