Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Notebook-Tutorials zur Modellevaluierung
Dieser Abschnitt enthält die folgenden Notebook-Tutorials, die Beispielcode und Erklärungen enthalten:
-
So evaluieren Sie ein JumpStart Modell im Hinblick auf schnelle Stereotypisierung.
-
So bewerten Sie ein Amazon Bedrock-Modell auf die Genauigkeit der Textzusammenfassung.
Themen
Zusätzliche Notizbücher
Das GitHub Verzeichnis fmeval
-
bedrock-claude-factual-knowledge.ipnyb
— Evaluiert ein anthropisches Claude 2-Modell , das auf Amazon Bedrock gehostet wird, auf Faktenwissen. -
byo-model-outputs.ipynb
— Evaluiert ein auf Faktenwissen gehostetes Falcon 7b-Modell, bei dem Sie Ihre eigenen Modellergebnisse einbringen, JumpStart anstatt Inferenzanfragen an Ihr Modell zu senden. -
custom_model_runner_chat_gpt.ipnyb — Evaluiert ein benutzerdefiniertes Modell, auf dem Faktenwissen
gehostet wird. ChatGPT 3.5
Hugging Face