

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Beobachtbarkeit der generativen KI
<a name="GenAI-observability"></a>

Mit Amazon CloudWatch können Sie generative KI-Workloads, einschließlich [Amazon AgentCore Bedrock-Agenten](https://aws.amazon.com/bedrock/agentcore/), beobachten und Einblicke in die Leistung, den Zustand und die Genauigkeit der KI gewinnen. CloudWatch bietet vorkonfigurierte Ansichten zu Latenz, Nutzung und Fehlern Ihrer KI-Workloads, sodass Sie Probleme in Komponenten wie Modellen und Agenten schneller erkennen können. End-to-endPrompt Tracing hilft Ihnen dabei, Probleme in Komponenten wie Wissensdatenbanken, Tools und Modellen schnell zu identifizieren. CloudWatchDie KI-Überwachungsfunktionen sind mit gängigen Frameworks zur generativen KI-Orchestrierung wie [AWS Strands](https://strandsagents.com/latest/), LangChain, kompatibel und LangGraph bieten Flexibilität bei der Wahl des Frameworks.

CloudWatch Die generative KI-Observability ermöglicht Ihnen:
+ Beurteilen Sie die Qualität und Genauigkeit von KI-Anwendungen in großem Maßstab durch automatisiertes Monitoring und reduzieren Sie den Bedarf an manueller Überprüfung, indem Sie Modellergebnisse, Kennzahlen zur Antwortqualität und Interaktionen mit Endbenutzern erfassen
+ Modellaufrufe, Agenten (verwaltet, selbst gehostet und von Drittanbietern), Wissensdatenbanken, den Integritätsschutz und Tools überwachen
+ Fortschritte von der Erprobung mit Agenten bis hin zur Produktion innovativer GenAI-Anwendungen machen und zugleich für überragende Qualität, Leistung und Zuverlässigkeit sorgen. Weitere Informationen finden Sie unter [Was ist Amazon Bedrock AgentCore](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/what-is-genesis.html)?
+ Identifizieren Sie Fehlerquellen schnell mithilfe von end-to-end Prompt-Tracing, kuratierten Metriken und Protokollen
+ [Beheben Sie Probleme in Ihrer gesamten GenAI-Anwendung und der zugrunde liegenden Infrastruktur und nutzen Sie dabei vorhandene CloudWatch Beobachtungstools wie [Anwendungssignale](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Application-Monitoring-Sections.html), [Alarme](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Alarms.html), [Dashboards](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html), den Schutz [sensibler](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/cloudwatch-logs-data-protection-policies.html) Daten und Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html)
+ Greifen Sie bei der Verwendung von Amazon Bedrock auf Prompt-Traces zu und senden Sie strukturierte Traces von Modellen von Drittanbietern an das ADOT CloudWatch SDK. [Informationen zum Hinzufügen von Observability zu Ihrem Amazon AgentCore Bedrock-Agenten oder -Tool finden Sie unter Amazon Bedrock AgentCore](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/what-is-genesis.html)

CloudWatch generative KI-Observability bietet zwei vorgefertigte Funktionen:

**Anmerkung**  
Sie können das **Model Invocation-Dashboard** verwenden, indem Sie beliebige Modelle für Inferenz in Amazon Bedrock verwenden.
+ **Model Invocations** — Detailliertes Metrik-Dashboard zur Modellnutzung und zum Token-Verbrauch sowie eine kuratierte Tabelle mit Aufruf-Logs, um detaillierte Eingabe- und Ausgabeinhalte von Modellinferenzen einzusehen
+ **Amazon AgentCore Bedrock-Agenten** — Leistungs- und Entscheidungsmetriken für Primitive von Amazon Bedrock AgentCore wie Agenten, Arbeitsspeicher, integrierte Tools, Gateways und Identität

Zu den wichtigsten in diesen Dashboards verfügbaren Metriken zählen:
+ Gesamtzahl und durchschnittliche Aufrufe
+ Token-Nutzung (gesamt, Durchschnitt pro Abfrage, Eingabe, Ausgabe)
+ Latenz (durchschnittlich, P90, P99)
+ Fehlerraten und Ereignisse, die zur Drosselung führen
+ Kostenzuweisung nach Anwendung, Benutzerrolle oder spezifischem Benutzer

**Topics**
+ [Modellaufrufe](model-invocations.md)
+ [Amazon Grundgestein AgentCore](AgentCore-Agents.md)