Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Details zu den Testergebnissen in Test Workbench
Die Testergebnisse zeigen die Details des Testsatzes, die verwendeten Absichten und die verwendeten Steckplätze. Es enthält auch die gesamte Aufschlüsselung der Testset-Eingaben, einschließlich der Gesamtergebnisse, der Konversationsergebnisse, der Absicht und der Slot-Ergebnisse.
Die Testergebnisse umfassen alle testbezogenen Informationen wie:
-
Metadaten der Testdetails
-
Ergebnisse insgesamt
-
Ergebnisse der Konversation
-
Absicht und Slot-Ergebnisse
-
Detaillierte Ergebnisse
Registerkarte „Gesamtergebnisse“:
Aufschlüsselung der Testset-Eingaben — Dieses Diagramm zeigt die Aufschlüsselung der Anzahl der Konversationen und der einzelnen Eingabeäußerungen im Testset.
Aufschlüsselung nach einzelnen Eingaben — Zeigt zwei Diagramme an, die end-to-end Konversationen und Sprachtranskriptionen enthalten. Die Anzahl der erfolgreichen und fehlgeschlagenen Eingaben ist in jeder Tabelle angegeben. Hinweis: Die Sprachtranskriptionstabelle ist nur für das Audiotest-Set sichtbar.
Aufschlüsselung der Konversation — Zeigt zwei Diagramme an, die end-to-end Konversationen und Sprachtranskriptionen enthalten. Die Anzahl der erfolgreichen und fehlgeschlagenen Eingaben wird in jedem Diagramm angegeben. Hinweis: Die Sprachtranskriptionstabelle ist nur für das Audiotest-Set sichtbar.
Registerkarte mit Konversationsergebnissen:
Erfolgsquoten für Konversationen — Anhand der Tabelle mit den Erfolgsquoten für Konversationen wird ermittelt, welche Absichten und Zeitpunkte in den einzelnen Konversationen im Testsatz verwendet wurden. Sie können visualisieren, wo die Konversation gescheitert ist, indem Sie überprüfen, welche Absicht oder welcher Slot fehlgeschlagen ist, sowie den Prozentsatz, in dem die Konversation bestanden hat.
Messwerte für fehlgeschlagene Konversationsabsichten — Diese Metrik zeigt die fünf Intentionen mit der schlechtesten Leistung im Testset. In diesem Bereich wird anhand der Konversationsprotokolle oder der Transkription des Bots grafisch dargestellt, wie viel Prozent oder wie viele Intents erfolgreich waren oder nicht. Eine erfolgreiche Absicht bedeutet nicht, dass die gesamte Konversation erfolgreich war. Diese Kennzahlen beziehen sich nur auf den Wert der Absichten, unabhängig davon, welche Absicht davor oder danach kam.
Metriken zum Ausfall von Konversationsslots — Diese Metrik zeigt die fünf Slots mit der schlechtesten Leistung im Testsatz. Zeigt die Erfolgsquote für jeden Slot im Intent an. Das Balkendiagramm zeigt sowohl die Sprachtranskription als auch die end-to-end Konversationen für jeden Slot in der Absicht.
Registerkarte „Absicht“ und „Slot-Ergebnisse“:
Kennzahlen zur Absichtserkennung — Zeigt in einer Tabelle an, wie viele Absichten erfolgreich erkannt wurden. Zeigt die Erfolgsquote der Sprachtranskription und end-to-end der Konversationen an.
Metriken zur Slot-Auflösung — Zeigt die Absichten und Slots getrennt an sowie die Erfolgs- und Misserfolgsrate jedes Slots für jede Absicht, die in der Konversation oder einzelnen Eingabe verwendet wurde. Zeigt die Erfolgsquote der Sprachtranskription und end-to-end der Konversationen an.
Registerkarte mit detaillierten Ergebnissen:
Detaillierte Ergebnisse — Zeigt eine detaillierte Tabelle im Konversationsprotokoll mit den Äußerungen von Benutzern und Agenten sowie der erwarteten Ausgabe und der erwarteten Transkription für jeden Slot an. Sie können diesen Bericht herunterladen, indem Sie auf die Schaltfläche Herunterladen klicken.
In der folgenden Tabelle sind die Fehlermeldungen mit den entsprechenden Szenarien aufgeführt.
Szenario | Fehlermeldung | Aktion |
---|---|---|
Absicht stimmt nicht überein | Erwartete BookFlight Absicht, aber es war BookHotel Absicht. | Überspringe andere Runden in der Konversation |
Slot-Elicitation stimmt nicht überein | Es wurde erwartet, dass der departureDate Slot ausgelöst wurde, aber das war der Fall. cabinType | Überspringe andere Runden in der Konversation |
Die Slot-Werte stimmen nicht überein | Nichtübereinstimmung zwischen dem erwarteten und dem tatsächlichen Slot-Wert. | Fahren Sie mit anderen Runden in den Konversationen fort |
Back-to-back Die Agenten-Eingabeaufforderung fehlt | Es wurde erwartet, dass der Bot in diesem Zug eine Agentenaufforderung zurückgibt, aber sie wurde nicht empfangen. | Überspringe andere Runden in der Konversation |
Die Transkription stimmt nicht überein | Die erwartete Transkription stimmte nicht mit der tatsächlichen Transkription überein. | Fahren Sie mit anderen Runden in den Konversationen fort |
Optionaler Slot wurde nicht ausgelöst | Es wird erwartet, dass der cabinType Slot in der nächsten Runde freigeschaltet wird, die aktuelle Absicht wurde jedoch zuvor erfüllt. | Überspringe andere Runden in der Konversation |
Steckplatz wurde nicht erkannt | Der erwartete departureDate Steckplatz wurde in dieser Runde nicht erkannt. | Überspringe andere Runden in der Konversation |
Zusätzliche back-to-back Agentenaufforderung | Es wurde erwartet, dass ein Benutzer an der Reihe war, aber es war eine Aufforderung durch einen | Überspringe andere Runden in der Konversation |