Erstellung der Funktion zur Konsolidierung von Anmerkungen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellung der Funktion zur Konsolidierung von Anmerkungen

Sie können auf Wunsch Ihre eigene Anmerkungskonsolidierungsfunktion verwenden, um die endgültigen Kennzeichnungen für die gekennzeichneten Objekte zu bestimmen. Es gibt viele mögliche Ansätze zum Schreiben einer Funktion, und der von Ihnen gewählte Ansatz hängt von der Art der Anmerkungen ab, die zu konsolidieren sind. Grob gesagt sollten Konsolidierungsfunktionen die Anmerkungen von Workern betrachten, die zwischen ihnen bestehende Ähnlichkeit messen und dann durch eine Art probabilistische Beurteilung bestimmen, was die wahrscheinlichste Kennzeichnung sein sollte.

Wenn Sie andere Algorithmen zum Erstellen von Anmerkungskonsolidierungsfunktionen verwenden möchten, finden Sie die Reaktionen von Workern im [project-name]/annotations/worker-response-Ordner des Amazon–S3-Buckets, in den Sie die Auftragsausgabe leiten.

Beurteilen Sie Ähnlichkeit

Zum Beurteilen der Ähnlichkeit zwischen Kennzeichnungen können Sie eine der folgenden Strategien verwenden oder eine Strategie, die Ihren Daten-Labeling-Anforderungen entspricht:

  • Für Kennzeichnungsbereiche, die aus separaten, sich gegenseitig ausschließenden Kategorien bestehen (wie die Mehrklassen-Klassifizierung), kann sich die Ähnlichkeitsbeurteilung als recht unkompliziert erweisen. Einzelne Kennzeichnungen stimmen entweder überein oder nicht.

  • Für Kennzeichnungsbereiche ohne klar abgegrenzte Werte (wie Begrenzungsrahmen-Anmerkungen) muss ein breiteres Maß für die Ähnlichkeit gefunden werden. Im Fall von Begrenzungsrahmen ist der Jaccard-Koeffizient ein solches Maß. Damit wird das Verhältnis zwischen der Schnittmenge zweier Begrenzungsrahmen und der Vereinigungsmenge der Begrenzungsrahmen ermittelt, um zu beurteilen, wie ähnlich sie sind. Beispiel: Bei drei Anmerkungen kann anhand einer Funktion bestimmt werden, welche Anmerkungen dasselbe Objekt darstellen und konsolidiert werden können.

Beurteilen Sie das wahrscheinlichste Etikett

Nehmen Sie anhand der in den vorherigen Abschnitten erläuterten Strategien eine probabilistische Beurteilung vor, um zu bestimmen, welche konsolidierte Kennzeichnung verwendet werden sollte. Im Falle separater, sich gegenseitig ausschließender Kategorien kann sich das als recht unkompliziert erweisen. Eine der gängigsten Methoden hierfür besteht in der Betrachtung der Ergebnisse eines Mehrheitsbeschlusses zwischen den Anmerkungen. Dabei werden die Anmerkungen gleich gewichtet.

Bei einigen Ansätzen wird versucht, die Genauigkeit unterschiedlicher Ersteller von Anmerkungen abzuschätzen und deren Anmerkungen in Relation zur Korrektheitswahrscheinlichkeit zu gewichten. Ein Beispiel dafür ist die Expectation Maximization Methode, die in der Standard-Ground-Truth-Konsolidierungsfunktion für mehrklassige Anmerkungen verwendet wird.

Weitere Informationen zur Erstellung einer Anmerkungskonsolidierungsfunktion finden Sie unter Verarbeitung mit AWS Lambda.