Konsolidierung von Anmerkungen - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Konsolidierung von Anmerkungen

Eine Anmerkung ist das Ergebnis der Labeling-Aufgabe eines einzelnen Workers. Mit der Anmerkungskonsolidierung werden die Anmerkungen von zwei oder mehr Workern zu einer einzigen Kennzeichnung für Ihre Datenobjekte kombiniert. Eine Kennzeichnung, die jedem Objekt im Datensatz zugewiesen wird, ist eine probabilistische Schätzung dessen, was die wahre Kennzeichnung sein soll. Jedes Objekt im Datensatz hat in der Regel mehrere Anmerkungen, aber nur eine Kennzeichnung oder nur einen Satz von Kennzeichnungen.

Sie können entscheiden, wie viele Worker die einzelnen Objekte in Ihrem Datensatz mit Anmerkungen versehen sollen. Durch den Einsatz von mehr Workern lässt sich die Genauigkeit Ihrer Kennzeichnungen erhöhen, dies führt aber auch zu einem Anstieg der Kosten für die Kennzeichnung. Weitere Informationen zu den Preisen von Ground Truth finden Sie unter Amazon SageMaker Ground Truth — Preise.

Wenn Sie die Amazon SageMaker AI-Konsole verwenden, um einen Labeling-Job zu erstellen, sind die folgenden Standardwerte für die Anzahl der Worker, die Objekte kommentieren können:

  • Textklassifizierung – 3 Worker

  • Bildklassifizierung – 3 Worker

  • Begrenzungsrahmen – 5 Worker

  • Semantische Segmentierung – 3 Worker

  • Erkennung benannter Entitäten – 3 Worker

Mit der Operation CreateLabelingJob legen Sie die Anzahl der Auftragnehmer, die jedes Datenobjekt mit Anmerkungen versehen sollen, mit dem Parameter NumberOfHumanWorkersPerDataObject fest. Sie können die Standardanzahl der für das Versehen eines Datenobjekts mit Anmerkungen eingesetzten Auftragnehmer über die Konsole oder mithilfe der Operation CreateLabelingJob überschreiben.

Ground Truth bietet eine Anmerkungskonsolidierungsfunktion für jede der vordefinierten Labeling-Aufgaben: Begrenzungsrahmen, Namensentitätenerkennung, Bildklassifizierung, semantische Segmentierung und Textklassifizierung. Dies sind die Funktionen:

  • Bei der Mehrklassen-Anmerkungskonsolidierung für die Bild- und Textklassifizierung wird eine Variante des Expectation Maximization-Ansatzes für Anmerkungen verwendet. Sie schätzt Parameter für jeden Worker und nutzt Bayessche Inferenz zum Schätzen der echten Klasse auf Basis der Klassenanmerkungen einzelner Worker.

  • Bei den Begrenzungsrahmen-Anmerkungen findet eine Konsolidierung der Begrenzungsrahmen mehrerer Worker statt. Diese Funktion findet die ähnlichsten Begrenzungsrahmen unter denen unterschiedlicher Worker basierend auf dem Jaccard-Koeffizienten (Schnittmenge über Vereinigungsmenge, Intersection over Union (IoU)) der Begrenzungsrahmen und mittelt sie.

  • Bei der Anmerkungskonsolidierung für die semantische Segmentierung wird jedes Pixel in einem einzigen Bild als Mehrklassen-Klassifizierung behandelt. Pixelanmerkungen von Workern werden als „Stimmen“ betrachtet und zusätzliche Informationen aus umgebenden Pixeln werden durch Anwendung einer Glättungsfunktion auf das Bild integriert.

  • Die Funktion zur Erkennung benannter Entitäten clustert ausgewählten Text nach Jaccard-Ähnlichkeit und berechnet Auswahlgrenzen basierend auf dem Modus bzw. auf dem Median, wenn der Modus nicht eindeutig ist. Die Bezeichnung wird zur am häufigsten zugewiesenen Entity-Bezeichnung im Cluster aufgelöst. Dadurch werden Bindungen durch zufällige Auswahl aufgebrochen.

Sie können andere Algorithmen verwenden, um Anmerkungen zu konsolidieren. Weitere Informationen finden Sie unter Erstellung der Funktion zur Konsolidierung von Anmerkungen.