Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Abhängig von der Art des von Ihnen erstellten Kennzeichnungsauftrags sendet Amazon SageMaker Ground Truth Datenobjekte stapelweise oder im Streaming-Modus an Mitarbeiter. Sie können den Fluss von Datenobjekten an Worker wie folgt steuern:
-
Bei beiden Arten von Kennzeichnungsaufträgen können Sie mit
MaxConcurrentTaskCount
die Gesamtzahl der Datenobjekte steuern, die allen Workern zu einem bestimmten Zeitpunkt, zu dem der Kennzeichnungsauftrag ausgeführt wird, zur Verfügung stehen. -
Bei Streaming-Kennzeichnungsaufträgen können Sie den Fluss von Datenobjekten an Worker steuern, indem Sie die Anzahl der Datenobjekte überwachen und kontrollieren, die an den Amazon SQS gesendet werden, der mit Ihrem Kennzeichnungsauftrag verknüpft ist.
In den folgenden Abschnitten erfahren Sie mehr über diese Optionen.
Themen
Wird verwendet MaxConcurrentTaskCount , um den Fluss von Datenobjekten zu steuern
MaxConcurrentTaskCount
definiert die maximale Anzahl von Datenobjekten, die gleichzeitig in der Aufgabenwarteschlange des Worker-Portals verfügbar sind. Wenn Sie die Konsole verwenden, ist dieser Parameter auf 1.000 festgelegt. Wenn Sie verwendenCreateLabelingJob
, können Sie diesen Parameter auf eine beliebige Ganzzahl zwischen 1 und 5.000 (einschließlich) setzen.
Verwenden Sie das folgende Beispiel, um besser zu verstehen, wie die Anzahl der Einträge in Ihrer Manifestdatei, die und die MaxConcurrentTaskCount
definierenNumberOfHumanWorkersPerDataObject
, welche Aufgaben Mitarbeitern in ihrer Aufgabenwarteschlange auf der Benutzeroberfläche des Worker-Portals angezeigt werden.
-
Sie haben eine Eingabe-Manifestdatei mit 600 Einträgen.
-
Für jeden Eintrag in Ihrer Eingabe-Manifestdatei können
NumberOfHumanWorkersPerDataObject
Sie die Anzahl der menschlichen Mitarbeiter definieren, die einen Eintrag aus Ihrer Eingabe-Manifestdatei kennzeichnen. In diesem Beispiel setzen Sie denNumberOfHumanWorkersPerDataObject
Wert auf 3. Dadurch werden 3 verschiedene Aufgaben für jeden Eintrag in Ihrer Eingabemanifestdatei erstellt. Außerdem müssen mindestens 3 verschiedene Worker das Objekt beschriften, um als erfolgreich markiert zu werden. Dadurch entstehen insgesamt 1.800 Aufgaben (600 x 3), die von den Mitarbeitern erledigt werden müssen. -
Sie möchten, dass Mitarbeiter in ihrer Warteschlange in der Benutzeroberfläche des Mitarbeiterportals jeweils nur 100 Aufgaben sehen. Zu diesem Zweck setzen Sie den
MaxConcurrentTaskCount
Wert auf 100. Ground Truth füllt dann die Aufgabenwarteschlange im Arbeiterportal mit 100 Aufgaben pro Mitarbeiter. -
Was als Nächstes passiert, hängt von der Art des Labeling-Jobs ab, den Sie erstellen, und davon, ob es sich um einen Streaming-Labeling-Job handelt.
-
Streaming-Labeling-Job: Solange die Gesamtzahl der Objekte, die Workern zur Verfügung stehen, gleich ist
MaxConcurrentTaskCount
, werden alle verbleibenden Datensatz-Objekte in Ihrer Eingabe-Manifestdatei, die Sie in Echtzeit mit Amazon SNS senden, in eine Amazon SQS SQS-Warteschlange gestellt. Wenn die Gesamtzahl der für Mitarbeiter verfügbaren Objekte unterMaxConcurrentTaskCount
minus fälltNumberOfHumanWorkersPerDataObject
, wird ein neues Datenobjekt aus der Warteschlange verwendet, umNumberOfHumanWorkersPerDataObject
-Aufgaben zu erstellen, die in Echtzeit an die Mitarbeiter gesendet werden. -
Kennzeichnungsauftrag ohne Streaming: Wenn Worker mit der Kennzeichnung einer Gruppe von Objekten fertig sind, werden bis zu
MaxConcurrentTaskCount
malNumberOfHumanWorkersPerDataObject
so viele neue Aufgaben an Worker gesendet. Dieser Vorgang wird wiederholt, bis alle Datenobjekte in der Eingabe-Manifestdatei gekennzeichnet sind.
-
Verwenden Sie Amazon SQS, um den Fluss von Datenobjekten zu Streaming-Labeling-Jobs zu steuern
Wenn Sie einen Streaming-Kennzeichnungsauftrag erstellen, wird in Ihrem Konto automatisch eine Amazon SQS-Warteschlange erstellt. Datenobjekte werden der Amazon SQS-Warteschlange nur hinzugefügt, wenn die Gesamtzahl der an Worker gesendeten Objekte über MaxConcurrentTaskCount
liegt. Andernfalls werden Objekte direkt an Worker gesendet.
Sie können diese Warteschlange zum Verwalten des Flusses von Datenobjekten zu Ihrem Kennzeichnungsauftrag verwenden. Weitere Informationen hierzu finden Sie unter Kennzeichnungsanfragen mit einer Amazon SQS SQS-Warteschlange verwalten.