Daten an einen Streaming-Labeling-Job senden - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Daten an einen Streaming-Labeling-Job senden

Sie können optional einmalig Eingabedaten an einen Streaming-Kennzeichnungsauftrag senden, wenn Sie den Kennzeichnungsauftrag mithilfe einer Eingabemanifestdatei erstellen. Sobald der Labeling-Job gestartet wurde und der Status lautetInProgress, können Sie mithilfe Ihres SNS Amazon-Eingabethemas und der Amazon S3-Ereignisbenachrichtigungen in Echtzeit neue Datenobjekte für Ihren Labeling-Job einreichen.

Reichen Sie Datenobjekte ein, wenn Sie den Kennzeichnungsauftrag starten (einmalig):

  • Eine Eingabe-Manifestdatei verwenden — Sie können optional eine Eingabe-Manifestdatei angeben, URI in der Amazon S3 gespeichert istManifestS3Uri, wenn Sie den Streaming-Labeling-Job erstellen. Ground Truth sendet jedes Datenobjekt in der Manifestdatei zur Kennzeichnung an die Mitarbeiter, sobald der Kennzeichnungsauftrag gestartet wird. Weitere Informationen hierzu finden Sie unter Erstellen Sie eine Manifestdatei (optional).

    Nachdem Sie eine Anforderung zur Erstellung des Streaming-Kennzeichnungsauftrags abgesendet haben, lautet der Status Initializing. Sobald der Kennzeichnungsauftrag aktiv ist, ändert sich der Status in InProgress. Sie können dann Echtzeitoptionen verwenden, um zusätzliche Datenobjekte zur Kennzeichnung zu senden.

Datenobjekte in Echtzeit senden:

  • Datenobjekte mithilfe von SNS Amazon-Nachrichten senden — Sie können Ground Truth neue Datenobjekte zur Kennzeichnung senden, indem Sie eine SNS Amazon-Nachricht senden. Sie senden diese Nachricht an ein SNS Amazon-Eingabethema, das Sie bei der Erstellung Ihres Streaming-Labeling-Jobs erstellen und angeben. Weitere Informationen finden Sie unter Datenobjekte mit Amazon senden SNS.

  • Datenobjekte senden, indem Sie sie in einem Amazon-S3-Bucket platzieren – Jedes Mal, wenn Sie einem Amazon-S3-Bucket ein neues Datenobjekt hinzufügen, können Sie Ground Truth auffordern, dieses Objekt zur Kennzeichnung zu verarbeiten. Dazu fügen Sie dem Bucket eine Ereignisbenachrichtigung hinzu, sodass Ihr SNS Amazon-Eingabethema jedes Mal benachrichtigt wird, wenn ein neues Objekt zu diesem Bucket hinzugefügt (oder in diesem erstellt) wird. Weitere Informationen finden Sie unter Datenobjekte mit Amazon S3 senden. Diese Option ist nicht für textbasierte Labeling-Aufgaben wie Textklassifizierung und Erkennung benannter Entitäten verfügbar.

    Wichtig

    Wenn Sie die Amazon-S3-Konfiguration verwenden, verwenden Sie nicht denselben Amazon-S3-Speicherort für Ihre Eingabedatenkonfiguration und Ihre Ausgabedaten. Sie geben das S3-Präfix für Ihre Ausgabedaten an, wenn Sie einen Kennzeichnungsauftrag erstellen.

Datenobjekte mit Amazon senden SNS

Mit Amazon Simple Notification Service (AmazonSNS) können Sie Datenobjekte an Ihren Streaming-Labeling-Job senden. Amazon SNS ist ein Webservice, der die Zustellung von Nachrichten an und von Endpunkten (z. B. eine E-Mail-Adresse oder AWS Lambda Funktion) koordiniert und verwaltet. Ein SNS Amazon-Thema fungiert als Kommunikationskanal zwischen zwei oder mehr Endpunkten. Sie verwenden Amazon, SNS um neue Datenobjekte zu dem Thema zu senden oder zu veröffentlichen, das im CreateLabelingJobParameter SnsTopicArn in angegeben istInputConfig. Das Format dieser Nachrichten entspricht dem einer einzelnen Zeile aus einer Eingabemanifestdatei.

Sie können beispielsweise einen Text an einen aktiven Kennzeichnungsauftrag der Textklassifizierung senden, indem Sie ihn in Ihrem Eingabethema veröffentlichen. Die von Ihnen veröffentlichte Nachricht könnte wie folgt aussehen:

{"source": "Lorem ipsum dolor sit amet"}

Um ein neues Bildobjekt an einen Kennzeichnungsauftrag der Bildklassifizierung zu senden, könnte Ihre Nachricht wie folgt aussehen:

{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
Anmerkung

Sie können Ihren Amazon-Nachrichten auch benutzerdefinierte Deduplizierungs IDs - und Deduplizierungsschlüssel hinzufügen. SNS Weitere Informationen hierzu finden Sie unter Behandlung doppelter Nachrichten.

Wenn Ground Truth Ihren Streaming-Labeling-Job erstellt, abonniert es Ihr SNS Amazon-Eingabethema.

Datenobjekte mit Amazon S3 senden

Sie können ein oder mehrere neue Datenobjekte an einen Streaming-Labeling-Job senden, indem Sie sie in einem Amazon S3 S3-Bucket platzieren, der mit einer SNS Amazon-Ereignisbenachrichtigung konfiguriert ist. Sie können ein Ereignis einrichten, um Ihr SNS Amazon-Eingabethema jedes Mal zu benachrichtigen, wenn ein neues Objekt in Ihrem Bucket erstellt wird. Sie müssen dasselbe SNS Amazon-Eingabethema im CreateLabelingJobParameter SnsTopicArn in angebenInputConfig.

Jedes Mal, wenn Sie einen Amazon S3 S3-Bucket so konfigurierenSNS, dass er Benachrichtigungen an Amazon sendet, veröffentlicht Ground Truth ein Testereignis"s3:TestEvent", um sicherzustellen, dass das Thema existiert und dass der Besitzer des angegebenen Amazon S3 S3-Buckets berechtigt ist, zu dem angegebenen Thema zu veröffentlichen. Es wird empfohlen, dass Sie Ihre Amazon S3-Verbindung mit Amazon einrichten, SNS bevor Sie einen Streaming-Labeling-Job starten. Wenn Sie dies nicht tun, kann dieses Testereignis als Datenobjekt registriert und zur Kennzeichnung an Ground Truth gesendet werden.

Wichtig

Wenn Sie die Amazon-S3-Konfiguration verwenden, verwenden Sie nicht denselben Amazon-S3-Speicherort für Ihre Eingabedatenkonfiguration und Ihre Ausgabedaten. Sie geben das S3-Präfix für Ihre Ausgabedaten an, wenn Sie einen Kennzeichnungsauftrag erstellen.

Für bildbasierte Labeling-Jobs verlangt Ground Truth, dass an alle S3-Buckets eine CORS Richtlinie angehängt ist. Weitere Informationen hierzu finden Sie unter CORSAnforderung für Eingabe-Bilddaten.

Sobald Sie Ihren Amazon S3 S3-Bucket konfiguriert und Ihren Labeling-Job erstellt haben, können Sie Objekte zu Ihrem Bucket hinzufügen und Ground Truth sendet dieses Objekt entweder an Mitarbeiter oder platziert es in Ihrer SQS Amazon-Warteschlange.

Weitere Informationen hierzu finden Sie unter Einrichten von Amazon-S3-Bucket-Ereignis-Benachrichtigungen.

Wichtig

Diese Option ist nicht für textbasierte Kennzeichnungsaufträge wie Textklassifizierung und Erkennung benannter Entitäten verfügbar.