Verwenden einer Eingabemanifestdatei - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden einer Eingabemanifestdatei

Jede Zeile in einer Eingabemanifestdatei ist ein Eintrag, der ein Objekt oder eine Referenz auf ein Objekt enthält, das beschriftet werden soll. Ein Eintrag kann auch Bezeichnungen aus früheren Aufträgen und bei einigen Aufgabentypen zusätzliche Informationen enthalten.

Eingabedaten und die Manifestdatei müssen in Amazon Simple Storage Service (Amazon S3) gespeichert werden. Jeder verfügt über spezifische Speicher- und Zugriffsanforderungen, und zwar wie folgt:

  • Der Amazon S3 S3-Bucket, der die Eingabedaten enthält, muss sich in derselben AWS Region befinden, in der Sie Amazon SageMaker Ground Truth ausführen. Sie müssen Amazon SageMaker Zugriff auf die im Amazon S3-Bucket gespeicherten Daten gewähren, damit Amazon sie lesen kann. Weitere Informationen zu Amazon-S3-Buckets finden Sie unter Arbeiten mit Amazon-S3-Buckets.

  • Die Manifestdatei muss sich in derselben AWS Region wie die Datendateien befinden, sie muss sich jedoch nicht am selben Speicherort wie die Datendateien befinden. Es kann in jedem Amazon S3 S3-Bucket gespeichert werden, auf den die Rolle AWS Identity and Access Management (IAM) zugreifen kann, die Sie Ground Truth zugewiesen haben, als Sie den Labeling-Job erstellt haben.

Anmerkung

Für die Aufgabentypen 3D-Punktwolke und Video-Frame gelten unterschiedliche Anforderungen und Attribute für das Eingabemanifest.

Informationen zu 3D-Punktwolken-Aufgabentypen finden Sie unter Erstellen einer Eingabemanifestdatei für einen 3D-Punktwolken-Kennzeichnungsauftrag.

Informationen zu Video-Frame-Aufgabentypen finden Sie unter Erstellen einer Videoframe-Eingangsmanifestdatei.

Das Manifest ist eine mit UTF -8 kodierte Datei, in der jede Zeile ein vollständiges und gültiges JSON Objekt darstellt. Jede Zeile wird durch einen Standardzeilenumbruch getrennt, \n oder \r\n. Da es sich bei jeder Zeile um ein gültiges JSON Objekt handeln muss, sind Zeilenumbruchzeichen ohne Escape-Zeichen nicht zulässig. Weitere Informationen zum Datenformat finden Sie unter JSONLinien.

Jedes JSON Objekt in der Manifestdatei darf nicht länger als 100.000 Zeichen sein. Kein einzelnes Attribut innerhalb eines Objekts darf größer als 20.000 Zeichen sein. Attributnamen können nicht mit $ (Dollarzeichen) beginnen.

Jedes JSON Objekt in der Manifestdatei muss einen der folgenden Schlüssel enthalten: source-ref odersource. Der Wert der Schlüssel wird wie folgt festgelegt:

  • source-ref – Die Quelle des Objekts ist das im Wert angegebene Amazon-S3-Objekt. Verwenden Sie diesen Wert, wenn es sich bei dem Objekt um ein binäres Objekt handelt, z. B. ein Bild.

  • source – Die Quelle des Objekts ist der Wert. Verwenden Sie diesen Wert, wenn das Objekt ein Textwert ist.

Nachfolgend finden Sie ein Beispiel einer Manifestdatei für Dateien, die in einem Amazon-S3-Bucket gespeichert sind:

{"source-ref": "S3 bucket location 1"} {"source-ref": "S3 bucket location 2"} ... {"source-ref": "S3 bucket location n"}

Sie verwenden den Schlüssel source-ref für Bilddateien für Begrenzungsrahmen, Bildklassifizierung (Single- und Multi-Label), semantische SegmentierungsLabeling-Aufgaben und Videoclips für Kennzeichnungsaufträge zur Videoklassifizierung. 3D-Punktwolken- und Videoframe-Kennzeichnungsaufträge verwenden ebenfalls den Schlüssel source-ref, aber für diese Kennzeichnungsaufträge sind zusätzliche Informationen in der Eingabemanifestdatei erforderlich. Weitere Informationen finden Sie unter 3D-Punktwolkeneingabedaten und Videoframe-Eingabedaten.

Im Folgenden finden Sie ein Beispiel für eine Manifestdatei mit den Eingabedaten, die im Manifest gespeichert sind:

{"source": "Lorem ipsum dolor sit amet"} {"source": "consectetur adipiscing elit"} ... {"source": "mollit anim id est laborum"}

Sie verwenden den source-Schlüssel für Single- und Multi-Label-Labeling-Aufgaben für Textklassifizierung und benannte Entitätserkennung, wenn der Text, den Sie kennzeichnen möchten, direkt in der Eingabemanifestdatei aufgelistet wird.

Sie können auch andere Schlüssel-Wert-Paare in der Manifestdatei einschließen. Diese werden unverändert an die Ausgabedatei weitergeleitet. Dies ist nützlich, wenn Sie Informationen zwischen Ihren Anwendungen übertragen möchten. Weitere Informationen finden Sie unter Ausgabedaten.