Automatisieren Sie die Dateneinrichtung für Labeling-Jobs - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Automatisieren Sie die Dateneinrichtung für Labeling-Jobs

Sie können die automatisierte Dateneinrichtung verwenden, um Manifestdateien für Ihre Kennzeichnungsaufträge in der Ground-Truth-Konsole mithilfe von Bildern, Videos, Video-Frames, Textdateien (.txt) und Dateien mit durch Kommas getrennten Werten (.csv) zu erstellen, die in Amazon S3 gespeichert sind. Wenn Sie die automatisierte Dateneinrichtung verwenden, geben Sie einen Amazon-S3-Speicherort an, an dem Ihre Eingabedaten gespeichert werden, und den Eingabedatentyp. Ground Truth sucht dann an dem von Ihnen angegebenen Speicherort nach den Dateien, die diesem Typ entsprechen.

Anmerkung

Ground Truth verwendet keinen AWS KMS Schlüssel, um auf Ihre Eingabedaten zuzugreifen oder die Eingabemanifestdatei in den von Ihnen angegebenen Amazon S3 S3-Speicherort zu schreiben. Der Benutzer oder die Rolle, die den Kennzeichnungsauftrag erstellt, muss über Zugriffsberechtigungen für Ihre Eingabedatenobjekte in Amazon S3 verfügen.

Stellen Sie vor dem folgenden Verfahren sicher, dass die Eingabebilder oder -dateien korrekt formatiert sind:

  • Bilddateien – Bilddateien müssen die Größen- und Auflösungsgrenzen erfüllen, die in den Tabellen unter Größenkontingent für Eingabedateien aufgeführt sind.

  • Textdateien – Textdaten können in einer oder mehreren TXT-Dateien gespeichert werden. Jedes Element, das gekennzeichnet werden soll, muss durch einen Standardzeilenumbruch getrennt werden.

  • CSVDateien — Textdaten können in einer oder mehreren CSV-Dateien gespeichert werden. Jedes Element, das gekennzeichnet werden soll, muss sich in einer separaten Zeile befinden.

  • Videos – Videodateien können eines der folgenden Formate haben: .mp4, .ogg und .webm. Informationen zum Extrahieren von Video-Frames aus Ihren Videodateien zur Objekterkennung oder Objektverfolgung finden Sie unter Videodateien zur Verfügung stellen.

  • Video-Frames – Video-Frames sind Bilder, die aus Videos extrahiert wurden. Alle aus einem einzelnen Video extrahierten Bilder werden als Sequenz von Video-Frames bezeichnet. Jede Sequenz von Video-Frames muss in Amazon S3 eindeutige Präfixschlüssel haben. Siehe Stellen Sie Videoframes bereit. Informationen zu diesem Datentyp finden Sie unter Richten Sie automatische Videoframe-Eingabedaten ein.

Wichtig

Informationen zur Erkennung von Video-Frame-Objekten und für Kennzeichnungsaufträge zur Video-Frame-Objekterkennung finden Sie unter Richten Sie automatische Videoframe-Eingabedaten ein. Hier erfahren Sie, wie Sie die automatisierte Dateneinrichtung verwenden.

Verwenden Sie diese Anweisungen, um Ihre Eingabedatensatz-Verbindung mit Ground Truth automatisch einzurichten.

Automatisches Verbinden Ihrer Daten in Amazon S3 mit Ground Truth
  1. Navigieren Sie in der SageMaker Amazon-Konsole unter zur Seite „Labeling-Job erstellen https://console.aws.amazon.com/sagemaker/“.

    Über diesen Link gelangen Sie in die Region North Virginia (US-East-1) AWS . Wenn sich Ihre Eingabedaten in einem Amazon-S3-Bucket in einer anderen Region befinden, wechseln Sie in diese Region. Um Ihre AWS Region zu ändern, wählen Sie in der Navigationsleiste den Namen der aktuell angezeigten Region aus.

  2. Wählen Sie Beschriftungsauftrag erstellen aus.

  3. Geben Sie einen Auftragsnamen ein.

  4. Wählen Sie im Abschnitt Einrichtung der Eingabedaten die Option Automatisierte Dateneinrichtung aus.

  5. Geben Sie einen Amazon S3 URI for S3-Speicherort für Eingabedatensätze ein.

  6. Geben Sie Ihren S3-Standort für Ausgabedatensätze an. Dies ist der Ort, an dem Ihre Ausgabedaten gespeichert werden.

  7. Wählen Sie Ihren Datentyp mithilfe der Dropdown-Liste aus.

  8. Verwenden Sie das Dropdownmenü unter IAMRolle, um eine Ausführungsrolle auszuwählen. Wenn Sie Eine neue Rolle erstellen auswählen, geben Sie die Amazon-S3-Buckets an, auf die Sie dieser Rolle Zugriff gewähren möchten. Diese Rolle muss über die Zugriffsberechtigung für die S3-Buckets verfügen, die Sie in den Schritten 5 und 6 angegeben haben.

  9. Wählen Sie Dateneinrichtung fertigstellen aus.

Dadurch wird ein Eingabemanifest am Amazon-S3-Speicherort für Eingabedatensätze erstellt, die Sie in Schritt 5 angegeben haben. Wenn Sie einen Label-Job mit SageMaker API oder, AWS CLI oder an erstellen AWS SDK, verwenden Sie Amazon S3 URI für diese Eingabe-Manifestdatei als Eingabe für den ParameterManifestS3Uri.

Im Folgenden GIF wird gezeigt, wie die automatische Dateneinrichtung für Bilddaten verwendet wird. In diesem Beispiel wird eine Datei dataset-YYMMDDTHHMMSS.manifest im Amazon-S3-Bucket example-groundtruth-images erstellt, wobei YYMMDDTHHmmSS das Jahr (YY), den Monat (MM), den Tag (DD) und die Uhrzeit in Stunden (HH), Minuten (mm) und Sekunden (ss) angibt, zu der die Eingabemanifestdatei erstellt wurde.

GIFzeigt, wie die automatische Dateneinrichtung für Bilddaten verwendet wird.