Überblick über das Flywheel - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überblick über das Flywheel

Ein Flywheel ist eine Amazon Comprehend-Ressource, die das Training und die Auswertung neuer Versionen eines benutzerdefinierten Modells orchestriert. Sie können ein Flywheel erstellen, um ein vorhandenes trainiertes Modell zu verwenden, oder Amazon Comprehend kann ein neues Modell für das Flywheel erstellen und trainieren. Verwenden Sie Flywheels mit benutzerdefinierten Klartextmodellen für die benutzerdefinierte Klassifizierung oder die Erkennung benutzerdefinierter Entitäten.

Sie können Flywheels mithilfe der Amazon Comprehend-Konsole oder der API konfigurieren und verwalten. Sie können Flywheels auch mit konfigurierenAWS CloudFormation.

Wenn Sie ein Flywheel erstellen, erstellt Amazon Comprehend einen Data Lake in Ihrem Konto. Der Data Lake speichert und verwaltet alle Flywheel-Daten, z. B. die Trainingsdaten und Testdaten für alle Versionen des Modells.

Sie legen die aktive Modellversion als Version des Flywheel-Modells fest, das Sie für Inferenzaufträge oder Amazon Comprehend-Endpunkte verwenden möchten. Anfänglich enthält das Flywheel eine Version des Modells. Im Laufe der Zeit wählen Sie beim Trainieren neuer Modellversionen die leistungsstärkste Version aus, die die aktive Modellversion sein soll. Wenn ein Benutzer den Flywheel-ARN angibt, um einen Inferenzauftrag auszuführen, führt Amazon Comprehend den Auftrag mit der aktiven Modellversion des Flywheels aus.

In regelmäßigen Abständen erhalten Sie neue beschriftete Daten (Trainingsdaten oder Testdaten) für das Modell. Sie stellen dem Flywheel neue Daten zur Verfügung, indem Sie einen oder mehrere Datensätze erstellen. Ein Datensatz enthält Eingabedaten für das Training oder Testen des benutzerdefinierten Modells, das einem Flywheel zugeordnet ist. Amazon Comprehend lädt die Eingabedaten in den Data Lake des Flywheel hoch.

Um die neuen Datensätze in Ihr benutzerdefiniertes Modell zu integrieren, erstellen und führen Sie eine Flywheel-Iteration aus. Eine Flywheel-Iteration ist ein Workflow, der die neuen Datensätze verwendet, um die aktive Modellversion auszuwerten und eine neue Modellversion zu trainieren. Basierend auf den Metriken für die vorhandenen und neuen Modellversionen können Sie entscheiden, ob die neue Modellversion zur aktiven Version hochgestuft werden soll.

Sie können die aktive Modellversion des Flywheels verwenden, um benutzerdefinierte Analysen auszuführen (in Echtzeit oder asynchrone Aufträge). Um das Flywheel-Modell für die Echtzeitanalyse zu verwenden, müssen Sie einen Endpunkt für das Flywheel erstellen.

Für die Nutzung von Flywheels fallen keine zusätzlichen Gebühren an. Wenn Sie jedoch eine Flywheel-Iteration ausführen, fallen die Standardgebühren für das Training einer neuen Modellversion und das Speichern der Modelldaten an. Ausführliche Preisinformationen finden Sie unter Amazon Comprehend – Preise.

Flywheel-Datensätze

Um einem Flywheel neue beschriftete Daten hinzuzufügen, erstellen Sie einen Datensatz. Sie konfigurieren jeden Datensatz als Trainings- oder Testdaten. Sie verknüpfen den Datensatz mit einem bestimmten Flywheel und einem benutzerdefinierten Modell.

Nachdem Sie einen Datensatz erstellt haben, lädt Amazon Comprehend die Daten in den Data Lake des Flywheel hoch. Weitere Informationen finden Sie unter Flywheel-Data-Lakes.

Flywheel-Erstellung

Wenn Sie ein Flywheel erstellen, können Sie das Flywheel einem vorhandenen trainierten Modell zuordnen oder das Flywheel kann ein neues Modell erstellen.

Wenn Sie ein Flywheel mit einem vorhandenen Modell erstellen, geben Sie die aktive Modellversion an. Amazon Comprehend kopiert die Trainings- und Testdaten des Modells in den Data Lake des Flywheels. Stellen Sie sicher, dass die Modelltrainings- und Testdaten am selben Amazon S3-Speicherort vorhanden sind wie beim Erstellen des Modells.

Um ein Flywheel für ein neues Modell zu erstellen, stellen Sie einen Datensatz für Trainingsdaten (und einen optionalen Datensatz für Testdaten) bereit, wenn Sie das Flywheel erstellen. Wenn Sie das Flywheel ausführen, um die erste Flywheel-Iteration zu erstellen, trainiert das Flywheel das neue Modell.

Wenn Sie ein benutzerdefiniertes Modell trainieren, geben Sie eine Liste von benutzerdefinierten Labels (benutzerdefinierte Klassifizierung) oder benutzerdefinierten Entitäten (benutzerdefinierte Entitätserkennung) an, die das Modell erkennen soll. Beachten Sie die folgenden wichtigen Punkte zu benutzerdefinierten Labels/Entitäten:

  • Wenn Sie ein Flywheel für ein neues Modell erstellen, ist die Liste der Labels/Entitäten, die Sie bei der Erstellung des Flywheels angeben, die endgültige Liste für das Flywheel.

  • Wenn Sie ein Flywheel aus einem vorhandenen Modell erstellen, wird die Liste der diesem Modell zugeordneten Labels/Entitäten zur endgültigen Liste für das Flywheel.

  • Wenn Sie dem Flywheel einen neuen Datensatz zuordnen und dieser Datensatz zusätzliche Beschriftungen/Entitäten enthält, ignoriert Amazon Comprehend die neuen Beschriftungen/Entitäten.

  • Sie können die Bezeichnungs-/Entitätsliste eines Flywheels mithilfe der DescribeFlywheel API-Operation überprüfen.

    Anmerkung

    Für die benutzerdefinierte Klassifizierung füllt Amazon Comprehend die Labelliste aus, nachdem der Flywheel-Status ACTIVE lautet. Warten Sie, bis das Flywheel aktiv ist, bevor Sie die DescribeFlywheel API-Operation aufrufen.

Flywheel-Zustände

Ein Flywheel wechselt zwischen den folgenden Zuständen:

  • ERSTELLEN – Amazon Comprehend erstellt die Flywheel-Ressourcen. Sie können Lesevorgänge am Flywheel ausführen, z. B. DescribeFlywheel.

  • ACTIVE – Das Flywheel ist aktiv. Sie können feststellen, ob eine Flywheel-Iteration läuft, und den Status der Iteration anzeigen. Sie können Leseaktionen für das Flywheel und Aktionen wie DeleteFlywheel und ausführenUpdateFlywheel.

  • UPDATING – Amazon Comprehend aktualisiert das Flywheel. Sie können Lesevorgänge für das Flywheel ausführen.

  • DELETING – Amazon Comprehend löscht das Flywheel. Sie können Lesevorgänge für das Flywheel ausführen.

  • FAILED – Die Erstellung des Flywheel ist fehlgeschlagen.

Nachdem Amazon Comprehend ein Flywheel gelöscht hat, behalten Sie den Zugriff auf alle Modelldaten im Flywheel Data Lake. Amazon Comprehend löscht alle internen Metadaten, die für die Verwaltung der Flywheel-Ressourcen erforderlich sind. Amazon Comprehend löscht auch die mit diesem Flywheel verknüpften Datensätze (die Modelldaten werden im Data Lake gespeichert).

Flywheel-Iterationen

Wenn Sie neue Trainings- oder Testdaten für ein Flywheel-Modell erhalten, erstellen Sie einen oder mehrere neue Datensätze, um die neuen Daten in den Data Lake des Flywheels hochzuladen.

Anschließend führen Sie das Flywheel aus, um eine neue Flywheel-Iteration zu erstellen. Die Flywheel-Iteration wertet die aktuelle aktive Modellversion anhand der neuen Daten aus und speichert die Ergebnisse im Data Lake. Das Flywheel erstellt und trainiert auch eine neue Modellversion.

Wenn das neue Modell eine bessere Leistung als die aktuelle aktive Modellversion aufweist, können Sie die neue Modellversion zur aktiven Modellversion hochstufen. Sie können die -Konsole oder die UpdateFlywheel -API-Operation verwenden, um die aktive Modellversion zu aktualisieren.