Anforderungen und bewährte Verfahren für die Entwicklung von Produkten für maschinelles Lernen - AWS Marketplace

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Anforderungen und bewährte Verfahren für die Entwicklung von Produkten für maschinelles Lernen

Es ist wichtig, dass es Ihren Käufern leicht fällt, Ihr Modellpaket und Ihre Algorithmusprodukte zu testen. In den folgenden Abschnitten werden die Anforderungen für die Erstellung von Produktlisten mit maschinellem Lernen (ML) und bewährte Verfahren für ML-Produkte beschrieben. Eine vollständige Zusammenfassung der Anforderungen und Empfehlungen finden Sie in derZusammenfassung der Anforderungen und Empfehlungen für ML-Produktangebote.

Anmerkung

Falls Ihre veröffentlichten Produkte diese Anforderungen nicht erfüllen, kann sich ein AWS Marketplace Mitarbeiter mit Ihnen in Verbindung setzen, um Ihnen zu helfen, diese Anforderungen zu erfüllen.

Erforderliche Ressourcen

Bevor Sie eine Produktliste für maschinelles Lernen erstellen, stellen Sie sicher, dass Sie über die folgenden erforderlichen Ressourcen verfügen:

Allgemeine bewährte Verfahren für ML-Produkte

Geben Sie die folgenden Informationen für Ihr Produkt für maschinelles Lernen an:

  • Geben Sie für Produktbeschreibungen Folgendes an:

    • Was macht Ihr Modell

    • Wer ist der Zielkunde

    • Was ist der wichtigste Anwendungsfall

    • Wie Ihr Modell trainiert wurde oder welche Datenmenge verwendet wurde

    • Was sind die Leistungskennzahlen und welche Validierungsdaten wurden verwendet

    • Falls medizinisch, ob Ihr Modell für diagnostische Zwecke bestimmt ist

  • Standardmäßig sind Produkte für maschinelles Lernen so konfiguriert, dass sie öffentlich sichtbar sind. Sie können jedoch ein Produkt mit privater Sichtbarkeit erstellen. Weitere Informationen finden Sie unter Erstellen Sie Ihr Produktangebot.

  • (Optional) Bieten Sie Kunden für kostenpflichtige Produkte eine kostenlose 14—30-Tage-Testversion an, damit sie Ihr Produkt testen können. Weitere Informationen finden Sie unter Produktpreise für maschinelles Lernen für AWS Marketplace.

  • (Optional) Wenn Sie bei Produkten mit Modellpaketen eine Produktdemo in Echtzeit auf Ihrer Produktangebotsseite aktivieren möchten, wenden Sie sich an das AWS Marketplace Seller Operations Team. Mit der Produktdemo kann ein potenzieller Käufer Ihr Modell direkt auf der Angebotsseite testen, ohne das Modell selbst abonnieren oder bereitstellen zu müssen.

Anforderungen an Nutzungsinformationen

Klare Nutzungsinformationen, die die erwarteten Inputs und Outputs Ihres Produkts beschreiben (mit Beispielen), sind entscheidend für ein positives Einkaufserlebnis.

Bei jeder neuen Version Ihrer Ressource, die Sie zu Ihrem Produktangebot hinzufügen, müssen Sie Nutzungsinformationen angeben.

Um Nutzungsinformationen für ein neues Produkt hinzuzufügen, das Sie zum ersten Mal veröffentlichen, melden Sie sich bei der AWS Marketplace Management Portal Konsole an. Wählen Sie in der Dropdownliste Produkte die Option Maschinelles Lernen aus. Wählen Sie Ihr Produkt aus. Geben Sie in der Produktübersicht unter der Startoption die Ressource ARN Ihres Modells, Pakets oder Algorithmus an und wählen Sie Hinzufügen aus.

Um die vorhandenen Nutzungsinformationen für eine bestimmte Version zu bearbeiten, wählen Sie unter Startoption Bearbeiten und dann Version bearbeiten aus.

Anforderungen für Eingaben und Ausgaben

Eine klare Erklärung Ihres Formats mit Beispielen für Eingaben und Ausgaben ist wichtig, damit Ihre Käufer Ihr Produkt verstehen und verwenden können. Dieses Verständnis hilft Ihren Käufern, alle erforderlichen Transformationen an den Eingabedaten vorzunehmen, um die besten Inferenzergebnisse zu erzielen.

Wenn Sie Ihre SageMaker Amazon-Ressource zu Ihrem Produktangebot hinzufügen, werden Sie nach folgenden Angaben gefragt.

Inferenzeingaben und -ausgaben

Geben Sie für die Inferenzeingabe das Eingabeformat sowohl für den Echtzeit-Endpunkt als auch für den Batch-Transformationsjob an. Fügen Sie Codefragmente für die erforderliche Vorverarbeitung der Daten hinzu. Fügen Sie unterstützte MIME Inhaltstypen (z. B. jpeg, image/png, image/bmp), gegebenenfalls Wertebeschreibungen und Einschränkungen hinzu. Fügen Sie Eingabebeispiele hinzu, die auf gehostet werden. GitHub

Geben Sie für die Inferenzausgabe das Ausgabeformat sowohl für den Echtzeit-Endpunkt als auch für den Batch-Transformationsjob an. Geben Sie den MIME Ausgabeinhaltstyp (z. B. application/json, jpeg) und gegebenenfalls eine Beschreibung der Werte an. Fügen Sie Ausgabebeispiele hinzu, die auf GitHubgehostet werden.

Wenn Sie Beispiele benötigen, stellen Sie Eingabedateien bereit, die zu Ihrem Produkt passen. Wenn Ihr Modell eine Klassifizierung nach mehreren Klassen durchführt, stellen Sie mindestens eine Beispiel-Eingabedatei für jede Klasse bereit.

Eingaben für das Training

Geben Sie im Abschnitt Informationen zum Trainieren eines Modells das Eingabedatenformat und Codefragmente für die erforderliche Vorverarbeitung der Daten an. Geben Sie unterstützte MIME Inhaltstypen (z. B. jpeg, image/png, image/bmp), gegebenenfalls eine Beschreibung der Werte und Einschränkungen an. Stellen Sie sicher, dass Sie Eingabebeispiele angeben, die auf gehostet werden. GitHub

Erläutern Sie sowohl optionale als auch obligatorische Funktionen, die vom Käufer bereitgestellt werden können, und geben Sie an, ob der PIPE Eingabemodus unterstützt wird. Wenn verteilte Schulungen (Schulungen mit mehr als einer CPU GPU Instanz) unterstützt werden, geben Sie dies an. Führen Sie für die Optimierung die empfohlenen Hyperparameter auf.

Anforderungen für das Jupyter-Notebook

Wenn Sie Ihre SageMaker Ressource zu Ihrer Produktliste hinzufügen, geben Sie einen Link zu einem auf gehosteten Jupyter-Notizbuch an GitHub, das den gesamten Arbeitsablauf demonstriert, ohne den Käufer aufzufordern, Daten hochzuladen oder zu suchen.

Verwenden Sie die AWS SDK for Python (Boto). Ein gut entwickeltes Musternotizbuch erleichtert es Käufern, Ihr Angebot auszuprobieren und zu verwenden.

In Ihrem Musternotizbuch werden die Aufbereitung der Eingabedaten, die Erstellung eines Endpunkts für Inferenzen in Echtzeit und die Ausführung von Batch-Transformationsaufgaben für Modellpakete veranschaulicht. Weitere Informationen finden Sie unter Modellpaketliste und Musternotizbuch auf GitHub. Ein Beispielnotizbuch finden Sie unter auto_insurance. Das Notizbuch funktioniert in allen Bereichen AWS-Regionen, ohne dass Parameter eingegeben werden müssen und ohne dass ein Käufer nach Beispieldaten suchen muss.

Anmerkung

Ein unterentwickeltes Jupyter-Beispiel-Notebook, das nicht mehrere mögliche Eingaben und Datenvorverarbeitungsschritte zeigt, kann es für den Käufer schwierig machen, das Wertversprechen Ihres Produkts vollständig zu verstehen.

Das Beispiel-Notizbuch für Algorithmusprodukte zeigt, wie das Training, die Feinabstimmung, die Modellerstellung, die Erstellung eines Endpunkts für Inferenz in Echtzeit und die Ausführung von Batch-Transformationsaufgaben abgeschlossen sind. Weitere Informationen finden Sie unter Algorithmusliste und Beispielnotizbuch unter. GitHub Beispielnotizbücher finden Sie unter amazon_demo_product und automl on. GitHub Diese Musternotizbücher funktionieren in allen Regionen, ohne dass Parameter eingegeben werden müssen und kein Käufer nach Musterdaten suchen muss.

Anmerkung

Das Fehlen von Beispiel-Trainingsdaten könnte Ihren Käufer daran hindern, das Jupyter-Notebook erfolgreich zu verwenden. Ein unzureichend entwickeltes Musternotizbuch könnte Ihre Käufer daran hindern, Ihr Produkt zu verwenden, und die Akzeptanz behindern.

Zusammenfassung der Anforderungen und Empfehlungen für ML-Produktangebote

Die folgende Tabelle enthält eine Zusammenfassung der Anforderungen und Empfehlungen für eine Produktlistenseite für maschinelles Lernen.

Details Für Angebote von Modellpaketen Für Angebote mit Algorithmen
Product descriptions
Erläutern Sie detailliert, was das Produkt für unterstützte Inhaltstypen tut (z. B. „erkennt X in Bildern“). Erforderlich Erforderlich
Geben Sie überzeugende und differenzierende Informationen über das Produkt an (vermeiden Sie Adjektive wie „am besten“ oder unbegründete Behauptungen). Empfohlen Empfohlen
Nennen Sie die wichtigsten Anwendungsfälle für dieses Produkt. Erforderlich Erforderlich
Beschreiben Sie die Daten (Quelle und Umfang), auf denen das Training durchgeführt wurde, und führen Sie alle bekannten Einschränkungen auf. Erforderlich Nicht zutreffend
Beschreiben Sie das Kernframework, auf dem das Modell aufgebaut wurde. Empfohlen Empfohlen
Fassen Sie die Leistungskennzahl des Modells anhand von Validierungsdaten zusammen (z. B. „Genauigkeit von XX.YY Prozent anhand des Z-Datensatzes als Benchmark bewertet“). Erforderlich Nicht zutreffend
Fassen Sie die Modelllatenz- und/oder Durchsatzmetriken für den empfohlenen Instanztyp zusammen. Erforderlich Nicht zutreffend
Beschreiben Sie die Algorithmus-Kategorie. Beispiel: „Dieser Decision Forest Regression-Algorithmus basiert auf einem Ensemble von Klassifikatoren mit Baumstruktur, die mithilfe der allgemeinen Technik der Bootstrap-Aggregation und einer zufälligen Auswahl von Merkmalen erstellt wurden.“ Nicht zutreffend Erforderlich
Usage information
Geben Sie als Rückschluss das Eingabeformat sowohl für den Echtzeit-Endpunkt als auch für den Batch-Transformationsjob an. Geben Sie unterstützte MIME Inhaltstypen (z. B. image/png, image/bmp), gegebenenfalls eine Beschreibung der Werte und Einschränkungen an. Siehe Anforderungen für Eingaben und Ausgaben. Erforderlich Erforderlich
Geben Sie als Referenz Eingabebeispiele sowohl für den Echtzeit-Endpunkt- als auch für den Batch-Transformationsjob an. Die Proben müssen auf GitHub gehostet werden. Siehe Anforderungen für Eingaben und Ausgaben. Erforderlich Erforderlich
Geben Sie als Inferenz das Ausgabeformat sowohl für den Echtzeit-Endpunkt als auch für den Batch-Transformationsjob an. Geben Sie den MIME Ausgabeinhaltstyp (z. B. application/json, jpeg) und gegebenenfalls eine Beschreibung der Werte an. Siehe Anforderungen für Eingaben und Ausgaben. Erforderlich Erforderlich
Geben Sie als Inferenz Ausgabebeispiele sowohl für den Echtzeit-Endpunkt als auch für den Batch-Transformationsjob an. Die Proben müssen auf GitHub gehostet werden. Siehe Anforderungen für Eingaben und Ausgaben. Erforderlich Erforderlich
Geben Sie als Referenz ein Beispiel für die Verwendung eines Endpoint- oder Batch-Transformationsjobs an. Fügen Sie ein Codebeispiel hinzu, indem Sie die Befehle AWS Command Line Interface (AWS CLI) verwenden oder ein AWS SDK. Erforderlich Erforderlich
Geben Sie für das Training das Eingabeformat an. Geben Sie die unterstützten MIME Inhaltstypen (z. B. jpeg, image/png, image/bmp), gegebenenfalls eine Beschreibung der Werte und Einschränkungen (z. B. die Mindestanzahl der erforderlichen Datenzeilen) an. Siehe Anforderungen für Eingaben und Ausgaben. Nicht zutreffend Erforderlich
Stellen Sie für Schulungen Eingabebeispiele bereit, die auf gehostet werden. GitHub Siehe Anforderungen für Eingaben und Ausgaben. Nicht zutreffend Erforderlich
Geben Sie für Schulungen ein Beispiel für die Durchführung von Schulungsaufgaben an. Beschreiben Sie die unterstützten Hyperparameter, ihre Bereiche und ihre Gesamtauswirkung. Geben Sie an, ob der Algorithmus Hyperparameter-Tuning, verteiltes Training oder GPU Instanzen unterstützt. Fügen Sie Codebeispiele wie AWS CLI Befehle hinzu oder verwenden Sie AWS SDK beispielsweise eine. Nicht zutreffend Erforderlich
Stellen Sie ein Jupyter-Notizbuch bereit, das auf der GitHub Demonstration der vollständigen Nutzung Ihres Produkts gehostet wird. Siehe Anforderungen für das Jupyter-Notebook. Erforderlich Erforderlich
Stellen Sie technische Informationen zur Verwendung des Produkts bereit, einschließlich Benutzerhandbüchern und Beispieldaten. Empfohlen Empfohlen