Beispieldatensätze in Canvas - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Beispieldatensätze in Canvas

SageMaker Canvas bietet Beispieldatensätze für spezielle Anwendungsfälle, sodass Sie schnell mit dem Erstellen, Trainieren und Validieren von Modellen beginnen können, ohne Code schreiben zu müssen. Die mit diesen Datensätzen verbundenen Anwendungsfälle verdeutlichen die Funktionen von SageMaker Canvas, und Sie können diese Datensätze nutzen, um mit der Erstellung von Modellen zu beginnen. Sie finden die Beispieldatensätze auf der Seite Datensätze Ihrer Canvas-Anwendung. SageMaker

Die folgenden Datensätze sind die Beispiele, die SageMaker Canvas standardmäßig bereitstellt. Diese Datensätze decken Anwendungsfälle wie die Vorhersage von Immobilienpreisen, Kreditausfällen und Rückübernahmen von Diabetikern, Umsatzprognosen, Prognosen von Maschinenausfällen zur Optimierung der vorausschauenden Wartung in Produktionseinheiten und Generierung von Lieferkettenprognosen für Transport und Logistik ab. Die Datensätze werden in dem sample_dataset Ordner im standardmäßigen Amazon S3 S3-Bucket gespeichert, den SageMaker AI für Ihr Konto in einer Region erstellt.

  • canvas-sample-diabetic-readmission.csv: Dieser Datensatz enthält historische Daten, darunter mehr als fünfzehn Merkmale mit Patienten- und Krankenhausergebnissen. Sie können diesen Datensatz verwenden, um vorherzusagen, ob Diabetiker mit hohem Risiko wahrscheinlich innerhalb von 30 Tagen nach der Entlassung, nach 30 Tagen oder gar nicht wieder ins Krankenhaus eingeliefert werden. Verwenden Sie für diesen Datensatz die Spalte mit der roten Zulassung als Zielspalte und verwenden Sie für diesen Datensatz das Prognosemodell der Kategorie 3+. Weitere Informationen zum Erstellen eines Modells mit diesem Datensatz finden Sie auf der SageMaker Canvas-Workshop-Seite. Dieser Datensatz wurde aus dem UCIMachine Learning Repository abgerufen.

  • canvas-sample-housing.csv: Dieser Datensatz enthält Daten zu den Merkmalen, die an einen bestimmten Immobilienpreis gebunden sind. Sie können diesen Datensatz verwenden, um die Immobilienpreise vorherzusagen. Verwenden Sie die Spalte median_house_value als Zielspalte und verwenden Sie den numerischen Prognosemodelltyp für diesen Datensatz. Weitere Informationen zum Erstellen eines Modells mit diesem Datensatz finden Sie auf der Canvas-Workshop-Seite. SageMaker Dies ist der Datensatz zum Thema Wohnen in Kalifornien, der aus dem StatLib Repository abgerufen wurde.

  • canvas-sample-loans.csv: Dieser Datensatz enthält vollständige Kreditdaten für alle von 2007 bis 2011 ausgegebenen Kredite, einschließlich des aktuellen Kreditstatus und der letzten Zahlungsinformationen. Sie können diesen Datensatz verwenden, um vorherzusagen, ob ein Kunde einen Kredit zurückzahlen wird. Verwenden Sie die Spalte loan_status als Zielspalte und verwenden Sie für diesen Datensatz den Prognosemodelltyp für Kategorien 3+. Weitere Informationen zum Erstellen eines Modells mit diesem Datensatz finden Sie auf der SageMaker Canvas-Workshop-Seite. Diese Daten verwenden die von Kaggle erhaltenen LendingClub Daten.

  • canvas-sample-maintenance.csv: Dieser Datensatz enthält Daten zu den Merkmalen eines bestimmten Wartungsausfalls. Sie können diesen Datensatz verwenden, um vorherzusagen, welcher Fehler in future auftreten wird. Verwenden Sie die Spalte Fehlertyp als Zielspalte und verwenden Sie für diesen Datensatz den Prognosemodelltyp der Kategorie 3+. Weitere Informationen zum Erstellen eines Modells mit diesem Datensatz finden Sie auf der SageMaker Canvas-Workshop-Seite. Dieser Datensatz wurde aus dem UCIMachine Learning Repository abgerufen.

  • canvas-sample-shipping-logs.csv: Dieser Datensatz enthält vollständige Versanddaten für alle gelieferten Produkte, einschließlich voraussichtlicher Versandpriorität, Transporteur und Herkunft. Sie können diesen Datensatz verwenden, um die geschätzte Ankunftszeit der Sendung in Tagen vorherzusagen. Verwenden Sie die ActualShippingDaysSpalte als Zielspalte und verwenden Sie den numerischen Prognosemodelltyp für diesen Datensatz. Weitere Informationen zum Erstellen eines Modells mit diesen Daten finden Sie auf der SageMaker Canvas-Workshop-Seite. Dies ist ein synthetischer Datensatz, der von Amazon erstellt wurde.

  • canvas-sample-sales-forecasting.csv: Dieser Datensatz enthält historische Zeitreihen-Verkaufsdaten für Einzelhandelsgeschäfte. Sie können diesen Datensatz verwenden, um Verkäufe für ein bestimmtes Einzelhandelsgeschäft zu prognostizieren. Verwenden Sie die Verkaufsspalte als Zielspalte und verwenden Sie für diesen Datensatz den Modelltyp Zeitreihenprognosen. Weitere Informationen zum Erstellen eines Modells mit diesem Datensatz finden Sie auf der SageMaker Canvas-Workshop-Seite. Dies ist ein synthetischer Datensatz, der von Amazon erstellt wurde.