Datenquellen ML-Modelle Auswertungen Stapelvoraussagen Echtzeitvoraussagen

Wir aktualisieren den Amazon Machine Learning Learning-Service nicht mehr und akzeptieren auch keine neuen Nutzer mehr dafür. Diese Dokumentation ist für bestehende Benutzer verfügbar, wir aktualisieren sie jedoch nicht mehr. Weitere Informationen finden Sie unter Was ist Amazon Machine Learning.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die wichtigsten Konzepte von Amazon Machine Learning

In diesem Abschnitt werden die folgenden Schlüsselkonzepte zusammengefasst und detaillierter beschrieben, wie sie in Amazon ML verwendet werden:

Datenquellenenthalten Metadaten, die mit Dateneingaben in Amazon ML verknüpft sind
ML-Modelle generieren Voraussagen mithilfe der aus den Eingabedaten extrahierten Muster
Auswertungen messen die Qualität von ML-Modellen
Stapelvoraussagen generieren Voraussagen asynchron für mehrere Eingabedatenbeobachtungen
Echtzeitvoraussagen generieren Voraussagen synchron für einzelne Datenbeobachtungen

Datenquellen

Eine Datenquelle ist ein Objekt, das Metadaten zu Ihren Eingabedaten enthält. Amazon ML liest Ihre Eingabedaten, berechnet deskriptive Statistiken zu ihren Attributen und speichert die Statistiken — zusammen mit einem Schema und anderen Informationen — als Teil des Datenquellenobjekts. Als Nächstes verwendet Amazon ML die Datenquelle, um ein ML-Modell zu trainieren und auszuwerten und Batch-Vorhersagen zu generieren.

Wichtig

Eine Datenquelle speichert keine Kopie Ihrer Eingabedaten. Stattdessen wird ein Verweis auf den Speicherort in Amazon S3 gespeichert, an dem sich Ihre Eingabedaten befinden. Wenn Sie die Amazon S3 S3-Datei verschieben oder ändern, kann Amazon ML nicht darauf zugreifen oder sie verwenden, um ein ML-Modell zu erstellen, Bewertungen zu generieren oder Prognosen zu generieren.

In der folgenden Tabelle sind Bedingungen definiert, die im Zusammenhang mit Datenquellen stehen.

Laufzeit	Definition
Attribut	Eine eindeutige und benannte Eigenschaft innerhalb einer Beobachtung. In tabellarischen Daten (z. B. Kalkulationstabellen oder Dateien im CSV-Format (durch Komma getrennte Werte)) stellen die Spaltenüberschriften die Attribute dar, in den Zeilen sind Werte für diese Attribute enthalten. Synonyme: Variable, Variablenname, Feld, Spalte
Datenquellenname	(Optional) Sie können einen lesbaren Namen für eine Datenquelle definieren. Diese Namen ermöglichen es Ihnen, Ihre Datenquellen in der Amazon ML-Konsole zu finden und zu verwalten.
Eingabedaten	Sammelbezeichnung für alle Beobachtungen, auf die von einer Datenquelle verwiesen wird.
Ort	Speicherort der Eingabedaten. Derzeit kann Amazon ML Daten verwenden, die in Amazon S3-Buckets, Amazon Redshift Redshift-Datenbanken oder MySQL-Datenbanken in Amazon Relational Database Service (RDS) gespeichert sind.
Beobachtung	Eine einzelne Einheit von Eingabedaten. Wenn Sie beispielsweise ein ML-Modell erstellen, um betrügerische Transaktionen zu ermitteln, bestehen Ihre Eingabedaten aus vielen Beobachtungen, von denen jede eine einzelne Transaktion darstellt. Synonyme: Datensatz, Beispiel, Instanz, Zeile
Zeilen-ID	(Optional) – Ein Flag, das, falls angegeben, ein Attribut in den Eingabedaten identifiziert, das in das Voraussageergebnis eingeschlossen werden soll. Anhand dieses Attributs kann einfacher zugeordnet werden, welche Voraussage welcher Beobachtung entspricht. Synonyme: Zeilen-ID
Schema	Die Informationen, die zur Deutung der Eingabedaten benötigt werden, einschließlich Attributnamen und ihre zugeordneten Datentypen sowie die Namen besonderer Attribute.
Statistiken	Zusammenfassende Statistik für jedes Attribut in den Eingabedaten. Diese Statistiken dienen zwei Zwecken: Die Amazon ML-Konsole zeigt sie in Diagrammen an, damit Sie Ihre Daten besser verstehen at-a-glance und Unregelmäßigkeiten oder Fehler erkennen können. Amazon ML verwendet sie während des Trainingsprozesses, um die Qualität des resultierenden ML-Modells zu verbessern.
Status	Gibt den aktuellen Status der Datenquelle an, beispielsweise Laufend, Abgeschlossenoder Fehlgeschlagen.
Zielattribut	Beim Training eines ML-Modells identifiziert das Zielattribut den Namen des Attributs in den Eingabedaten, das die „richtigen“ Antworten enthält. Amazon ML verwendet dies, um Muster in den Eingabedaten zu erkennen und ein ML-Modell zu generieren. Im Kontext des Auswertens und Generierens von Voraussagen, ist das Zielattribut das Attribut, dessen Wert vorhergesagt von einem qualifizierten ML-Modell vorhergesagt wird. Synonyme: Ziel

ML-Modelle

Ein ML-Modell ist ein mathematisches Modell, das Vorhersagen generiert, indem es Muster in Ihren Daten findet. Amazon ML unterstützt drei Arten von ML-Modellen: binäre Klassifikation, Mehrklassenklassifikation und Regression.

In der folgenden Tabelle sind Begriffe definierte, die im Zusammenhang mit ML-Modellen stehen.

Laufzeit	Definition
Regression	Das Ziel der Schulung eines Regressions-ML-Modells besteht darin, einen numerischen Wert vorherzusagen.
Mehrklassen	Das Ziel der Schulung eines Mehrklassen-ML-Modells besteht darin, Werte vorherzusagen, die zu einem begrenzten und vordefinierten Satz an zulässigen Werten gehören.
Binär	Das Ziel der Schulung eines Binär-ML-Modells besteht darin, Werte vorherzusagen, die nur einen von zwei Status aufweisen können, z. B. "true" oder "false".
Modellgröße	ML-Modelle erfassen und speichern Muster. Je mehr Muster in einem ML-Modell gespeichert sind, desto größer ist es. Die ML-Modellgröße wird in MB beschrieben.
Anzahl der Durchläufe	Wenn Sie ein ML-Modell schulen, verwenden Sie Daten aus einer Datenquelle. Es ist manchmal von Vorteil, jeden Datensatz im Lernprozess mehrmals zu verwenden. Die Häufigkeit, mit der Sie Amazon ML dieselben Datensätze verwenden lassen, wird als Anzahl der Durchläufe bezeichnet.
Regularisation	Regularisierung ist eine Technik des maschinellen Lernens, mit der Sie qualitativ hochwertigere Modelle erhalten können. Amazon ML bietet eine Standardeinstellung, die in den meisten Fällen gut funktioniert.

Auswertungen

Eine Auswertung misst die Qualität Ihres ML-Modells und bestimmt, ob es gute Leistungen bringt.

In der folgenden Tabelle sind Begriffe im Zusammenhang mit Auswertungen definiert.

Laufzeit	Definition
Einblicke in Modelle	Amazon ML bietet Ihnen eine Metrik und eine Reihe von Erkenntnissen, anhand derer Sie die Prognoseleistung Ihres Modells bewerten können.
AUC	AUC (Area Under the ROC Curve) misst die Fähigkeit eines binären ML-Modells, eine höhere Bewertung für positive Beispiele im Vergleich zu negativen Beispielen vorherzusagen.
F1-Bewertung mit Makro-Durchschnitt	Die F1-Bewertung mit Makro-Durchschnitt wird zum Auswerten der prädiktiven Leistung von Mehrklassen-ML-Modellen verwendet.
RMSE	Der Root Mean Square Error (RMSE) ist eine Metrik zur Bewertung der prädiktive Leistung von Regressions-ML-Modellen.
Grenzwert	ML-Modelle arbeiten durch Generierung von numerischen Voraussageergebnissen. Durch Anwenden eines Grenzwerts konvertiert das System diese Werte in 0- und 1-Bezeichnungen.
Accuracy	Die Richtigkeit misst den Anteil der richtigen Voraussagen.
Genauigkeit	„Precision“ zeigt den Prozentsatz der tatsächlichen positiven Instances (im Gegensatz zu Fehlalarmen) unter den Instances an, die abgerufen wurden (diejenigen, die als positiv vorausgesagt wurden). Mit anderen Worten: Wie viele ausgewählte Elemente sind positiv?
Wiedererkennung	„Recall“ zeigt den Prozentsatz der tatsächlichen positiven Instances in der Gesamtanzahl der betreffenden Instances an (tatsächliche positive Instances). Mit anderen Worten: Wie viele positive Elemente sind ausgewählt?

Stapelvoraussagen

Stapelvoraussagen werden für eine Reihe von Beobachtungen verwendet, die alle gleichzeitig ausgeführt werden können. Diese Lösung eignet sich optimal für prädiktive Analysen, die keine Echtzeitanforderung aufweisen.

In der folgenden Tabelle sind Begriffe im Zusammenhang mit Stapelvoraussagen definiert.

Laufzeit	Definition
Ausgabespeicherort	Die Ergebnisse einer Stapelvoraussage werden in einem S3-Bucket-Ausgabespeicherort gespeichert.
Manifestdatei	Diese Datei verknüpft die Eingabedatendatei mit den zugehörigen Ergebnissen der Stapelvoraussage. Sie wird am S3-Ausgabespeicherort gespeichert.

Echtzeitvoraussagen

Echtzeitvoraussagen werden für Anwendungen mit geringer Latenzanforderung verwendet, z. B. interaktive Webanwendungen, mobile Anwendungen oder Desktopanwendungen. Jedes ML-Modell kann im Hinblick auf Voraussagen mithilfe der latenzarmen Echtzeitvoraussage-API abgefragt werden.

In der folgenden Tabelle sind Begriffe im Zusammenhang mit Echtzeitvoraussagen definiert.

Laufzeit	Definition
Echtzeitvoraussage-API	Die Echtzeitvoraussage-API akzeptiert eine einzelne Eingabebeobachtung in der Nutzlast der Anforderung und gibt die Voraussage synchron in der Antwort zurück.
Endpunkt für Echtzeitvoraussagen	Um ein ML-Modell mit einer Echtzeitvoraussage-API zu verwenden, müssen Sie einen Endpunkt für Echtzeitvoraussagen erstellen. Nach der Erstellung enthält der Endpunkt die URL, die Sie verwenden können, um Echtzeitvoraussagen anzufordern.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Was ist Amazon Machine Learning?

Zugriff auf Amazon Machine Learning