

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Führen Sie erweiterte Analysen mit Amazon Redshift ML durch
<a name="perform-advanced-analytics-using-amazon-redshift-ml"></a>

*Po Hong und Chyanna Antonio, Amazon Web Services*

## Zusammenfassung
<a name="perform-advanced-analytics-using-amazon-redshift-ml-summary"></a>

In der Amazon Web Services (AWS) -Cloud können Sie Amazon Redshift Machine Learning (Amazon Redshift ML) verwenden, um ML-Analysen für Daten durchzuführen, die entweder in einem Amazon Redshift Redshift-Cluster oder in Amazon Simple Storage Service (Amazon S3) gespeichert sind. Amazon Redshift ML unterstützt überwachtes Lernen, das in der Regel für erweiterte Analysen verwendet wird. Zu den Anwendungsfällen für Amazon Redshift ML gehören Umsatzprognosen, Erkennung von Kreditkartenbetrug und Prognosen zum Customer Lifetime Value (CLV) oder zur Kundenabwanderung.

Amazon Redshift ML macht es Datenbankbenutzern leicht, ML-Modelle mithilfe von Standard-SQL-Befehlen zu erstellen, zu trainieren und bereitzustellen. Amazon Redshift ML verwendet Amazon SageMaker Autopilot, um anhand Ihrer Daten automatisch die besten ML-Modelle für die Klassifizierung oder Regression zu trainieren und zu optimieren, während Sie die Kontrolle und Transparenz behalten.

Alle Interaktionen zwischen Amazon Redshift, Amazon S3 und Amazon SageMaker werden abstrahiert und automatisiert. Nachdem das ML-Modell trainiert und bereitgestellt wurde, ist es als [benutzerdefinierte Funktion](https://docs.aws.amazon.com/redshift/latest/dg/user-defined-functions.html) (UDF) in Amazon Redshift verfügbar und kann in SQL-Abfragen verwendet werden.  

Dieses Muster ergänzt die Lernprogramme [Erstellen, Trainieren und Bereitstellen von ML-Modellen in Amazon Redshift mithilfe von SQL mit Amazon Redshift ML](https://aws.amazon.com/blogs/big-data/create-train-and-deploy-machine-learning-models-in-amazon-redshift-using-sql-with-amazon-redshift-ml/) aus dem AWS-Blog und das SageMaker Tutorial [Erstellen, Trainieren und Bereitstellen eines ML-Modells mit Amazon](https://aws.amazon.com/getting-started/hands-on/build-train-deploy-machine-learning-model-sagemaker/) aus dem [Getting Started](https://aws.amazon.com/getting-started/) Resource Center.

## Voraussetzungen und Einschränkungen
<a name="perform-advanced-analytics-using-amazon-redshift-ml-prereqs"></a>

**Voraussetzungen**
+ Ein aktives AWS-Konto
+ Bestehende Daten in einer Amazon Redshift Redshift-Tabelle

**Fähigkeiten**
+ *Vertrautheit mit den von Amazon Redshift ML verwendeten Begriffen und Konzepten, einschließlich *maschinellem Lernen*, *Training* und Prognose.* Weitere Informationen dazu finden Sie unter [Training ML-Modelle](https://docs.aws.amazon.com/machine-learning/latest/dg/training-ml-models.html) in der Dokumentation zu Amazon Machine Learning (Amazon ML).
+ Erfahrung mit Amazon Redshift Redshift-Benutzereinrichtung, Zugriffsverwaltung und Standard-SQL-Syntax. Weitere Informationen dazu finden Sie unter [Erste Schritte mit Amazon Redshift in der Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/gsg/getting-started.html) Redshift-Dokumentation.
+ Wissen und Erfahrung mit Amazon S3 und AWS Identity and Access Management (IAM). 
+ Erfahrung mit der Ausführung von Befehlen in der AWS-Befehlszeilenschnittstelle (AWS CLI) ist ebenfalls von Vorteil, aber nicht erforderlich. 

**Einschränkungen**
+ Der Amazon Redshift Redshift-Cluster und der S3-Bucket müssen sich in derselben AWS-Region befinden.
+ Der Ansatz dieses Musters unterstützt nur Modelle des überwachten Lernens wie Regression, binäre Klassifizierung und Mehrklassenklassifizierung. 

## Architektur
<a name="perform-advanced-analytics-using-amazon-redshift-ml-architecture"></a>

![\[Der Workflow zeigt, wie Amazon Redshift ML beim Erstellen SageMaker , Trainieren und Bereitstellen eines ML-Modells zusammenarbeitet.\]](http://docs.aws.amazon.com/de_de/prescriptive-guidance/latest/patterns/images/pattern-img/3b6a5f49-c647-45f4-940e-b623f989326a/images/36cc39fe-c1f3-4d68-b89e-e636156001a6.png)


In den folgenden Schritten wird erklärt, wie Amazon Redshift ML beim Erstellen SageMaker , Trainieren und Bereitstellen eines ML-Modells zusammenarbeitet: 

1. Amazon Redshift exportiert Trainingsdaten in einen S3-Bucket.

1. SageMaker Autopilot verarbeitet die Trainingsdaten automatisch vor.

1. Nachdem die `CREATE MODEL` Anweisung aufgerufen wurde, verwendet Amazon Redshift ML sie SageMaker für das Training.

1. SageMaker Autopilot sucht nach dem ML-Algorithmus und den optimalen Hyperparametern, die die Bewertungsmetriken optimieren, und empfiehlt diese.

1. Amazon Redshift ML registriert das Ausgabe-ML-Modell als SQL-Funktion im Amazon Redshift Redshift-Cluster.

1. Die Funktion des ML-Modells kann in einer SQL-Anweisung verwendet werden. 

**Technologie-Stack**
+ Amazon Redshift
+ SageMaker
+ Amazon S3

## Tools
<a name="perform-advanced-analytics-using-amazon-redshift-ml-tools"></a>
+ [Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/welcome.html) — Amazon Redshift ist ein vollständig verwalteter Data-Warehousing-Service auf Unternehmensebene im Petabyte-Bereich.
+ [Amazon Redshift ML](https://docs.aws.amazon.com/redshift/latest/dg/machine_learning.html) — Amazon Redshift Machine Learning (Amazon Redshift ML) ist ein robuster, cloudbasierter Service, der es Analysten und Datenwissenschaftlern aller Qualifikationsstufen leicht macht, ML-Technologie zu nutzen.
+ [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html) — Amazon Simple Storage Service (Amazon S3) ist Speicher für das Internet. 
+ [Amazon SageMaker](https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html) — SageMaker ist ein vollständig verwalteter ML-Service. 
+ [Amazon SageMaker Autopilot](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-automate-model-development.html) — SageMaker Autopilot ist ein Funktionsumfang, der wichtige Aufgaben eines automatischen maschinellen Lernprozesses (AutoML) automatisiert.

 

**Code**

Sie können ein überwachtes ML-Modell in Amazon Redshift mithilfe des folgenden Codes erstellen:

```
"CREATE MODEL customer_churn_auto_model
FROM (SELECT state,
             account_length,
             area_code,
             total_charge/account_length AS average_daily_spend, 
             cust_serv_calls/account_length AS average_daily_cases,
             churn 
      FROM customer_activity
      WHERE  record_date < '2020-01-01' 
     )
TARGET churn
FUNCTION ml_fn_customer_churn_auto
IAM_ROLE 'arn:aws:iam::XXXXXXXXXXXX:role/Redshift-ML'
SETTINGS (
  S3_BUCKET 'your-bucket'
);")
```

**Anmerkung**  
Der `SELECT` Status kann sich auf reguläre Amazon Redshift-Tabellen, externe Amazon Redshift Spectrum-Tabellen oder auf beide beziehen.

## Epen
<a name="perform-advanced-analytics-using-amazon-redshift-ml-epics"></a>

### Bereiten Sie einen Trainings- und Testdatensatz vor
<a name="prepare-a-training-and-test-dataset"></a>


| Aufgabe | Description | Erforderliche Fähigkeiten | 
| --- | --- | --- | 
| Bereiten Sie einen Trainings- und Testdatensatz vor. | Melden Sie sich bei der AWS-Managementkonsole an und öffnen Sie die SageMaker Amazon-Konsole. Folgen Sie den Anweisungen im Tutorial Ein [Modell für maschinelles Lernen erstellen, trainieren und bereitstellen, um eine](https://aws.amazon.com/getting-started/hands-on/build-train-deploy-machine-learning-model-sagemaker/) .csv- oder Apache Parquet-Datei zu erstellen, die eine Labelspalte (*betreutes Training*) und keinen Header enthält. Wir empfehlen, dass Sie den Rohdatensatz mischen und in einen Trainingssatz für das Training des Modells (70 Prozent) und einen Testsatz für die Leistungsbewertung des Modells (30 Prozent) aufteilen. | Datenwissenschaftler | 

### Bereiten Sie den Technologie-Stack vor und konfigurieren Sie ihn
<a name="prepare-and-configure-the-technology-stack"></a>


| Aufgabe | Description | Erforderliche Fähigkeiten | 
| --- | --- | --- | 
| Erstellen und konfigurieren Sie einen Amazon Redshift Redshift-Cluster. | Erstellen Sie auf der Amazon Redshift Redshift-Konsole einen Cluster gemäß Ihren Anforderungen. Weitere Informationen dazu finden Sie unter [Create a cluster](https://docs.aws.amazon.com/redshift/latest/dg/tutorial-loading-data-launch-cluster.html) in der Amazon Redshift Redshift-Dokumentation.  Amazon Redshift Redshift-Cluster müssen zusammen mit dem `SQL_PREVIEW` Maintenance Track erstellt werden. Weitere Informationen zu Vorschau-Tracks finden Sie unter [Cluster-Wartungsspuren auswählen](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-mgmt-maintenance-tracks) in der Amazon Redshift Redshift-Dokumentation. | DBA, Cloud-Architekt | 
| Erstellen Sie einen S3-Bucket zum Speichern von Trainingsdaten und Modellartefakten. | Erstellen Sie auf der Amazon S3 S3-Konsole einen S3-Bucket für die Trainings- und Testdaten. Weitere Informationen zum Erstellen eines S3-Buckets finden Sie unter [Erstellen eines S3-Buckets](https://docs.aws.amazon.com/quickstarts/latest/s3backup/step-1-create-bucket.html) über AWS Quick Starts. Stellen Sie sicher, dass sich Ihr Amazon Redshift Redshift-Cluster und Ihr S3-Bucket in derselben Region befinden.  | DBA, Cloud-Architekt | 
| Erstellen Sie eine IAM-Richtlinie und fügen Sie sie dem Amazon Redshift Redshift-Cluster hinzu. | Erstellen Sie eine IAM-Richtlinie, um dem Amazon Redshift Redshift-Cluster den Zugriff auf Amazon S3 SageMaker zu ermöglichen. Anweisungen und Schritte finden Sie unter [Cluster-Setup für die Verwendung von Amazon Redshift ML](https://docs.aws.amazon.com/redshift/latest/dg/cluster-setup.html) in der Amazon Redshift Redshift-Dokumentation. | DBA, Cloud-Architekt | 
| Erlauben Sie Amazon Redshift Redshift-Benutzern und -Gruppen den Zugriff auf Schemas und Tabellen. | Erteilen Sie Berechtigungen, um Benutzern und Gruppen in Amazon Redshift den Zugriff auf interne und externe Schemas und Tabellen zu ermöglichen. Schritte und Anweisungen finden Sie unter [Berechtigungen und Besitz verwalten](https://docs.aws.amazon.com/redshift/latest/dg/permissions-ownership.html) in der Amazon Redshift Redshift-Dokumentation. | DBA | 

### Erstellen und trainieren Sie das ML-Modell in Amazon Redshift
<a name="create-and-train-the-ml-model-in-amazon-redshift"></a>


| Aufgabe | Description | Erforderliche Fähigkeiten | 
| --- | --- | --- | 
| Erstellen und trainieren Sie das ML-Modell in Amazon Redshift. | Erstellen und trainieren Sie Ihr ML-Modell in Amazon Redshift ML. Weitere Informationen finden Sie in der `CREATE MODEL` Erklärung in der Amazon Redshift Redshift-Dokumentation. | Entwickler, Datenwissenschaftler | 

### Batch-Inferenz und Vorhersage in Amazon Redshift durchführen
<a name="perform-batch-inference-and-prediction-in-amazon-redshift"></a>


| Aufgabe | Description | Erforderliche Fähigkeiten | 
| --- | --- | --- | 
| Führen Sie die Inferenz mithilfe der generierten ML-Modellfunktion durch. | Weitere Informationen zur Durchführung von Inferenzen mithilfe der generierten ML-Modellfunktion finden Sie unter [Vorhersage](https://docs.aws.amazon.com/redshift/latest/dg/prediction.html) in der Amazon Redshift Redshift-Dokumentation. | Datenwissenschaftler, Business Intelligence-Benutzer | 

## Zugehörige Ressourcen
<a name="perform-advanced-analytics-using-amazon-redshift-ml-resources"></a>

**Bereiten Sie einen Trainings- und Testdatensatz vor**
+ [Aufbau, Schulung und Bereitstellung eines Modells für maschinelles Lernen mit Amazon SageMaker](https://aws.amazon.com/getting-started/hands-on/build-train-deploy-machine-learning-model-sagemaker/)

 

**Bereiten Sie den Technologie-Stack vor und konfigurieren Sie ihn**
+ [Einen Amazon Redshift Redshift-Cluster erstellen](https://docs.aws.amazon.com/redshift/latest/dg/tutorial-loading-data-launch-cluster.html)
+ [Auswahl von Amazon Redshift Redshift-Cluster-Wartungsplänen](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-mgmt-maintenance-tracks)
+ [Erstellen eines S3-Buckets](https://docs.aws.amazon.com/quickstarts/latest/s3backup/step-1-create-bucket.html)
+ [Einrichtung eines Amazon Redshift-Clusters für die Verwendung von Amazon Redshift ML](https://docs.aws.amazon.com/redshift/latest/dg/cluster-setup.html)
+ [Verwaltung von Berechtigungen und Eigentum in Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/permissions-ownership.html)

 

**Erstellen und trainieren Sie das ML-Modell in Amazon Redshift**
+ [CREATE MODEL-Anweisung in Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_MODEL.html#r_simple_create_model) 

 

**Batch-Inferenz und Vorhersage in Amazon Redshift durchführen**
+ [Prognose in Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/prediction.html) 

 

**Sonstige Ressourcen**
+ [Erste Schritte mit Amazon Redshift ML](https://docs.aws.amazon.com/redshift/latest/dg/geting-started-machine-learning.html)
+ [Erstellen, Trainieren und Bereitstellen von ML-Modellen in Amazon Redshift mithilfe von SQL mit Amazon Redshift ML](https://aws.amazon.com/blogs/big-data/create-train-and-deploy-machine-learning-models-in-amazon-redshift-using-sql-with-amazon-redshift-ml/)
+ [Amazon Redshift Redshift-Partner](https://aws.amazon.com/redshift/partners/?partner-solutions-cards.sort-by=item.additionalFields.partnerNameLower&partner-solutions-cards.sort-order=aschttps://aws.amazon.com/redshift/partners/?partner-solutions-cards.sort-by=item.additionalFields.partnerNameLower&partner-solutions-cards.sort-order=asc)
+ [AWS-Kompetenzpartner für maschinelles Lernen](https://aws.amazon.com/machine-learning/partner-solutions/?partner-solutions-cards.sort-by=item.additionalFields.partnerNameLower&partner-solutions-cards.sort-order=asc)