IP Insights

Fokusmodus

IP Insights - Amazon SageMaker KI

E/A-Schnittstelle für den IP Insights-Algorithmus EC2 Instanzempfehlung für den IP Insights-Algorithmus Beispiel-Notebooks

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon SageMaker AI IP Insights ist ein unbeaufsichtigter Lernalgorithmus, der die Nutzungsmuster für IPv4 Adressen lernt. Er wurde entwickelt, um Verknüpfungen zwischen IPv4 Adressen und verschiedenen Entitäten wie Benutzer- IDs oder Kontonummern zu erfassen. Sie können ihn z. B. zum Identifizieren eines Benutzers verwenden, der versucht, sich von einer anormalen IP-Adresse bei einem Web-Service anzumelden. Sie können ihn auch verwenden, um ein Konto zu identifizieren, das versucht, Datenverarbeitungsressourcen von einer ungewöhnlichen IP-Adresse aus zu erstellen. Trainierte IP Insight-Modelle können an einem Endpunkt für Echtzeit-Prognosen gehostet oder zum Verarbeiten von Stapeltransformationen verwendet werden.

SageMaker AI IP Insights erfasst historische Daten als Paare (Entität, IPv4 Adresse) und lernt die IP-Nutzungsmuster jeder Entität kennen. Bei einer Abfrage mit einem Ereignis (Entität, IPv4 Adresse) gibt ein SageMaker AI IP Insights-Modell einen Wert zurück, der darauf schließen lässt, wie ungewöhnlich das Muster des Ereignisses ist. Wenn ein Benutzer z. B. versucht, sich von einer IP-Adresse anzumelden, und die IP Insights-Punktzahl hoch genug ist, entscheidet ein Web-Login-Server möglicherweise ein Multifaktor-Authentifizierungssystem auszulösen. In erweiterten Lösungen können Sie die IP Insights-Punktzahl in ein anderes Machine-Learning-Modell einspeisen. Sie können beispielsweise den IP Insight-Wert mit anderen Funktionen kombinieren, um die Ergebnisse eines anderen Sicherheitssystems, z. B. denen von Amazon, zu bewerten GuardDuty.

Der SageMaker AI IP Insights-Algorithmus kann auch Vektordarstellungen von IP-Adressen lernen, die als Einbettungen bezeichnet werden. Sie können vektorcodierte Einbettungen als Funktionen in nachgelagerten Machine-Learning-Aufgaben verwenden, die die in den IP-Adressen erkannten Informationen nutzen. Beispielsweise können Sie sie in Aufgaben wie Messen von Gemeinsamkeiten zwischen IP-Adressen in Cluster- und Visualisierungsaufgaben verwenden.

Themen

E/A-Schnittstelle für den IP Insights-Algorithmus

Training und Validierung

Der SageMaker AI IP Insights-Algorithmus unterstützt Datenkanäle für Training und Validierung. Er verwendet den optionalen Validierungskanal, um einen area-under-curve (AUC-) Wert für eine vordefinierte negative Stichprobenstrategie zu berechnen. Die AUC-Metrik validiert, wie gut das Modell zwischen positiven und negativen Stichproben unterscheidet. Trainings- und Validierungsdaten müssen im text/csv-Format vorliegen. Die erste Spalte der CSV-Daten besteht aus einer opaken Zeichenfolge, die eine eindeutige ID für die Entity angibt. Die zweite Spalte ist eine IPv4 Adresse in Dezimalpunktschreibweise. IP Insights wird derzeit nur im Dateimodus unterstützt. Weitere Informationen und Beispiele finden Sie unter IP Insights – Datenformate für das Training.

Inferenz

Für die Inferenz unterstützt IP Insights die Eingabedaten-Inhaltstypen text/csv, application/json und application/jsonlines. Weitere Informationen zu den gängigen Datenformaten für Inferenzen, die von KI bereitgestellt werden, finden Sie unter SageMaker . Allgemeine Datenformate für Inferenz Die IP Insights-Inferenz gibt eine als application/json oder application/jsonlines formatierte Ausgabe zurück. Jeder Datensatz in den Ausgabedaten enthält das entsprechende dot_product (oder eine Kompatibilitätspunktzahl) für die einzelnen Eingabedatenpunkte. Weitere Informationen und Beispiele finden Sie unter IP Insights-Inferenzdatenformate.

EC2 Instanzempfehlung für den IP Insights-Algorithmus

Der SageMaker AI IP Insights-Algorithmus kann sowohl auf GPU- als auch auf CPU-Instanzen ausgeführt werden. Für Trainingsaufgaben empfehlen wir die Verwendung von GPU-Instances. Für bestimmte Workloads mit großen Trainingsdatensätzen lassen sich die Trainingskosten möglicherweise durch verteilte CPU-Instances reduzieren. Für die Inferenz empfehlen wir die Verwendung von CPU-Instances. IP Insights unterstützt die GPU-Familien P2, P3, G4dn und G5.

GPU-Instances für den IP Insights-Algorithmus

IP Insights unterstützt alle verfügbaren GPUs. Wenn Sie das Training beschleunigen müssen, empfehlen wir mit einer einzigen GPU-Instance, wie z. B. ml.p3.2xlarge, zu beginnen und dann zu einer Multi-GPU-Umgebung, wie ml.p3.8xlarge und ml.p3.16xlarge, überzugehen. Teilen Sie die Mini-Batches mit Trainingsdaten mehrfach GPUs automatisch auf. Wenn Sie von einer einzelnen GPU zu mehreren wechseln GPUs, mini_batch_size wird diese gleichmäßig in die Anzahl der GPUs verwendeten GPU aufgeteilt. Als Ausgleich können Sie den Wert der mini_batch_size erhöhen.

CPU-Instances für den IP Insights-Algorithmus

Welchen Typ der CPU-Instance wir empfehlen, hängt vor allem vom verfügbaren Arbeitsspeicher der Instance und der Modellgröße ab. Die Modellgröße wird durch zwei Hyperparameter bestimmt: vector_dim und num_entity_vectors. Die maximale, unterstützte Modellgröße 8 GB. In der folgenden Tabelle sind typische EC2 Instance-Typen aufgeführt, die Sie auf der Grundlage dieser Eingabeparameter für verschiedene Modellgrößen bereitstellen würden. In Tabelle 1 reicht der Wert für vector_dim in der ersten Spalte von 32 bis 2048 und die Werte für num_entity_vectors in der ersten Zeile reichen von 10 000 bis 50 000 000.

`vector_dim` \ `num_entity_vectors`.	10.000	50 000	100 000	500,000	1 000 000	5,000,000	10,000,000	50,000,000
`32`	ml.m5.large	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.xlarge`	`ml.m5.2xlarge`	`ml.m5.4xlarge`
`64`	ml.m5.large	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.2xlarge`	`ml.m5.2xlarge`
`128`	ml.m5.large	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.2xlarge`	`ml.m5.4xlarge`
`256`	ml.m5.large	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.xlarge`	`ml.m5.4xlarge`
`512`	ml.m5.large	`ml.m5.large`	`ml.m5.large`	`ml.m5.large`	`ml.m5.2xlarge`
`1024`	ml.m5.large	`ml.m5.large`	`ml.m5.large`	`ml.m5.xlarge`	`ml.m5.4xlarge`
`2048`	ml.m5.large	`ml.m5.large`	`ml.m5.xlarge`	`ml.m5.xlarge`

Die Werte für die Hyperparameter mini_batch_size, num_ip_encoder_layers, random_negative_sampling_rate und shuffled_negative_sampling_rate wirken sich auch auf die Größe des erforderlichen Arbeitsspeichers aus. Wenn diese Werte groß sind, müssen Sie möglicherweise einen größeren Instance-Typ als normal verwenden.

Beispiel-Notebooks für IP Insights

Ein Beispielnotizbuch, das zeigt, wie der SageMaker AI IP Insights-Algorithmus trainiert und daraus Schlüsse gezogen werden können, finden Sie unter Eine Einführung in den SageMaker AIIP Insights-Algorithmus. Anweisungen zum Erstellen und Zugreifen auf Jupyter-Notebook-Instanzen, mit denen Sie das Beispiel in KI ausführen können, finden Sie unter. SageMaker Amazon SageMaker Notebook-Instances Nachdem Sie eine Notebook-Instanz erstellt haben, wählen Sie den Tab SageMaker KI-Beispiele, um eine Liste aller KI-Beispiele zu sehen. SageMaker Zum Öffnen eines Notebooks wählen Sie die Registerkarte Verwenden und dann Kopie erstellen aus.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Unbeaufsichtigt

So funktioniert’s

Nächstes Thema:

So funktioniert’s

Vorheriges Thema:

Unbeaufsichtigt

Brauchen Sie Hilfe?

Auf dieser Seite

Wählen Sie Ihre Cookie-Einstellungen aus

Cookie-Einstellungen anpassen

Essenziell

Leistung

Funktional

Werbung

Cookie-Einstellungen konnten nicht gespeichert werden