Deep Graph-Netzwerke - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Deep Graph-Netzwerke

Deep Graph-Netzwerke beziehen sich auf eine Art neuronales Netzwerk, das trainiert wird, um Probleme mit Graphs zu lösen. Ein Deep-Graph-Netzwerk verwendet ein zugrunde liegendes Deep-Learning-Framework wie PyTorch oder MXNet. Das Potenzial von Graphnetzwerken in praktischen KI-Anwendungen wird in den Amazon SageMaker AI-Tutorials für Deep Graph Library (DGL) hervorgehoben. Beispiele für Trainingsmodelle anhand von Graph-Datensätzen sind soziale Netzwerke, Wissensdatenbanken, Biologie und Chemie.

The Deep Graph Library (DGL) ecosystem.

Abbildung 1. Das DGL-Ökosystem

Es werden mehrere Beispiele mit den Deep-Learning-Containern von Amazon SageMaker AI bereitgestellt, die mit DGL vorkonfiguriert sind. Wenn Sie spezielle Module haben, die Sie mit DGL verwenden möchten, können Sie auch einen eigenen Container erstellen. Die Beispiele umfassen Heterografien, also Graphen, die mehrere Arten von Knoten und Kanten aufweisen, und beziehen sich auf eine Vielzahl von Anwendungen in unterschiedlichen wissenschaftlichen Bereichen, wie Bioinformatik und Analyse sozialer Netzwerke. DGL bietet eine breite Palette von Implementierungen neuraler Graph-Netzwerke für verschiedene Modelltypen. Einige der Highlights sind:

  • Graph convolutional network (GCN)

  • Relational graph convolutional network (R-GCN)

  • Graph attention network (GAT)

  • Deep generative models of graphs (DGMG)

  • Junction tree neural network (JTNN)

So trainieren Sie ein Deep Graph-Netzwerk
  1. Durchsuchen Sie in der JupyterLabAnsicht in Amazon SageMaker AI die Beispielnotizbücher und suchen Sie nach DGL-Ordnern. Es können mehrere Dateien enthalten sein, um ein Beispiel zu unterstützen. Überprüfen Sie die README auf alle Voraussetzungen.

  2. Führen Sie das .ipynb-Notebook-Beispiel aus. 

  3. Suchen Sie die Schätzfunktion und notieren Sie sich die Zeile, in der sie einen Amazon ECR-Container für DGL und einen bestimmten Instance-Typ verwendet. Möglicherweise möchten Sie dies aktualisieren, um einen Container in Ihrer bevorzugten Region zu verwenden.

  4. Führen Sie die Funktion aus, um die Instance zu starten, und verwenden Sie den DGL-Container für das Training eines Graph-Netzwerks. Für den Start dieser Instance fallen Gebühren an. Die Instance beendet sich selbst, wenn das Training abgeschlossen ist.

Ein Beispiel für die Wissensgraph-Einbettung (KGE) wird bereitgestellt. Es verwendet den Freebase-Datensatz, eine Wissensdatenbank allgemeiner Fakten. Ein Anwendungsfallbeispiel wäre, die Beziehungen von Personen grafisch darzustellen und ihre Nationalität vorherzusagen. 

Ein Beispiel für die Implementierung eines Graph Convolutional Network (GCN) zeigt, wie Sie ein Graph-Netzwerk trainieren können, um Toxizität vorherzusagen. Der physiologische Datensatz Tox21 liefert Toxizitätsmessungen für die Auswirkung von Substanzen auf biologische Reaktionen. 

Ein weiteres GCN-Beispiel zeigt Ihnen, wie Sie ein Graph-Netzwerk anhand eines Literaturverzeichnis-Datensatzes wissenschaftlicher Publikationen trainieren, das als Cora bekannt ist. Sie können damit Beziehungen zwischen Autoren, Themen und Konferenzen aufdecken.

Das erste Beispiel ist ein Empfehlungssystem für Filmrezensionen. Es verwendet ein GCMC-Netzwerk (Graph Convolutional Matrix Completion), das anhand der Datensätze trainiert wurde. MovieLens Diese Datensätze bestehen aus Filmtiteln, Genres und Bewertungen von Benutzern.