Exportieren Sie Parameterfelder im params-JSON-Objekt der obersten Ebene - Amazon Neptune

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Exportieren Sie Parameterfelder im params-JSON-Objekt der obersten Ebene

Mit dem params-Neptune-Export-JSON-Objekt können Sie den Export steuern, einschließlich des Typs und des Formats der exportierten Daten.

Liste der möglichen Felder im params-Exportparameterobjekt

Im Folgenden sind alle möglichen Felder der obersten Ebene aufgeführt, die in einem params-Objekt vorkommen können. Nur eine Teilmenge dieser Felder kommt in einem Objekt vor.

Liste der Felder, die allen Exporttypen gemeinsam sind

Liste der Felder für den Export von Eigenschaftsgraphen

Liste der Felder für RDF-Exporte

Felder, die allen Exporttypen gemeinsam sind

cloneCluster-Feld in params

(Optional). Standard: false.

Wenn der cloneCluster-Parameter auf true gesetzt ist, verwendet der Exportvorgang einen schnellen Klon Ihres DB-Clusters:

"cloneCluster" : true

Standardmäßig exportiert der Exportvorgang Daten aus dem DB-Cluster, den Sie mit den Parametern endpoint, endpoints oder clusterId angeben. Wenn Ihr DB-Cluster jedoch während des Exports verwendet wird und sich Daten ändern, kann der Exportvorgang die Konsistenz der exportierten Daten nicht garantieren.

Um sicherzustellen, dass die exportierten Daten konsistent sind, verwenden Sie stattdessen den cloneCluster-Parameter, um aus einem statischen Klon Ihres DB-Clusters zu exportieren.

Der geklonte DB-Cluster wird in derselben VPC wie der Quell-DB-Cluster erstellt und übernimmt die Sicherheitsgruppe, die Subnetzgruppe und die IAM-Datenbankauthentifizierungse instellungen der Quelle. Wenn der Export abgeschlossen ist, löscht Neptune den geklonten DB-Cluster.

Standardmäßig besteht ein geklonter DB-Cluster aus einer einzigen Instance desselben Instance-Typs wie die primäre Instance im Quell-DB-Cluster. Sie können den Instance-Typ ändern, der für den geklonten DB-Cluster verwendet wird, indem Sie mit cloneClusterInstanceType einen anderen Instance-Typ angeben.

Anmerkung

Wenn Sie die cloneCluster-Option nicht verwenden und direkt aus Ihrem Haupt-DB-Cluster exportieren, müssen Sie möglicherweise das Timeout für die Instances erhöhen, aus denen Daten exportiert werden. Bei großen Datensätzen sollte das Timeout auf mehrere Stunden festgelegt werden.

cloneClusterInstanceType-Feld in params

(Optional).

Wenn der cloneCluster-Parameter vorhanden und auf true gesetzt ist, können Sie den cloneClusterInstanceType-Parameter verwenden, um den Instance-Typ anzugeben, der für den geklonten DB-Cluster verwendet wird:

Standardmäßig besteht ein geklonter DB-Cluster aus einer einzigen Instance desselben Instance-Typs wie die primäre Instance im Quell-DB-Cluster.

"cloneClusterInstanceType" : "(for example, r5.12xlarge)"

cloneClusterReplicaCount-Feld in params

(Optional).

Wenn der cloneCluster-Parameter vorhanden und auf true gesetzt ist, können Sie den cloneClusterReplicaCount-Parameter verwenden, um die Anzahl der Lesereplikat-Instances anzugeben, die im geklonten DB-Cluster erstellt wurden:

"cloneClusterReplicaCount" : (for example, 3)

Standardmäßig besteht ein geklonter DB-Cluster aus einer einzigen primären Instance. Mit dem cloneClusterReplicaCount-Parameter können Sie angeben, wie viele zusätzliche Lesereplikat-Instances erstellt werden sollen.

clusterId-Feld in params

(Optional).

Der clusterId-Parameter gibt die ID eines zu verwendenden DB-Clusters an:

"clusterId" : "(the ID of your DB cluster)"

Wenn Sie den clusterId-Parameter verwenden, verwendet der Exportvorgang alle verfügbaren Instances in diesem DB-Cluster, um Daten zu extrahieren.

Anmerkung

Die Parameter endpoint, endpoints und clusterId schließen sich gegenseitig aus. Verwenden Sie stets nur einen davon.

endpoint-Feld in params

(Optional).

Verwenden Sie endpoint, um einen Endpunkt einer Neptune-Instance in Ihrem DB-Cluster anzugeben, den der Exportprozess abfragen kann, um Daten zu extrahieren (siehe Endpunktverbindungen). Dies ist nur der DNS-Name und beinhaltet nicht das Protokoll oder den Port:

"endpoint" : "(a DNS endpoint of your DB cluster)"

Verwenden Sie einen Cluster oder Instance-Endpunkt, aber nicht den Haupt-Leser-Endpunkt.

Anmerkung

Die Parameter endpoint, endpoints und clusterId schließen sich gegenseitig aus. Verwenden Sie stets nur einen davon.

endpoints-Feld in params

(Optional).

Verwenden Sie endpoints, um ein JSON-Array von Endpunkten in Ihrem DB-Cluster anzugeben, das der Exportprozess abfragen kann, um Daten zu extrahieren (siehe Endpunktverbindungen). Dies sind nur DNS-Namen ohne Protokoll oder Port:

"endpoints": [ "(one endpoint in your DB cluster)", "(another endpoint in your DB cluster)", "(a third endpoint in your DB cluster)" ]

Wenn Sie mehrere Instances in Ihrem Cluster haben (eine primäre und ein oder mehrere Lesereplikate), können Sie die Exportleistung verbessern, indem Sie den endpoints-Parameter verwenden, um Abfragen auf eine Liste dieser Endpunkte zu verteilen.

Anmerkung

Die Parameter endpoint, endpoints und clusterId schließen sich gegenseitig aus. Verwenden Sie stets nur einen davon.

profile-Feld in params

(Erforderlich, um Trainingsdaten für Neptune ML zu exportieren, sofern das neptune_ml-Feld nicht im additionalParams-Feld vorhanden ist).

Der profile-Parameter stellt Sätze vorkonfigurierter Parameter für bestimmte Workloads bereit. Derzeit unterstützt der Exportvorgang nur das Profil neptune_ml

Wenn Sie Trainingsdaten für Neptune ML exportieren, fügen Sie dem params-Objekt den folgenden Parameter hinzu:

"profile" : "neptune_ml"

useIamAuth-Feld in params

(Optional). Standard: false.

Wenn für die Datenbank, aus der Sie Daten exportieren, die IAM-Authentifizierung aktiviert ist, müssen Sie den Parameter useIamAuth mit der Einstellung auf true einschließen:

"useIamAuth" : true

includeLastEventId-Feld in params

Wenn Sie den Wert includeLastEventId auf „true“ setzen und in der Datenbank, aus der Sie Daten exportieren, Neptune Streams aktiviert ist, schreibt der Exportvorgang eine lastEventId.json-Datei an den angegebenen Exportspeicherort. Diese Datei enthält das commitNum und das opNum des letzten Ereignisses im Stream.

"includeLastEventId" : true

Eine durch den Exportvorgang erstellte geklonte Datenbank übernimmt die Streams-Einstellung der übergeordneten Datenbank. Wenn für das übergeordnete Objekt Streams aktiviert sind, sind auch Streams für den Klon aktiviert. Der Inhalt des Streams auf dem Klon entspricht dem Inhalt des übergeordneten Streams (einschließlich derselben Ereignis-IDs) zu dem Zeitpunkt, zu dem der Klon erstellt wurde.

Felder für den Export von Eigenschaftsgraphen

concurrency-Feld in params

(Optional). Standard: 4.

Der concurrency-Parameter gibt die Anzahl der parallelen Abfragen an, die der Exportvorgang verwenden soll:

"concurrency" : (for example, 24)

Dabei ist es sinnvoll, die Parallelitätsebene auf die doppelte Anzahl von vCPUs auf allen Instances festzulegen, aus denen Sie Daten exportieren. Eine r5.xlarge-Instance hat beispielsweise 4 vCPUs. Wenn Sie aus einem Cluster von 3 r5.xlarge-Instances exportieren, können Sie die Parallelitätsebene auf 24 (= 3 x 2 x 4) festlegen.

Wenn Sie den Neptune-Export-Service verwenden, ist die Parallelitätsebene durch die JobSize-Einstellung begrenzt. Ein kleiner Auftrag unterstützt beispielsweise eine Parallelitätsebene von 8. Wenn Sie versuchen, mithilfe des concurrency-Parameters eine Parallelitätsebene von 24 für einen kleinen Auftrag anzugeben, bleibt die effektive Ebene bei 8.

Wenn Sie aus einem geklonten Cluster exportieren, berechnet der Exportprozess auf der Grundlage der Größe der geklonten Instances und der Auftragsgröße eine angemessene Parallelitätsebene.

edgeLabels-Feld in params

(Optional).

Verwenden Sie edgeLabels, um nur die Edges zu exportieren, deren Etiketten Sie angeben:

"edgeLabels" : ["(a label)", "(another label"]

Jedes Etikett im JSON-Array muss ein einzelnes, einfaches Etikett sein.

Der scope-Parameter hat Vorrang vor dem edgeLabels-Parameter. Wenn der scope-Wert also keine Edges enthält, hat der edgeLabels-Parameter keine Wirkung.

filter-Feld in params

(Optional).

Verwenden Sie filter, um anzugeben, dass nur Knoten und/oder Edges mit bestimmten Etiketten exportiert werden sollen, und um die Eigenschaften zu filtern, die für jeden Knoten oder jedes Edge exportiert werden.

Die allgemeine Struktur eines filter-Objekts, entweder direkt oder in einer Filterkonfigurationsdatei, sieht wie folgt aus:

"filter" : { "nodes": [ (array of node label and properties objects) ], "edges": [ (array of edge definition an properties objects) ] }
  • nodes – Enthält ein JSON-Array von Knoten und Knoteneigenschaften in der folgenden Form:

    "nodes : [ { "label": "(node label)", "properties": [ "(a property name)", "(another property name)", ( ... ) ] } ]
    • label – Etikett(en) des Eigenschaftsgraphen des Knotens.

      Akzeptiert einen einzelnen Wert oder, wenn der Knoten mehrere Etiketten hat, ein Array von Werten.

    • properties – Enthält ein Array mit den Namen der Eigenschaften des Knotens, die Sie exportieren möchten.

  • edges – Enthält ein JSON-Array mit Edge-Definitionen in der folgenden Form:

    "edges" : [ { "label": "(edge label)", "properties": [ "(a property name)", "(another property name)", ( ... ) ] } ]
    • label – Etikett des Edge-Eigenschaftsgraphen. Nimmt einen einzelnen Wert an.

    • properties – Enthält ein Array mit den Namen der Eigenschaften des Edges, die Sie exportieren möchten.

filterConfigFile-Feld in params

(Optional).

Verwenden Sie filterConfigFile, um eine JSON-Datei anzugeben, die eine Filterkonfiguration in derselben Form enthält, die der filter-Parameter annimmt:

"filterConfigFile" : "s3://(your Amazon S3 bucket)/neptune-export/(the name of the JSON file)"

Informationen zum Format der filterConfigFile-Datei finden Sie unter Filter.

format-Feld, das für Eigenschaftsgraphdaten in params verwendet wird

(Optional). Standart: csv (CSV)

Der format-Parameter gibt das Ausgabeformat der exportierten Eigenschaftsgraphdaten an:

"format" : (one of: csv, csvNoHeaders, json, neptuneStreamsJson)

gremlinFilter-Feld in params

(Optional).

Mit dem gremlinFilter-Parameter können Sie ein Gremlin-Snippet angeben, z. B. einen has()-Schritt, mit dem sowohl Knoten als auch Edges gefiltert werden:

"gremlinFilter" : (a Gremlin snippet)

Feldnamen und Zeichenfolgenwerte sollten von doppelten Escape-Anführungszeichen umgeben sein. Für Datums- und Uhrzeitangaben können Sie die Datetime-Methode verwenden.

Im folgenden Beispiel werden nur die Knoten und Edges exportiert, deren Erstellungsdatum nach dem 10.10.2021 liegt:

"gremlinFilter" : "has(\"created\", gt(datetime(\"2021-10-10\")))"

gremlinNodeFilter-Feld in params

(Optional).

Mit dem gremlinNodeFilter-Parameter können Sie ein Gremlin-Snippet angeben, z. B. einen has()-Schritt, mit dem Knoten gefiltert werden:

"gremlinNodeFilter" : (a Gremlin snippet)

Feldnamen und Zeichenfolgenwerte sollten von doppelten Escape-Anführungszeichen umgeben sein. Für Datums- und Uhrzeitangaben können Sie die Datetime-Methode verwenden.

Das folgende Beispiel exportiert nur die Knoten mit einer booleschen deleted Eigenschaft, deren Wert true ist:

"gremlinNodeFilter" : "has(\"deleted\", true)"

gremlinEdgeFilter-Feld in params

(Optional).

Mit dem gremlinEdgeFilter-Parameter können Sie ein Gremlin-Snippet angeben, z. B. einen has()-Schritt, mit dem Edges gefiltert werden:

"gremlinEdgeFilter" : (a Gremlin snippet)

Feldnamen und Zeichenfolgenwerte sollten von doppelten Escape-Anführungszeichen umgeben sein. Für Datums- und Uhrzeitangaben können Sie die Datetime-Methode verwenden.

Das folgende Beispiel exportiert nur die Edges mit einer numerischen strength-Eigenschaft, deren Wert 5 ist:

"gremlinEdgeFilter" : "has(\"strength\", 5)"

nodeLabels-Feld in params

(Optional).

Verwenden Sie nodeLabels, um nur die Knoten zu exportieren, deren Etiketten Sie angeben:

"nodeLabels" : ["(a label)", "(another label"]

Jedes Etikett im JSON-Array muss ein einzelnes, einfaches Etikett sein.

Der scope-Parameter hat Vorrang vor dem nodeLabels-Parameter. Wenn der scope-Wert keine Knoten enthält, hat der nodeLabels-Parameter daher keine Wirkung.

scope-Feld in params

(Optional). Standard: all.

Der scope-Parameter gibt an, ob nur Knoten, nur Edges oder Knoten und Edges exportiert werden sollen:

"scope" : (one of: nodes, edges, or all)
  • nodes – Exportiert nur Knoten und ihre Eigenschaften.

  • edges – Exportiert nur Edges und ihre Eigenschaften.

  • all – Exportiert sowohl Knoten als auch Edges und ihre Eigenschaften (Standard).

Felder für den RDF-Export

format-Feld, das für RDF-Daten in params verwendet wird

(Optional). Standardwert: turtle

Der format-Parameter gibt das Ausgabeformat der exportierten RDF-Daten an:

"format" : (one of: turtle, nquads, ntriples, neptuneStreamsJson)
  • turtle – Ausgabe im Turtle-Format.

  • nquads – N-Quads-formatierte Daten ohne Spaltenüberschriften.

  • ntriples – N-Triples-formatierte Daten.

  • neptuneStreamsJson – JSON-formatierte Daten, die das SPARQL NQUADS-Änderungsserialisierungsformat verwenden.

rdfExportScope-Feld in params

(Optional). Standard: graph.

Der rdfExportScope-Parameter gibt den Umfang des RDF-Exports an:

"rdfExportScope" : (one of: graph, edges, or query)
  • graph – Exportiert alle RDF-Daten.

  • edges – Exportiert nur die Triples, die Edges repräsentieren.

  • query – Exportiert Daten, die durch eine SPARQL-Abfrage abgerufen wurden, die mithilfe des Felds sparql bereitgestellt wird.

sparql-Feld in params

(Optional).

Mit dem sparql-Parameter können Sie eine SPARQL-Abfrage angeben, um die zu exportierenden Daten abzurufen:

"sparql" : (a SPARQL query)

Wenn Sie eine Abfrage mithilfe des sparql-Felds angeben, müssen Sie das rdfExportScope-Feld auch auf query setzen.

namedGraph-Feld in params

(Optional).

Mit dem namedGraph Parameter können Sie einen IRI angeben, um den Export auf ein einzelnes benanntes Diagramm zu beschränken:

"namedGraph" : (Named graph IRI)

Der namedGraph Parameter kann nur verwendet werden, wenn das rdfExportScope Feld auf gesetzt istgraph.