Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Parameter, die zur Steuerung des Neptun-Exportprozesses verwendet werden
Unabhängig davon, ob Sie den Neptune-Export-Service oder das neptune-export
-Befehlszeilen-Dienstprogramm verwenden, sind die Parameter, die Sie zur Steuerung des Exports verwenden, größtenteils dieselben. Sie enthalten ein JSON-Objekt, das an den Neptune-Export-Endpunkt oder an neptune-export
auf der Befehlszeile übergeben wird.
Das an den Exportvorgang übergebene Objekt hat bis zu fünf Felder der obersten Ebene:
-d '{ "command" : "
(either
", "outputS3Path" : "s3:/export-pg
orexport-rdf
)(your Amazon S3 bucket)
/(path to the folder for exported data)
", "jobsize" : "(for Neptune-Export service only)
", "params" : {(a JSON object that contains export-process parameters)
}, "additionalParams": {(a JSON object that contains parameters for training configuration)
} }'
Inhalt
- Der command-Parameter
- Der outputS3Path-Parameter
- Der jobSize-Parameter
- Das params-Objekt
- Das additionalParams-Objekt
- Exportieren Sie Parameterfelder im params-JSON-Objekt der obersten Ebene
- Liste der möglichen Felder im params-Exportparameterobjekt
- Felder, die allen Exporttypen gemeinsam sind
- Felder für den Export von Eigenschaftsgraphen
- concurrency-Feld in params
- edgeLabels-Feld in params
- filter-Feld in params
- filterConfigFile-Feld in params
- format-Feld, das für Eigenschaftsgraphdaten in params verwendet wird
- gremlinFilter-Feld in params
- gremlinNodeFilter-Feld in params
- gremlinEdgeFilter-Feld in params
- nodeLabels-Feld in params
- scope-Feld in params
- Felder für den RDF-Export
- Beispiele für das Filtern der exportierten Inhalte
- Filtern des Exports von Eigenschaftsgraphdaten
- Beispiel für die Verwendung von scope, um nur Edges zu exportieren
- Beispiel für die Verwendung von nodeLabels und edgeLabels, um nur Knoten und Edges mit bestimmten Etiketten zu exportieren
- Beispiel für die Verwendung von filter, um nur bestimmte Knoten, Edges und Eigenschaften zu exportieren
- Beispiel mit gremlinFilter
- Beispiel mit gremlinNodeFilter
- Beispiel mit gremlinEdgeFilter
- Kombination von filter, gremlinNodeFilter, nodeLabels, edgeLabels und scope
- Filtern des Exports von RDF-Daten
- Filtern des Exports von Eigenschaftsgraphdaten
Der command
-Parameter
Der Parameter command
auf der obersten Ebene bestimmt, ob Eigenschaftsgraphdaten oder RDF-Daten exportiert werden. Wenn Sie den command
-Parameter weglassen, werden beim Export standardmäßig Eigenschaftsgraphdaten exportiert.
export-pg
– Export von Daten aus Eigenschaftsgraphenexport-rdf
– Export von RDF-Daten.
Der outputS3Path
-Parameter
Der Parameter outputS3Path
der obersten Ebene ist erforderlich und muss die URI eines Amazon-S3-Speicherorts enthalten, an dem die exportierten Dateien veröffentlicht werden können:
"outputS3Path" : "s3://
(your Amazon S3 bucket)
/(path to output folder)
"
Der Wert muss mit s3://
beginnen, gefolgt von einem gültigen Bucket-Namen und optional einem Ordnerpfad innerhalb des Buckets.
Der jobSize
-Parameter
Der Parameter jobSize
der obersten Ebene wird nur mit dem Neptune-Export-Service verwendet, nicht mit dem neptune-export
-Befehlszeilen-Dienstprogramm, und ist optional. Damit können Sie die Größe des Exportauftrags, den Sie starten, angeben. Auf diese Weise können Sie die Menge der Computing-Ressourcen, die für den Auftrag bereitgestellt werden, und den maximalen Parallelitätsgrad bestimmen.
"jobsize" : "
(one of four size descriptors)
"
Die vier gültigen Größendeskriptoren sind:
small
– Maximale Parallelität: 8. Geeignet für Speichervolumina von bis zu 10 GB.medium
– Maximale Parallelität: 32. Geeignet für Speichervolumina von bis zu 100 GB.large
– Maximale Parallelität: 64. Geeignet für Speichervolumina über 100 GB, aber unter 1 TB.xlarge
– Maximale Parallelität: 96. Geeignet für Speichervolumina über 1 TB.
Standardmäßig wird ein auf dem Neptune-Export-Service initiierter Export als small
Auftrag ausgeführt.
Die Leistung eines Exports hängt nicht nur von der jobSize
-Einstellung ab, sondern auch von der Anzahl der Datenbank-Instances, aus denen Sie exportieren, der Größe jeder Instance und dem effektiven Parallelitätsgrad des Auftrags.
Für Exporte von Eigenschaftsgraphen können Sie die Anzahl der Datenbank-Instances mithilfe des cloneClusterReplicaAnzahl-Parameters konfigurieren und mithilfe des concurrency-Parameters den effektiven Parallelitätsgrad des Auftrags konfigurieren.
Das params
-Objekt
Der Parameter params
der obersten Ebene ist ein JSON-Objekt, das Parameter enthält, mit denen Sie den Exportvorgang selbst steuern, wie unter Exportieren Sie Parameterfelder im params-JSON-Objekt der obersten Ebene erläutert. Einige Felder im params
-Objekt sind spezifisch für Eigenschaftsgraph-Exporte, andere für RDF.
Das additionalParams
-Objekt
Der Parameter additionalParams
der obersten Ebene ist ein JSON-Objekt, das Parameter enthält, mit denen Sie Aktionen steuern können, die nach dem Export auf die Daten angewendet werden. additionalParams
wird derzeit nur für den Export von Trainingsdaten für Neptune ML verwendet.