Parameter, die zur Steuerung des Neptun-Exportprozesses verwendet werden - Amazon Neptune

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Parameter, die zur Steuerung des Neptun-Exportprozesses verwendet werden

Unabhängig davon, ob Sie den Neptune-Export-Service oder das neptune-export-Befehlszeilen-Dienstprogramm verwenden, sind die Parameter, die Sie zur Steuerung des Exports verwenden, größtenteils dieselben. Sie enthalten ein JSON-Objekt, das an den Neptune-Export-Endpunkt oder an neptune-export auf der Befehlszeile übergeben wird.

Das an den Exportvorgang übergebene Objekt hat bis zu fünf Felder der obersten Ebene:

-d '{ "command" : "(either export-pg or export-rdf)", "outputS3Path" : "s3:/(your Amazon S3 bucket)/(path to the folder for exported data)", "jobsize" : "(for Neptune-Export service only)", "params" : { (a JSON object that contains export-process parameters) }, "additionalParams": { (a JSON object that contains parameters for training configuration) } }'
Inhalt

Der command-Parameter

Der Parameter command auf der obersten Ebene bestimmt, ob Eigenschaftsgraphdaten oder RDF-Daten exportiert werden. Wenn Sie den command-Parameter weglassen, werden beim Export standardmäßig Eigenschaftsgraphdaten exportiert.

  • export-pg – Export von Daten aus Eigenschaftsgraphen

  • export-rdf – Export von RDF-Daten.

Der outputS3Path-Parameter

Der Parameter outputS3Path der obersten Ebene ist erforderlich und muss die URI eines Amazon-S3-Speicherorts enthalten, an dem die exportierten Dateien veröffentlicht werden können:

"outputS3Path" : "s3://(your Amazon S3 bucket)/(path to output folder)"

Der Wert muss mit s3:// beginnen, gefolgt von einem gültigen Bucket-Namen und optional einem Ordnerpfad innerhalb des Buckets.

Der jobSize-Parameter

Der Parameter jobSize der obersten Ebene wird nur mit dem Neptune-Export-Service verwendet, nicht mit dem neptune-export-Befehlszeilen-Dienstprogramm, und ist optional. Damit können Sie die Größe des Exportauftrags, den Sie starten, angeben. Auf diese Weise können Sie die Menge der Computing-Ressourcen, die für den Auftrag bereitgestellt werden, und den maximalen Parallelitätsgrad bestimmen.

"jobsize" : "(one of four size descriptors)"

Die vier gültigen Größendeskriptoren sind:

  • small – Maximale Parallelität: 8. Geeignet für Speichervolumina von bis zu 10 GB.

  • medium – Maximale Parallelität: 32. Geeignet für Speichervolumina von bis zu 100 GB.

  • large – Maximale Parallelität: 64. Geeignet für Speichervolumina über 100 GB, aber unter 1 TB.

  • xlarge – Maximale Parallelität: 96. Geeignet für Speichervolumina über 1 TB.

Standardmäßig wird ein auf dem Neptune-Export-Service initiierter Export als small Auftrag ausgeführt.

Die Leistung eines Exports hängt nicht nur von der jobSize-Einstellung ab, sondern auch von der Anzahl der Datenbank-Instances, aus denen Sie exportieren, der Größe jeder Instance und dem effektiven Parallelitätsgrad des Auftrags.

Für Exporte von Eigenschaftsgraphen können Sie die Anzahl der Datenbank-Instances mithilfe des cloneClusterReplicaAnzahl-Parameters konfigurieren und mithilfe des concurrency-Parameters den effektiven Parallelitätsgrad des Auftrags konfigurieren.

Das params-Objekt

Der Parameter params der obersten Ebene ist ein JSON-Objekt, das Parameter enthält, mit denen Sie den Exportvorgang selbst steuern, wie unter Exportieren Sie Parameterfelder im params-JSON-Objekt der obersten Ebene erläutert. Einige Felder im params-Objekt sind spezifisch für Eigenschaftsgraph-Exporte, andere für RDF.

Das additionalParams-Objekt

Der Parameter additionalParams der obersten Ebene ist ein JSON-Objekt, das Parameter enthält, mit denen Sie Aktionen steuern können, die nach dem Export auf die Daten angewendet werden. additionalParams wird derzeit nur für den Export von Trainingsdaten für Neptune ML verwendet.