用來控制 Neptune 匯出程序的參數 - Amazon Neptune

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

用來控制 Neptune 匯出程序的參數

無論您使用的是 Neptune-Export 服務還是 neptune-export 命令行公用程式,您用來控制匯出的參數大部分都是相同的。它們包含傳遞至 Neptune-Export 端點或傳遞至命令行上 neptune-export 的 JSON 物件。

傳入匯出程序的物件最多可有五個頂層欄位:

-d '{ "command" : "(either export-pg or export-rdf)", "outputS3Path" : "s3:/(your Amazon S3 bucket)/(path to the folder for exported data)", "jobsize" : "(for Neptune-Export service only)", "params" : { (a JSON object that contains export-process parameters) }, "additionalParams": { (a JSON object that contains parameters for training configuration) } }'
內容

command 參數

command 頂層參數決定要匯出屬性圖資料還是 RDF 資料。如果您省略 command 參數,匯出程序預設為匯出屬性圖資料。

  • export-pg – 匯出屬性圖資料。

  • export-rdf – 匯出 RDF 資料。

outputS3Path 參數

outputS3Path 頂層參數為必要參數,且必須包含可將已匯出檔案發佈至其中之 Amazon S3 位置的 URI:

"outputS3Path" : "s3://(your Amazon S3 bucket)/(path to output folder)"

此值必須以 s3:// 開始,其後跟著有效的儲存貯體名稱,以及選擇性地跟著儲存貯體內的資料夾路徑。

jobSize 參數

jobSize 頂層參數只會與 Neptune-Export 服務搭配使用,而不會與 neptune-export 命令列公用程式搭配使用,而且是選用的。它可讓您描述正在啟動的匯出工作大小,這有助於判斷專用於工作的運算資源數量及其最大並行層級。

"jobsize" : "(one of four size descriptors)"

四個有效的大小描述項如下:

  • small – 並行上限:8。適用於高達 10 GB 的儲存磁碟區。

  • medium – 並行上限:32。適用於高達 100 GB 的儲存磁碟區。

  • large – 並行上限:64。適用於超過 100 GB 但小於 1 TB 的儲存磁碟區。

  • xlarge – 並行上限:96。適用於超過 1 TB 的儲存磁碟區。

根據預設,在 Neptune-Export 服務上啟動的匯出會以 small 工作的形式執行。

匯出的效能不僅取決於 jobSize 設定,還取決於您要從中匯出的資料庫執行個體數目、每個執行個體的大小,以及工作的有效並行層級。

對於屬性圖匯出,您可以使用 cloneClusterReplica伯爵 參數設定資料庫執行個體的數目,也可以使用 concurrency 參數設定工作的有效並行層級。

params 物件

params 頂層參數是 JSON 物件,其中包含您用來控制匯出程序本身的參數,如 匯出 params 頂層 JSON 物件中的參數欄位 中所述。params 物件中的有些欄位是屬性圖匯出特有的,有些欄位則是 RDF 特有的。

additionalParams 物件

additionalParams 頂層參數是 JSON 物件,您可以使用其中包含的參數,控制在資料匯出之後套用至該資料的動作。目前,additionalParams 僅用於匯出 Neptune ML 的訓練資料。