翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Neptune データプレーンバルクローダー API
一括ロードアクション:
一括ロード構造:
StartLoaderJob (アクション)
この API の AWS CLI 名は start-loader-job
です。
Neptune バルクローダージョブを開始して、Amazon S3 バケットから Neptune DB インスタンスにデータをロードします。「Amazon Neptune バルクローダーを使用したデータの取り込み」を参照してください。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:StartLoaderJob IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
dependencies (CLI では:
--dependencies
) — タイプstring
の文字列 (UTF-8 でエンコードされた文字列)。これは、キュー内の 1 つ以上の前のジョブが正常に完了することを条件に、キューに入れられたロードリクエストを作成することができるオプションのパラメータです。
Neptune は、
queueRequest
パラメータが"TRUE"
に設定されている場合、一度に最大 64 個のロードリクエストをキューに入れることができます。dependencies
パラメータを使用すると、キュー内で指定された 1 つ以上前のリクエストが正常に完了したかどうかに応じて、キューに入れられたそのようなリクエストを実行できます。たとえば、ロード
Job-A
とJob-B
が互いに独立しているものの、ロードJob-C
を開始する前にJob-A
およびJob-B
を終了する必要がある場合は、次の手順を実行します。-
任意の順序で
load-job-A
とload-job-B
を 1 つずつ送信し、load-id を保存します。 -
dependencies
フィールドで 2 つのジョブの load-id を付けてload-job-C
を送信します。
"dependencies" : ["(job_A_load_id)", "(job_B_load_id)"]
dependencies
パラメータのため、Job-A
とJob-B
が正常に完了するまで、バルクローダーはJob-C
を起動しません。いずれかが失敗すると、Job-C は実行されず、そのステータスはLOAD_FAILED_BECAUSE_DEPENDENCY_NOT_SATISFIED
に設定されます。この方法で複数のレベルの依存関係を設定できます。これにより、1 つのジョブが失敗すると、直接的または間接的に依存するすべてのリクエストがキャンセルされます。
-
-
failOnError (CLI では:
--fail-on-error
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。failOnError
- エラー時に完全な停止を切り替えるフラグ。使用できる値:
"TRUE"
、"FALSE"
。デフォルト値:
"TRUE"
。このパラメータを
"FALSE"
に設定すると、ローダーは指定された場所のすべてのデータをロードし、エラーのあるエントリはスキップします。このパラメータを
"TRUE"
に設定すると、ローダーはエラー発生時にすぐに停止します。その時点までロードされたデータは保持されます。 -
format (CLI では:
--format
) — 必須:string
タイプの形式 (UTF-8 でエンコードされた文字列)。データの形式です。Neptune
Loader
コマンドのデータ形式の詳細については、「データ読み込み形式」を参照してください。許可される値
-
csv
Gremlin CSV データ形式用。 -
opencypher
openCypher CSV データ形式用。 -
ntriples
N-Triples RDF データ形式用。 -
nquads
N-Quads RDF データ形式用。 -
rdfxml
RDF\XML RDF データ形式用。 -
turtle
Turtle RDF データ形式用。
-
-
iamRoleArn (CLI では:
--iam-role-arn
) — 必須:string
タイプの文字列 (UTF-8 でエンコードされた文字列)。S3 バケットにアクセスするために、Neptune DB インスタンスによって想定される IAM ロールの Amazon リソースネーム (ARN)。ここで指定した IAM ロール ARN は DB クラスターにアタッチする必要があります (「Amazon Neptune クラスターへの IAM ロールの追加」を参照)。
-
mode (CLI では:
--mode
) — タイプstring
のモード (UTF-8 でエンコードされた文字列)。ロードジョブモード。
使用できる値:
RESUME
、NEW
、AUTO
。デフォルト値:
AUTO
。-
RESUME
- RESUME モードでは、ローダーはこのソースからの以前のロードを検索し、見つかった場合は、そのロードジョブを再開します。以前のロードジョブが見つからない場合、ローダーは停止します。ローダーは、以前のジョブで正常にロードされたファイルの再ロードを回避します。失敗したファイルの処理のみを試行します。以前にロードしたデータを Neptune クラスターから削除している場合、そのデータはこのモードでは再ロードされません。以前のロードジョブが同じソースからすべてのファイルを正常にロードした場合、何も再ロードされず、ローダーは成功を返します。
-
NEW
- NEW モードでは、以前のロードに関係なく、新しいロードリクエストが作成されます。このモードを使用して、以前にロードされたデータを Neptune クラスターから削除した後にソースからすべてのデータを再ロードしたり、同じソースから利用可能な新しいデータをロードしたりするために使用できます。 -
AUTO
- AUTO モードでは、ローダーは同じソースから以前のロードジョブを検索し、見つかった場合は、RESUME
モードと同様にそのジョブを再開します。ローダーが同じソースから以前のロードジョブを見つけられない場合、
NEW
モードの場合と同様に、ソースからすべてのデータがロードされます。
-
-
parallelism (CLI では:
--parallelism
) — タイプstring
のパラレリズム (UTF-8 でエンコードされた文字列)。一括ロードプロセスで使用されるスレッド数を減らすように設定できるオプションの
parallelism
パラメータ。許可される値:
-
LOW
- 使用されるスレッドの数は、コア数を 8 で割った値です。 -
MEDIUM
- 使用されるスレッドの数は、コア数を 2 で割った値です。 -
HIGH
- 使用されるスレッドの数は、コア数と同じです。 -
OVERSUBSCRIBE
- 使用されるスレッドの数は、コア数に 2 をかけた値です。この値を使用する場合、バルクローダーは利用可能なすべてのリソースを消費します。ただし、これは、
OVERSUBSCRIBE
設定すると、CPU 使用率が 100% になります。ロードオペレーションは I/O バウンドであるため、予想される CPU 最高使用率は 60% ~ 70% の範囲にあります。
デフォルト値:
HIGH
parallelism
openCypher データをロードするときに、設定によってスレッド間でデッドロックが発生することがあります。こうなると、Neptune はLOAD_DATA_DEADLOCK
というエラーを返します。通常、この問題は次のようにして修正できます。parallelism
より低い設定にし、ロードコマンドを再試行します。 -
-
parserConfiguration (CLI では:
--parser-configuration
) - キと値のペアのマップ配列。各キーは、タイプ
string
の文字列 (UTF-8 でエンコードされた文字列) です。各値は、タイプ
string
の文字列 (UTF-8 でエンコードされた文字列) です。parserConfiguration
- 追加のパーサー設定値のあるオプションのオブジェクト。それぞれの子パラメータもオプションです。-
namedGraphUri
- グラフが指定されていない場合の、すべての RDF 形式のデフォルトのグラフ (四角形でない形式、およびグラフのない NQUAD エントリ)。デフォルトは
https://aws.amazon.com/neptune/vocab/v01/DefaultNamedGraph
です。 -
baseUri
- RDF/XML および Turtle 形式の基本 URI。デフォルトは
https://aws.amazon.com/neptune/default
です。 -
allowEmptyStrings
- Gremlin ユーザーは、CSV データを読み込むときに、ノードおよびエッジのプロパティとして空の文字列値 ("") を渡す必要があります。allowEmptyStrings
がfalse
(デフォルト) に設定されている場合、そのような空の文字列は NULL として扱われ、ロードされません。allowEmptyStrings
がtrue
に設定されている場合、ローダーは空の文字列を有効なプロパティ値として扱い、それに応じてロードします。
-
-
queueRequest (CLI では:
--queue-request
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。これは、ロードリクエストをキューに入れることができるかどうかを示すオプションのフラグパラメータです。
queueRequest
パラメータをすべて"TRUE"
に設定している場合、Neptune は一度に最大 64 個のジョブをキューに入れることができるので、次のジョブを発行する前に 1 つのロードジョブが完了するのを待つ必要はありません。ジョブのキューの順序は、FIFO (先入れ先出し) です。queueRequest
パラメータを省略するるか、"FALSE"
に設定した場合、別のロードジョブがすでに実行されていると、ロードリクエストは失敗します。使用できる値:
"TRUE"
、"FALSE"
。デフォルト値:
"FALSE"
。 -
s3BucketRegion (CLI では:
--s-3-bucket-region
) — 必須:string
タイプの S3BucketRegion (UTF-8 でエンコードされた文字列)。S3 バケットの Amazon リージョン。これは DB クラスターの Amazon リージョンと一致する必要があります。
-
source (CLI では:
--source
) — 必須:string
タイプの文字列 (UTF-8 でエンコードされた文字列)。source
パラメータは、単一のファイル、複数のファイル、1 つのフォルダ、または複数のフォルダを識別する S3 URI を受け入れます。Neptune は、指定されたフォルダ内のすべてのデータファイルをロードします。URI は、以下の形式のいずれかになります。
-
s3://(bucket_name)/(object-key-name)
-
https://s3.amazonaws.com/(bucket_name)/(object-key-name)
-
https://s3.us-east-1.amazonaws.com/(bucket_name)/(object-key-name)
URI の
object-key-name
要素は、S3 の ListObjects API コール内の prefix パラメータと同等です。これは、名前がそのプレフィックスで始まる指定された S3 バケット内のすべてのオブジェクトを識別します。これは、単一のファイルまたはフォルダ、または複数のファイルやフォルダにすることができます。特定のフォルダには複数の頂点ファイルおよび複数のエッジファイルが含まれている場合があります。
-
-
updateSingleCardinalityProperties (CLI では:
--update-single-cardinality-properties
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。updateSingleCardinalityProperties
は、バルクローダーが単一濃度の頂点またはエッジプロパティの新しい値を処理する方法を制御するオプションのパラメータです。これは openCypher データのロードではサポートされていません。使用できる値:
"TRUE"
、"FALSE"
。デフォルト値:
"FALSE"
。デフォルトでは、または
updateSingleCardinalityProperties
が明示的に"FALSE"
に設定されている場合、ローダーは単一の濃度に違反するため、新しい値をエラーとして扱います。一方、
updateSingleCardinalityProperties
が"TRUE"
に設定されている場合、バルクローダーは既存の値を新しい値に置き換えます。ロードされるソースファイルで複数のエッジまたは単一濃度の頂点プロパティ値が指定されている場合、バルクロードの終了時の最終値は、これらの新しい値のいずれかになります。ローダーは、既存の値が新しい値の 1 つに置き換えられたことを保証します。 -
userProvidedEdgeIds (CLI では:
--user-provided-edge-ids
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。このパラメータは、リレーションシップ ID を含む openCypher データをロードする場合にのみ必要です。openCypher 関係 ID がロードデータに明示的に指定されている場合 (推奨)、必ず含められ
True
に設定されています。userProvidedEdgeIds
が存在しないか、True
に設定されている場合、:ID
列は、ロード内のすべてのリレーションシップファイルに存在する必要があります。userProvidedEdgeIds
が存在しないか、False
に設定されている場合、ロード内のリレーションシップファイルに:ID
列があってはなりません。代わりに、Neptune ローダーは各リレーションシップの ID を自動的に生成します。CSV データのエラーが修正された後にローダーがロードを再開できるように、リレーションシップ ID を明示的に指定すると便利です。すでにロードされているリレーションシップをリロードする必要はありません。リレーションシップ ID が明示的に割り当てられていない場合、リレーションシップファイルを修正する必要があれば、ローダーは失敗したロードを再開できず、代わりにすべてのリレーションシップを再ロードする必要があります。
レスポンス
-
payload – 必須: キーと値のペアのマップ配列。
各キーは、タイプ
string
の文字列 (UTF-8 でエンコードされた文字列) です。各値は、タイプ
string
の文字列 (UTF-8 でエンコードされた文字列) です。ロード操作の識別子となる
loadId
名前と値のペアを含みます。 -
status - 必須: タイプ
string
の文字列 (UTF-8 でエンコードされた文字列)。ロードジョブのステータスを示す HTTP リターンコード。
エラー
GetLoaderJobStatus (アクション)
この API の AWS CLI 名は get-loader-job-status
です。
指定されたロードジョブに関する情報を取得します。Neptune は、直近 1,024 個のバルクロードジョブのみを追跡し、ジョブごとに直近 10,000 個のエラーの詳細のみを保存します。
詳細については、「Neptune Loader Get-Status API」を参照してください。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:GetLoaderJobStatus IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
details (CLI では:
--details
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。全体のステータス以外の詳細を含めるかどうかを示すフラグ (
TRUE
またはFALSE
、デフォルトはFALSE
)。 -
errors (CLI では:
--errors
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。発生したエラーのリストを含めるかどうかを示すフラグ (
TRUE
またはFALSE
、デフォルトはFALSE
)。エラーのリストはページ分割されます。
page
およびerrorsPerPage
パラメータで、すべてのエラーをページ分割できます。 -
errorsPerPage (CLI では:
--errors-per-page
) — タイプinteger
の PositiveInteger (符号付き32ビット整数)、少なくとも 1? st?。各ページで返されるエラーの数 (正の整数、デフォルトは
10
)。errors
パラメータがTRUE
に設定されている場合にのみ有効です。 -
loadId (CLI では:
--load-id
) — 必須:string
タイプの文字列 (UTF-8 でエンコードされた文字列)。ステータスを取得するロードジョブのロード ID。
-
page (CLI では:
--page
) — タイプinteger
の PositiveInteger (符号付き32ビット整数)、少なくとも 1? st?。エラーページ番号 (正の整数、デフォルトは
1
)。errors
パラメータがTRUE
に設定されている場合にのみ有効です。
レスポンス
-
payload - 必須: タイプ
document
のドキュメント (JSON のようなデータモデルで表される、プロトコルに依存しないオープンコンテンツ)。ロードジョブに関するステータス情報。レイアウトは次のようになります。
{ "status" : "200 OK", "payload" : { "feedCount" : [ { "LOAD_FAILED" : (number) } ], "overallStatus" : { "fullUri" : "s3://(bucket)/(key)", "runNumber" : (number), "retryNumber" : (number), "status" : "(string)", "totalTimeSpent" : (number), "startTime" : (number), "totalRecords" : (number), "totalDuplicates" : (number), "parsingErrors" : (number), "datatypeMismatchErrors" : (number), "insertErrors" : (number), }, "failedFeeds" : [ { "fullUri" : "s3://(bucket)/(key)", "runNumber" : (number), "retryNumber" : (number), "status" : "(string)", "totalTimeSpent" : (number), "startTime" : (number), "totalRecords" : (number), "totalDuplicates" : (number), "parsingErrors" : (number), "datatypeMismatchErrors" : (number), "insertErrors" : (number), } ], "errors" : { "startIndex" : (number), "endIndex" : (number), "loadId" : "(string), "errorLogs" : [ ] } } }
-
status - 必須: タイプ
string
の文字列 (UTF-8 でエンコードされた文字列)。リクエストの HTTP レスポンスコード。
エラー
ListLoaderJobs (アクション)
この API の AWS CLI 名は list-loader-jobs
です。
すべてのアクティブローダージョブの loadIds
のリストを取得します。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:ListLoaderJobs IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
includeQueuedLoads (CLI では:
--include-queued-loads
) — タイプboolean
のブール値 (ブール値 (真または偽) の値)。パラメータを
FALSE
に設定することによってロード ID のリストをリクエストしたときに、キューに入れられたロードリクエストのロード ID を除外するために使用できるオプションのパラメータ。デフォルト値は、「TRUE
」です。 -
limit (CLI では:
--limit
) — ListLoaderJobsInputLimitInteger、タイプinteger
(符号付き 32 ビット整数)、1 以上か 1024 以上? st? s。一覧表示されるロード ID の数。0 より大きく、
100
(デフォルト) 以下の正の整数でなければなりません。
レスポンス
-
payload – 必須: LoaderIdResult オブジェクト。
要求されたジョブ ID のリスト。
-
status - 必須: タイプ
string
の文字列 (UTF-8 でエンコードされた文字列)。ジョブリストリクエストのステータスを返します。
エラー
CancelLoaderJob (アクション)
この API の AWS CLI 名は cancel-loader-job
です。
指定されたロードジョブをキャンセルします。これは HTTP DELETE
リクエストです。詳細については、「Neptune Loader Get-Status API」を参照してください。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:CancelLoaderJob IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
loadId (CLI では:
--load-id
) — 必須:string
タイプの文字列 (UTF-8 でエンコードされた文字列)。削除されるロードジョブの ID。
レスポンス
-
status — タイプ
string
の文字列 (UTF-8 でエンコードされた文字列)。キャンセルステータス。
エラー
一括ロード構造:
LoaderIdResult (構造)
ロード ID のリストを含みます。
フィールド
-
loadIds — これはタイプ
string
の文字列です (UTF-8 でエンコードされた文字列)。ロード ID のリスト。