Paramètres utilisés pour contrôler le processus d'exportation de Neptune - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Paramètres utilisés pour contrôler le processus d'exportation de Neptune

Que vous ayez recours au service d'exportation Neptune ou à l'utilitaire de ligne de commande neptune-export, les paramètres que vous utilisez pour contrôler l'exportation sont généralement les mêmes. Ils contiennent un objet JSON transmis au point de terminaison d'exportation Neptune ou à neptune-export au niveau de la ligne de commande.

L'objet transmis au processus d'exportation comporte jusqu'à cinq champs de niveau supérieur :

-d '{ "command" : "(either export-pg or export-rdf)", "outputS3Path" : "s3:/(your Amazon S3 bucket)/(path to the folder for exported data)", "jobsize" : "(for Neptune-Export service only)", "params" : { (a JSON object that contains export-process parameters) }, "additionalParams": { (a JSON object that contains parameters for training configuration) } }'
Table des matières

Paramètre command

Le paramètre de niveau supérieur command détermine s'il faut exporter les données du graphe de propriétés ou les données RDF. Si vous omettez le paramètre command, le processus d'exportation exporte par défaut les données du graphe de propriétés.

  • export-pg : exporte les données du graphe de propriétés.

  • export-rdf : exporte les données RDF.

Paramètre outputS3Path

Le paramètre de niveau supérieur outputS3Path est obligatoire et doit contenir l'URI d'un emplacement Amazon S3 sur lequel les fichiers exportés peuvent être publiés :

"outputS3Path" : "s3://(your Amazon S3 bucket)/(path to output folder)"

Cette valeur doit commencer par s3://, suivi d'un nom de compartiment valide et éventuellement d'un chemin de dossier au sein du compartiment.

Paramètre jobSize

Le paramètre de niveau supérieur jobSize est uniquement utilisé avec le service d'exportation Neptune, et non avec l'utilitaire de ligne de commande neptune-export. Il est facultatif. Il vous permet de caractériser la taille de la tâche d'exportation que vous lancez, ce qui permet de déterminer la quantité de ressources de calcul qui seront consacrées à la tâche et son niveau de simultanéité maximal.

"jobsize" : "(one of four size descriptors)"

Voici les quatre descripteurs de taille valides :

  • small : simultanéité maximale de 8. Convient aux volumes de stockage pouvant atteindre 10 Go.

  • medium : simultanéité maximale de 32. Convient aux volumes de stockage pouvant atteindre 100 Go.

  • large : simultanéité maximale de 64. Convient aux volumes de stockage supérieurs à 100 Go, mais inférieurs à 1 To.

  • xlarge : simultanéité maximale de 96. Convient aux volumes de stockage supérieurs à 1 To.

Par défaut, une exportation initiée sur le service d'exportation Neptune s'exécute comme une tâche small.

Les performances d'une exportation dépendent non seulement du paramètre jobSize, mais également du nombre d'instances de base de données à partir desquelles vous exportez des données, de la taille de chaque instance et du niveau de simultanéité effectif de la tâche.

Pour les exportations de graphes de propriétés, vous pouvez configurer le nombre d'instances de base de données à l'aide du paramètre cloneClusterReplicaCompter, et vous pouvez configurer le niveau de simultanéité effectif de la tâche à l'aide du paramètre simultanéité.

Objet params.

Le paramètre de niveau supérieur params est un objet JSON qui contient les paramètres que vous pouvez utiliser pour contrôler le processus d'exportation lui-même, comme expliqué dans Exportation des champs de paramètres dans l'objet JSON params de niveau supérieur. Certains champs de l'objet params sont spécifiques aux exportations de graphes de propriétés, d'autres auz données RDF.

Objet additionalParams.

Le paramètre de niveau supérieur additionalParams est un objet JSON qui contient les paramètres que vous pouvez utiliser pour contrôler les actions appliquées aux données après leur exportation. Actuellement, additionalParams est uniquement utilisé pour exporter les données d'entraînement pour Neptune ML.