Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Paramètres utilisés pour contrôler le processus d'exportation de Neptune
Que vous ayez recours au service d'exportation Neptune ou à l'utilitaire de ligne de commande neptune-export
, les paramètres que vous utilisez pour contrôler l'exportation sont généralement les mêmes. Ils contiennent un objet JSON transmis au point de terminaison d'exportation Neptune ou à neptune-export
au niveau de la ligne de commande.
L'objet transmis au processus d'exportation comporte jusqu'à cinq champs de niveau supérieur :
-d '{ "command" : "
(either
", "outputS3Path" : "s3:/export-pg
orexport-rdf
)(your Amazon S3 bucket)
/(path to the folder for exported data)
", "jobsize" : "(for Neptune-Export service only)
", "params" : {(a JSON object that contains export-process parameters)
}, "additionalParams": {(a JSON object that contains parameters for training configuration)
} }'
Table des matières
- Paramètre command
- Paramètre outputS3Path
- Paramètre jobSize
- Objet params.
- Objet additionalParams.
- Exportation des champs de paramètres dans l'objet JSON params de niveau supérieur
- Liste des champs possibles dans l'objet params des paramètres d'exportation
- Champs communs à tous les types d'exportation
- Champs pour l'exportation du graphe de propriétés
- Champ concurrency dans params
- Champ edgeLabels dans params
- Champ filter dans params
- Champ filterConfigFile dans params
- Champ format utilisé pour les données du graphe de propriétés dans params
- Champ gremlinFilter dans params
- Champ gremlinNodeFilter dans params
- Champ gremlinEdgeFilter dans params
- Champ nodeLabels dans params
- Champ scope dans params
- Champs pour l'exportation RDF
- Exemples de filtrage des données exportées
- Filtrage de l'exportation des données du graphe de propriétés
- Exemple d'utilisation de scope pour exporter uniquement les arêtes
- Exemple d'utilisation de nodeLabels et edgeLabels pour exporter uniquement les nœuds et les arêtes dotés d'étiquettes spécifiques
- Exemple d'utilisation de filter pour exporter uniquement des nœuds, des arêtes et des propriétés spécifiés
- Cet exemple utilise gremlinFilter.
- Cet exemple utilise gremlinNodeFilter.
- Cet exemple utilise gremlinEdgeFilter .
- Combinaison de filter, gremlinNodeFilter, nodeLabels, edgeLabels et scope
- Filtrage de l'exportation des données RDF
- Filtrage de l'exportation des données du graphe de propriétés
Paramètre command
Le paramètre de niveau supérieur command
détermine s'il faut exporter les données du graphe de propriétés ou les données RDF. Si vous omettez le paramètre command
, le processus d'exportation exporte par défaut les données du graphe de propriétés.
export-pg
: exporte les données du graphe de propriétés.export-rdf
: exporte les données RDF.
Paramètre outputS3Path
Le paramètre de niveau supérieur outputS3Path
est obligatoire et doit contenir l'URI d'un emplacement Amazon S3 sur lequel les fichiers exportés peuvent être publiés :
"outputS3Path" : "s3://
(your Amazon S3 bucket)
/(path to output folder)
"
Cette valeur doit commencer par s3://
, suivi d'un nom de compartiment valide et éventuellement d'un chemin de dossier au sein du compartiment.
Paramètre jobSize
Le paramètre de niveau supérieur jobSize
est uniquement utilisé avec le service d'exportation Neptune, et non avec l'utilitaire de ligne de commande neptune-export
. Il est facultatif. Il vous permet de caractériser la taille de la tâche d'exportation que vous lancez, ce qui permet de déterminer la quantité de ressources de calcul qui seront consacrées à la tâche et son niveau de simultanéité maximal.
"jobsize" : "
(one of four size descriptors)
"
Voici les quatre descripteurs de taille valides :
small
: simultanéité maximale de 8. Convient aux volumes de stockage pouvant atteindre 10 Go.medium
: simultanéité maximale de 32. Convient aux volumes de stockage pouvant atteindre 100 Go.large
: simultanéité maximale de 64. Convient aux volumes de stockage supérieurs à 100 Go, mais inférieurs à 1 To.xlarge
: simultanéité maximale de 96. Convient aux volumes de stockage supérieurs à 1 To.
Par défaut, une exportation initiée sur le service d'exportation Neptune s'exécute comme une tâche small
.
Les performances d'une exportation dépendent non seulement du paramètre jobSize
, mais également du nombre d'instances de base de données à partir desquelles vous exportez des données, de la taille de chaque instance et du niveau de simultanéité effectif de la tâche.
Pour les exportations de graphes de propriétés, vous pouvez configurer le nombre d'instances de base de données à l'aide du paramètre cloneClusterReplicaCompter, et vous pouvez configurer le niveau de simultanéité effectif de la tâche à l'aide du paramètre simultanéité.
Objet params
.
Le paramètre de niveau supérieur params
est un objet JSON qui contient les paramètres que vous pouvez utiliser pour contrôler le processus d'exportation lui-même, comme expliqué dans Exportation des champs de paramètres dans l'objet JSON params de niveau supérieur. Certains champs de l'objet params
sont spécifiques aux exportations de graphes de propriétés, d'autres auz données RDF.
Objet additionalParams
.
Le paramètre de niveau supérieur additionalParams
est un objet JSON qui contient les paramètres que vous pouvez utiliser pour contrôler les actions appliquées aux données après leur exportation. Actuellement, additionalParams
est uniquement utilisé pour exporter les données d'entraînement pour Neptune ML.