Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Ekspor bidang parameter di objek params
JSON tingkat atas
Objek JSON params
ekspor Neptunus memungkinkan Anda untuk mengontrol ekspor, termasuk jenis dan format data yang diekspor.
Daftar bidang yang mungkin di params
objek parameter ekspor
Di bawah ini adalah semua bidang tingkat atas yang mungkin muncul di params
objek. Hanya subset dari bidang ini yang muncul di salah satu objek.
Daftar bidang yang umum untuk semua jenis ekspor
Daftar bidang untuk ekspor grafik properti
Daftar bidang untuk ekspor RDF
Bidang umum untuk semua jenis ekspor
cloneCluster
bidang di params
(Opsional). Default: false
.
Jika cloneCluster
parameter disetel ketrue
, proses ekspor menggunakan klon cepat dari cluster DB Anda:
"cloneCluster" : true
Secara default, proses ekspor mengekspor data dari cluster DB yang Anda tentukan menggunakan parameter endpoint
, endpoints
atau clusterId
. Namun, jika klaster DB Anda digunakan saat ekspor sedang berlangsung, dan data berubah, proses ekspor tidak dapat menjamin konsistensi data yang diekspor.
Untuk memastikan bahwa data yang diekspor konsisten, gunakan parameter cloneCluster
untuk mengekspor dari klon statis klaster DB Anda sebagai gantinya.
Klaster DB yang diklon dibuat dalam VPC yang sama sebagai klaster DB sumber dan mewarisi grup keamanan, grup subnet dan pengaturan otentikasi database IAM sumber. Ketika ekspor selesai, Neptunus menghapus klaster DB kloning.
Secara default, klaster DB yang dikloning terdiri dari instans tunggal dari tipe instans yang sama sebagai instans utama dalam klaster DB sumber. Anda dapat mengubah tipe instans yang digunakan untuk klaster DB yang dikloning dengan menentukan satu yang berbeda menggunakan cloneClusterInstanceType
.
catatan
Jika Anda tidak menggunakan cloneCluster
opsi, dan mengekspor langsung dari cluster DB utama Anda, Anda mungkin perlu meningkatkan batas waktu pada instance dari mana data sedang diekspor. Untuk set data yang besar, timeout harus diatur ke beberapa jam.
cloneClusterInstanceType
bidang di params
(Opsional).
Jika cloneCluster
parameter hadir dan disetel ketrue
, Anda dapat menggunakan cloneClusterInstanceType
parameter untuk menentukan jenis instance yang digunakan untuk klaster DB kloning:
Secara default, klaster DB yang dikloning terdiri dari instans tunggal dari tipe instans yang sama sebagai instans utama dalam klaster DB sumber.
"cloneClusterInstanceType" : "
(for example, r5.12xlarge)
"
cloneClusterReplicaCount
bidang di params
(Opsional).
Jika cloneCluster
parameter hadir dan disetel ketrue
, Anda dapat menggunakan cloneClusterReplicaCount
parameter untuk menentukan jumlah instance baca-replika yang dibuat di klaster DB kloning:
"cloneClusterReplicaCount" :
(for example, 3)
Secara default, klaster DB yang dikloning terdiri dari instans utama tunggal. Parameter cloneClusterReplicaCount
memungkinkan Anda menentukan berapa banyak instans baca-replika tambahan harus dibuat.
clusterId
bidang di params
(Opsional).
clusterId
Parameter menentukan ID dari cluster DB untuk menggunakan:
"clusterId" : "
(the ID of your DB cluster)
"
Jika Anda menggunakan clusterId
parameter, proses ekspor menggunakan semua instance yang tersedia di cluster DB itu untuk mengekstrak data.
catatan
Parameter endpoint
, endpoints
, dan clusterId
ini sama-sama eksklusif. Gunakan satu dan satu-satunya dari mereka.
endpoint
bidang di params
(Opsional).
Gunakan endpoint
untuk menentukan titik akhir instans Neptunus di cluster DB Anda yang proses ekspor dapat kueri untuk mengekstrak data (lihat). Koneksi Titik akhir Ini adalah nama DNS saja, dan tidak termasuk protokol atau port:
"endpoint" : "
(a DNS endpoint of your DB cluster)
"
Gunakan titik akhir cluster atau instance, tetapi bukan titik akhir pembaca utama.
catatan
Parameter endpoint
, endpoints
, dan clusterId
ini sama-sama eksklusif. Gunakan satu dan satu-satunya dari mereka.
endpoints
bidang di params
(Opsional).
Gunakan endpoints
untuk menentukan array titik akhir JSON di cluster DB Anda yang proses ekspor dapat kueri untuk mengekstrak data (lihatKoneksi Titik akhir). Ini hanya nama DNS, dan tidak termasuk protokol atau port:
"endpoints": [ "
(one endpoint in your DB cluster)
", "(another endpoint in your DB cluster)
", "(a third endpoint in your DB cluster)
" ]
Jika Anda memiliki beberapa instans dalam klaster Anda (primer dan satu replika pembacaan atau lebih), Anda dapat meningkatkan performa ekspor dengan menggunakan parameter endpoints
untuk mendistribusikan kueri di seluruh daftar titik akhir tersebut.
catatan
Parameter endpoint
, endpoints
, dan clusterId
ini sama-sama eksklusif. Gunakan satu dan satu-satunya dari mereka.
profile
bidang di params
(Diperlukan untuk mengekspor data pelatihan untuk Neptunus ML, kecuali jika neptune_ml
bidangnya ada di additionalParams
lapangan).
profile
Parameter ini menyediakan set parameter pra-konfigurasi untuk beban kerja tertentu. Saat ini, proses ekspor hanya mendukung neptune_ml
profil
Jika Anda mengekspor data pelatihan untuk Neptunus ML, tambahkan parameter berikut ke objek: params
"profile" : "neptune_ml"
useIamAuth
bidang di params
(Opsional). Default: false
.
Jika database dari mana Anda mengekspor data memiliki autentikasi IAM diaktifkan, Anda harus menyertakan useIamAuth
parameter yang disetel ke: true
"useIamAuth" : true
includeLastEventId
bidang di params
Jika Anda menyetel includeLastEventId
ke true, dan database tempat Anda mengekspor data mengaktifkan Neptunus Streams, proses ekspor akan menulis file ke lokasi ekspor lastEventId.json
yang Anda tentukan. File ini berisi commitNum
dan opNum
dari peristiwa terakhir dalam aliran.
"includeLastEventId" : true
Database kloning yang dibuat oleh proses ekspor mewarisi pengaturan aliran induknya. Jika induk mengaktifkan aliran, klon juga akan mengaktifkan aliran. Isi aliran pada klon akan mencerminkan isi induk (termasuk peristiwa yang sama IDs) pada saat klon dibuat.
Bidang untuk ekspor grafik properti
concurrency
bidang di params
(Opsional). Default: 4
.
concurrency
Parameter menentukan jumlah query paralel yang harus digunakan oleh proses ekspor:
"concurrency" :
(for example, 24)
Pedoman yang baik adalah mengatur tingkat konkurensi menjadi dua kali jumlah v CPUs pada semua contoh dari mana Anda mengekspor data. Contoh r5.xlarge, misalnya, memiliki 4 v. CPUs Jika Anda mengekspor dari cluster 3 instans r5.xlarge, Anda dapat mengatur tingkat konkurensi ke 24 (= 3 x 2 x 4).
Jika Anda menggunakan layanan Neptune-Export, tingkat konkurensi dibatasi oleh pengaturan jobSize. Sebuah pekerjaan kecil, misalnya, mendukung tingkat konkurensi 8. Jika Anda mencoba menentukan tingkat konkurensi 24 untuk pekerjaan kecil menggunakan concurrency
parameter, level efektif tetap pada 8.
Jika Anda mengekspor dari klaster yang dikloning, proses ekspor menghitung tingkat konkurensi yang tepat berdasarkan ukuran instans yang dikloning dan ukuran pekerjaan.
edgeLabels
bidang di params
(Opsional).
Gunakan edgeLabels
untuk mengekspor hanya tepi yang memiliki label yang Anda tentukan:
"edgeLabels" : ["
(a label)
", "(another label
"]
Setiap label dalam JSON array harus satu, label sederhana.
scope
Parameter lebih diutamakan daripada edgeLabels
parameter, jadi jika scope
nilainya tidak termasuk tepi, edgeLabels
parameter tidak berpengaruh.
filter
bidang di params
(Opsional).
Gunakan filter
untuk menentukan bahwa hanya node dan/atau tepi dengan label tertentu yang harus diekspor, dan untuk memfilter properti yang diekspor untuk setiap node atau tepi.
Struktur umum suatu filter
objek, baik inline atau dalam file filter-konfigurasi, adalah sebagai berikut:
"filter" : { "nodes": [
(array of node label and properties objects)
], "edges": [(array of edge definition an properties objects)
] }
-
nodes
— Berisi array JSON simpil dan properti simpul dalam bentuk berikut:"nodes : [ { "label": "
(node label)
", "properties": [ "(a property name)
", "(another property name)
",( ... )
] } ]-
label
— Label atau label properti-grafik node.Mengambil nilai tunggal atau, jika node memiliki beberapa label, array nilai.
-
properties
— Berisi array nama-nama properti node yang ingin Anda ekspor.
-
-
edges
— Berisi array JSON definisi edge dalam bentuk berikut:"edges" : [ { "label": "
(edge label)
", "properties": [ "(a property name)
", "(another property name)
",( ... )
] } ]label
— Label grafik properti edge. Mengambil satu nilai.properties
— Berisi array nama-nama properti edge yang ingin Anda ekspor.
filterConfigFile
bidang di params
(Opsional).
Gunakan filterConfigFile
untuk menentukan file JSON yang berisi konfigurasi filter dalam bentuk yang sama dengan filter
parameter:
"filterConfigFile" : "s3://
(your Amazon S3 bucket)
/neptune-export/(the name of the JSON file)
"
Lihat filter untuk format filterConfigFile
file.
format
bidang yang digunakan untuk data grafik properti di params
(Opsional). Default: csv
(nilai yang dipisahkan koma)
format
Parameter menentukan format output dari data grafik properti yang diekspor:
"format" :
(one of: csv, csvNoHeaders, json, neptuneStreamsJson)
-
csvNoHeaders
— Data berformat CSV tanpa judul kolom. -
json
— Data yang diformat JSON. -
neptuneStreamsJson
— Data berformat JSON yang menggunakan format serialisasi perubahan GREMLIN_JSON.
gremlinFilter
bidang di params
(Opsional).
gremlinFilter
Parameter ini memungkinkan Anda untuk menyediakan cuplikan Gremlin, seperti has()
langkah, yang digunakan untuk memfilter kedua node dan tepi:
"gremlinFilter" :
(a Gremlin snippet)
Nama bidang dan nilai string harus dikelilingi oleh tanda kutip ganda yang lolos. Untuk tanggal dan waktu, Anda dapat menggunakan metode datetime.
Contoh berikut hanya mengekspor node dan tepi dengan properti yang dibuat tanggal yang nilainya lebih besar dari 2021-10-10:
"gremlinFilter" : "has(\"created\", gt(datetime(\"2021-10-10\")))"
gremlinNodeFilter
bidang di params
(Opsional).
gremlinNodeFilter
Parameter ini memungkinkan Anda untuk menyediakan cuplikan Gremlin, seperti has()
langkah, yang digunakan untuk memfilter node:
"gremlinNodeFilter" :
(a Gremlin snippet)
Nama bidang dan nilai string harus dikelilingi oleh tanda kutip ganda yang lolos. Untuk tanggal dan waktu, Anda dapat menggunakan metode datetime.
Contoh berikut mengekspor hanya node dengan properti deleted
Boolean yang nilainya adalah: true
"gremlinNodeFilter" : "has(\"deleted\", true)"
gremlinEdgeFilter
bidang di params
(Opsional).
gremlinEdgeFilter
Parameter ini memungkinkan Anda untuk menyediakan cuplikan Gremlin, seperti has()
langkah, yang digunakan untuk menyaring tepi:
"gremlinEdgeFilter" :
(a Gremlin snippet)
Nama bidang dan nilai string harus dikelilingi oleh tanda kutip ganda yang lolos. Untuk tanggal dan waktu, Anda dapat menggunakan metode datetime.
Contoh berikut hanya mengekspor tepi dengan properti strength
numerik yang nilainya 5:
"gremlinEdgeFilter" : "has(\"strength\", 5)"
nodeLabels
bidang di params
(Opsional).
Gunakan nodeLabels
untuk mengekspor hanya node yang memiliki label yang Anda tentukan:
"nodeLabels" : ["
(a label)
", "(another label
"]
Setiap label dalam JSON array harus satu, label sederhana.
scope
Parameter lebih diutamakan daripada nodeLabels
parameter, jadi jika scope
nilainya tidak termasuk node, nodeLabels
parameter tidak berpengaruh.
scope
bidang di params
(Opsional). Default: all
.
scope
Parameter menentukan apakah untuk mengekspor hanya node, atau hanya tepi, atau kedua node dan tepi:
"scope" :
(one of: nodes, edges, or all)
nodes
— Ekspor simpul dan propertinya saja.edges
— Ekspor edge dan propertinya saja.all
— Ekspor simpul dan edge dan propertinya (default).
Bidang untuk ekspor RDF
format
bidang yang digunakan untuk data RDF di params
(Opsional). Default: turtle
format
Parameter menentukan format output dari data RDF yang diekspor:
"format" :
(one of: turtle, nquads, ntriples, neptuneStreamsJson)
-
turtle
— Output yang diformat kura-kura. -
nquads
— N-Quads diformat data tanpa judul kolom. -
ntriples
— N-Triples data yang diformat. -
neptuneStreamsJson
— Data berformat JSON yang menggunakan format serialisasi perubahan SPARQL NQUADS.
rdfExportScope
bidang di params
(Opsional). Default: graph
.
rdfExportScope
Parameter menentukan ruang lingkup ekspor RDF:
"rdfExportScope" :
(one of: graph, edges, or query)
graph
— Ekspor semua data RDF.edges
— Ekspor hanya tiga kali lipat yang mewakili tepi.query
— Ekspor data diambil oleh kueri SPARQL yang disediakan menggunakan bidang.sparql
sparql
bidang di params
(Opsional).
sparql
Parameter ini memungkinkan Anda menentukan kueri SPARQL untuk mengambil data yang akan diekspor:
"sparql" :
(a SPARQL query)
Jika Anda menyediakan kueri menggunakan sparql
bidang, Anda juga harus mengatur rdfExportScope
bidang kequery
.
namedGraph
bidang di params
(Opsional).
namedGraph
Parameter ini memungkinkan Anda untuk menentukan IRI untuk membatasi ekspor ke grafik bernama tunggal:
"namedGraph" :
(Named graph IRI)
namedGraph
Parameter hanya dapat digunakan dengan rdfExportScope
bidang yang disetel kegraph
.