Ekspor bidang parameter di objek params JSON tingkat atas - Amazon Neptune

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Ekspor bidang parameter di objek params JSON tingkat atas

Objek JSON params ekspor Neptunus memungkinkan Anda untuk mengontrol ekspor, termasuk jenis dan format data yang diekspor.

Daftar bidang yang mungkin di params objek parameter ekspor

Di bawah ini adalah semua bidang tingkat atas yang mungkin muncul di params objek. Hanya subset dari bidang ini yang muncul di salah satu objek.

Daftar bidang yang umum untuk semua jenis ekspor

Daftar bidang untuk ekspor grafik properti

Daftar bidang untuk ekspor RDF

Bidang umum untuk semua jenis ekspor

cloneClusterbidang di params

(Opsional). Bawaan: false.

Jika cloneCluster parameter disetel ketrue, proses ekspor menggunakan klon cepat dari cluster DB Anda:

"cloneCluster" : true

Secara default, proses ekspor mengekspor data dari cluster DB yang Anda tentukan menggunakan parameter endpoint, endpoints atau clusterId. Namun, jika klaster DB Anda digunakan saat ekspor sedang berlangsung, dan data berubah, proses ekspor tidak dapat menjamin konsistensi data yang diekspor.

Untuk memastikan bahwa data yang diekspor konsisten, gunakan parameter cloneCluster untuk mengekspor dari klon statis klaster DB Anda sebagai gantinya.

Klaster DB yang diklon dibuat dalam VPC yang sama sebagai klaster DB sumber dan mewarisi grup keamanan, grup subnet dan pengaturan otentikasi database IAM sumber. Ketika ekspor selesai, Neptunus menghapus klaster DB kloning.

Secara default, klaster DB yang dikloning terdiri dari instans tunggal dari tipe instans yang sama sebagai instans utama dalam klaster DB sumber. Anda dapat mengubah tipe instans yang digunakan untuk klaster DB yang dikloning dengan menentukan satu yang berbeda menggunakan cloneClusterInstanceType.

catatan

Jika Anda tidak menggunakan cloneCluster opsi, dan mengekspor langsung dari cluster DB utama Anda, Anda mungkin perlu meningkatkan batas waktu pada instance dari mana data sedang diekspor. Untuk set data yang besar, timeout harus diatur ke beberapa jam.

cloneClusterInstanceTypebidang di params

(Opsional).

Jika cloneCluster parameter hadir dan disetel ketrue, Anda dapat menggunakan cloneClusterInstanceType parameter untuk menentukan jenis instance yang digunakan untuk klaster DB kloning:

Secara default, klaster DB yang dikloning terdiri dari instans tunggal dari tipe instans yang sama sebagai instans utama dalam klaster DB sumber.

"cloneClusterInstanceType" : "(for example, r5.12xlarge)"

cloneClusterReplicaCountbidang di params

(Opsional).

Jika cloneCluster parameter hadir dan disetel ketrue, Anda dapat menggunakan cloneClusterReplicaCount parameter untuk menentukan jumlah instance baca-replika yang dibuat di klaster DB kloning:

"cloneClusterReplicaCount" : (for example, 3)

Secara default, klaster DB yang dikloning terdiri dari instans utama tunggal. Parameter cloneClusterReplicaCount memungkinkan Anda menentukan berapa banyak instans baca-replika tambahan harus dibuat.

clusterIdbidang di params

(Opsional).

clusterIdParameter menentukan ID dari cluster DB untuk menggunakan:

"clusterId" : "(the ID of your DB cluster)"

Jika Anda menggunakan clusterId parameter, proses ekspor menggunakan semua instance yang tersedia di cluster DB itu untuk mengekstrak data.

catatan

Parameter endpoint, endpoints, dan clusterId ini sama-sama eksklusif. Gunakan satu dan satu-satunya dari mereka.

endpointbidang di params

(Opsional).

Gunakan endpoint untuk menentukan titik akhir instans Neptunus di cluster DB Anda yang proses ekspor dapat kueri untuk mengekstrak data (lihat). Koneksi Titik akhir Ini adalah nama DNS saja, dan tidak termasuk protokol atau port:

"endpoint" : "(a DNS endpoint of your DB cluster)"

Gunakan titik akhir cluster atau instance, tetapi bukan titik akhir pembaca utama.

catatan

Parameter endpoint, endpoints, dan clusterId ini sama-sama eksklusif. Gunakan satu dan satu-satunya dari mereka.

endpointsbidang di params

(Opsional).

Gunakan endpoints untuk menentukan array titik akhir JSON di cluster DB Anda yang proses ekspor dapat kueri untuk mengekstrak data (lihatKoneksi Titik akhir). Ini hanya nama DNS, dan tidak termasuk protokol atau port:

"endpoints": [ "(one endpoint in your DB cluster)", "(another endpoint in your DB cluster)", "(a third endpoint in your DB cluster)" ]

Jika Anda memiliki beberapa instans dalam klaster Anda (primer dan satu replika pembacaan atau lebih), Anda dapat meningkatkan performa ekspor dengan menggunakan parameter endpoints untuk mendistribusikan kueri di seluruh daftar titik akhir tersebut.

catatan

Parameter endpoint, endpoints, dan clusterId ini sama-sama eksklusif. Gunakan satu dan satu-satunya dari mereka.

profilebidang di params

(Diperlukan untuk mengekspor data pelatihan untuk Neptunus ML, kecuali jika neptune_ml bidangnya ada di additionalParams lapangan).

profileParameter ini menyediakan set parameter pra-konfigurasi untuk beban kerja tertentu. Saat ini, proses ekspor hanya mendukung neptune_ml profil

Jika Anda mengekspor data pelatihan untuk Neptunus ML, tambahkan parameter berikut ke objek: params

"profile" : "neptune_ml"

useIamAuthbidang di params

(Opsional). Bawaan: false.

Jika database dari mana Anda mengekspor data memiliki autentikasi IAM diaktifkan, Anda harus menyertakan useIamAuth parameter yang disetel ke: true

"useIamAuth" : true

includeLastEventIdbidang di params

Jika Anda menyetel includeLastEventId ke true, dan database tempat Anda mengekspor data mengaktifkan Neptunus Streams, proses ekspor akan menulis file ke lokasi ekspor lastEventId.json yang Anda tentukan. File ini berisi commitNum dan opNum dari peristiwa terakhir dalam aliran.

"includeLastEventId" : true

Database kloning yang dibuat oleh proses ekspor mewarisi pengaturan aliran induknya. Jika induk mengaktifkan aliran, klon juga akan mengaktifkan aliran. Isi aliran pada klon akan mencerminkan isi induk (termasuk ID peristiwa yang sama) pada saat klon dibuat.

Bidang untuk ekspor grafik properti

concurrencybidang di params

(Opsional). Bawaan: 4.

concurrencyParameter menentukan jumlah query paralel yang harus digunakan oleh proses ekspor:

"concurrency" : (for example, 24)

Sebuah pedoman yang baik adalah untuk mengatur tingkat konkurensi dua kali jumlah vCPU pada semua instans tempat Anda mengekspor data. Contoh r5.xlarge, misalnya, memiliki 4 vCPU. Jika Anda mengekspor dari klaster instans 3 r5.xlarge, Anda dapat mengatur tingkat konkurensi ke 24 (= 3 x 2 x 4).

Jika Anda menggunakan layanan Neptune-Export, tingkat konkurensi dibatasi oleh pengaturan jobSize. Sebuah pekerjaan kecil, misalnya, mendukung tingkat konkurensi 8. Jika Anda mencoba menentukan tingkat konkurensi 24 untuk pekerjaan kecil menggunakan concurrency parameter, level efektif tetap pada 8.

Jika Anda mengekspor dari klaster yang dikloning, proses ekspor menghitung tingkat konkurensi yang tepat berdasarkan ukuran instans yang dikloning dan ukuran pekerjaan.

edgeLabelsbidang di params

(Opsional).

Gunakan edgeLabels untuk mengekspor hanya tepi yang memiliki label yang Anda tentukan:

"edgeLabels" : ["(a label)", "(another label"]

Setiap label dalam JSON array harus satu, label sederhana.

scopeParameter lebih diutamakan daripada edgeLabels parameter, jadi jika scope nilainya tidak termasuk tepi, edgeLabels parameter tidak berpengaruh.

filterbidang di params

(Opsional).

Gunakan filter untuk menentukan bahwa hanya node dan/atau tepi dengan label tertentu yang harus diekspor, dan untuk memfilter properti yang diekspor untuk setiap node atau tepi.

Struktur umum suatu filter objek, baik inline atau dalam file filter-konfigurasi, adalah sebagai berikut:

"filter" : { "nodes": [ (array of node label and properties objects) ], "edges": [ (array of edge definition an properties objects) ] }
  • nodes— Berisi array JSON simpil dan properti simpul dalam bentuk berikut:

    "nodes : [ { "label": "(node label)", "properties": [ "(a property name)", "(another property name)", ( ... ) ] } ]
    • label — Label atau label properti-grafik node.

      Mengambil nilai tunggal atau, jika node memiliki beberapa label, array nilai.

    • properties— Berisi array nama-nama properti node yang ingin Anda ekspor.

  • edges — Berisi array JSON definisi edge dalam bentuk berikut:

    "edges" : [ { "label": "(edge label)", "properties": [ "(a property name)", "(another property name)", ( ... ) ] } ]
    • label— Label grafik properti edge. Mengambil satu nilai.

    • properties— Berisi array nama-nama properti edge yang ingin Anda ekspor.

filterConfigFilebidang di params

(Opsional).

Gunakan filterConfigFile untuk menentukan file JSON yang berisi konfigurasi filter dalam bentuk yang sama dengan filter parameter:

"filterConfigFile" : "s3://(your Amazon S3 bucket)/neptune-export/(the name of the JSON file)"

Lihat filter untuk format filterConfigFile file.

formatbidang yang digunakan untuk data grafik properti di params

(Opsional). Default: csv (nilai yang dipisahkan koma)

formatParameter menentukan format output dari data grafik properti yang diekspor:

"format" : (one of: csv, csvNoHeaders, json, neptuneStreamsJson)

gremlinFilterbidang di params

(Opsional).

gremlinFilterParameter ini memungkinkan Anda untuk menyediakan cuplikan Gremlin, seperti has() langkah, yang digunakan untuk memfilter kedua node dan tepi:

"gremlinFilter" : (a Gremlin snippet)

Nama bidang dan nilai string harus dikelilingi oleh tanda kutip ganda yang lolos. Untuk tanggal dan waktu, Anda dapat menggunakan metode datetime.

Contoh berikut hanya mengekspor node dan tepi dengan properti yang dibuat tanggal yang nilainya lebih besar dari 2021-10-10:

"gremlinFilter" : "has(\"created\", gt(datetime(\"2021-10-10\")))"

gremlinNodeFilterbidang di params

(Opsional).

gremlinNodeFilterParameter ini memungkinkan Anda untuk menyediakan cuplikan Gremlin, seperti has() langkah, yang digunakan untuk memfilter node:

"gremlinNodeFilter" : (a Gremlin snippet)

Nama bidang dan nilai string harus dikelilingi oleh tanda kutip ganda yang lolos. Untuk tanggal dan waktu, Anda dapat menggunakan metode datetime.

Contoh berikut mengekspor hanya node dengan properti deleted Boolean yang nilainya adalah: true

"gremlinNodeFilter" : "has(\"deleted\", true)"

gremlinEdgeFilterbidang di params

(Opsional).

gremlinEdgeFilterParameter ini memungkinkan Anda untuk menyediakan cuplikan Gremlin, seperti has() langkah, yang digunakan untuk menyaring tepi:

"gremlinEdgeFilter" : (a Gremlin snippet)

Nama bidang dan nilai string harus dikelilingi oleh tanda kutip ganda yang lolos. Untuk tanggal dan waktu, Anda dapat menggunakan metode datetime.

Contoh berikut hanya mengekspor tepi dengan properti strength numerik yang nilainya 5:

"gremlinEdgeFilter" : "has(\"strength\", 5)"

nodeLabelsbidang di params

(Opsional).

Gunakan nodeLabels untuk mengekspor hanya node yang memiliki label yang Anda tentukan:

"nodeLabels" : ["(a label)", "(another label"]

Setiap label dalam JSON array harus satu, label sederhana.

scopeParameter lebih diutamakan daripada nodeLabels parameter, jadi jika scope nilainya tidak termasuk node, nodeLabels parameter tidak berpengaruh.

scopebidang di params

(Opsional). Bawaan: all.

scopeParameter menentukan apakah untuk mengekspor hanya node, atau hanya tepi, atau kedua node dan tepi:

"scope" : (one of: nodes, edges, or all)
  • nodes — Ekspor simpul dan propertinya saja.

  • edges — Ekspor edge dan propertinya saja.

  • all — Ekspor simpul dan edge dan propertinya (default).

Bidang untuk ekspor RDF

formatbidang yang digunakan untuk data RDF di params

(Opsional). Default: turtle

formatParameter menentukan format output dari data RDF yang diekspor:

"format" : (one of: turtle, nquads, ntriples, neptuneStreamsJson)
  • turtle— Output yang diformat kura-kura.

  • nquads— N-Quads diformat data tanpa judul kolom.

  • ntriples— N-Triples data yang diformat.

  • neptuneStreamsJson— Data berformat JSON yang menggunakan format serialisasi perubahan SPARQL NQUADS.

rdfExportScopebidang di params

(Opsional). Bawaan: graph.

rdfExportScopeParameter menentukan ruang lingkup ekspor RDF:

"rdfExportScope" : (one of: graph, edges, or query)
  • graph— Ekspor semua data RDF.

  • edges— Ekspor hanya tiga kali lipat yang mewakili tepi.

  • query— Ekspor data diambil oleh kueri SPARQL yang disediakan menggunakan bidang. sparql

sparqlbidang di params

(Opsional).

sparqlParameter ini memungkinkan Anda menentukan kueri SPARQL untuk mengambil data yang akan diekspor:

"sparql" : (a SPARQL query)

Jika Anda menyediakan kueri menggunakan sparql bidang, Anda juga harus mengatur rdfExportScope bidang kequery.

namedGraphbidang di params

(Opsional).

namedGraphParameter ini memungkinkan Anda untuk menentukan IRI untuk membatasi ekspor ke grafik bernama tunggal:

"namedGraph" : (Named graph IRI)

namedGraphParameter hanya dapat digunakan dengan rdfExportScope bidang yang disetel kegraph.