Contoh: Memuat Data ke Instans DB Neptune - Amazon Neptune

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Contoh: Memuat Data ke Instans DB Neptune

Contoh ini menunjukkan cara memuat data ke Amazon Neptune. Kecuali dinyatakan lain, Anda harus mengikuti langkah-langkah ini dari instans Amazon Elastic Compute Cloud (AmazonEC2) di Amazon Virtual Private Cloud (VPC) yang sama dengan instans DB Neptunus Anda.

Prasyarat untuk Contoh Pemuatan Data

Sebelum memulai, Anda harus memiliki hal-hal berikut:

  • Instans DB Neptune.

    Untuk informasi tentang meluncurkan instans DB Neptune, lihat Membuat cluster Amazon Neptunus.

  • Bucket Amazon Simple Storage Service (Amazon S3) tempat file data akan diletakkan.

    Anda dapat menggunakan bucket yang ada. Jika Anda tidak memiliki bucket S3, lihat Buat Bucket di Panduan Memulai Amazon S3.

  • Grafik data untuk dimuat, dalam salah satu format yang didukung oleh loader Neptune:

    Jika Anda menggunakan Gremlin untuk menanyakan grafik Anda, Neptunus dapat memuat data dalam format comma-separated-values (CSV), seperti yang dijelaskan dalam. Format data muat Gremlin

    Jika Anda menggunakan openCypher kueri grafik Anda, Neptunus juga dapat memuat data dalam format CSV -spesifik, seperti openCypher yang dijelaskan dalam. Memuat format untuk openCypher data

    Jika Anda menggunakanSPARQL, Neptunus dapat memuat data dalam sejumlah format, seperti yang RDF dijelaskan dalam. RDFmemuat format data

  • IAMPeran instans DB Neptunus untuk berasumsi bahwa memiliki kebijakan IAM yang memungkinkan akses ke file data di bucket S3. Kebijakan harus memberikan izin Baca dan Daftar.

    Untuk informasi tentang membuat peran yang memiliki akses ke Amazon S3 dan kemudian mengaitkannya dengan klaster Neptune, lihat Prasyarat: Peran dan Akses IAM Amazon S3.

    catatan

    LoadAPINeptunus hanya membutuhkan akses baca ke file data. IAMKebijakan ini tidak perlu mengizinkan akses tulis atau akses ke seluruh bucket.

  • Titik akhir Amazon S3VPC. Untuk informasi selengkapnya, lihat bagian Membuat Endpoint Amazon S3 VPC.

Membuat Endpoint Amazon S3 VPC

Pemuat Neptunus memerlukan titik akhir untuk Amazon VPC S3.

Untuk menyiapkan akses untuk Amazon S3
  1. Masuk ke AWS Management Console dan buka VPC konsol Amazon di https://console.aws.amazon.com/vpc/.

  2. Pada panel navigasi kiri, pilih Titik Akhir.

  3. Pilih Buat Titik Akhir.

  4. Pilih Nama Layanan com.amazonaws.region.s3.

    catatan

    Jika Wilayah di sini salah, pastikan bahwa Wilayah konsol sudah benar.

  5. Pilih VPC yang berisi instans DB Neptunus Anda.

  6. Pilih kotak centang di samping tabel rute yang terkait dengan subnet yang terkait dengan klaster Anda. Jika Anda hanya memiliki satu tabel rute, Anda harus memilih kotak itu.

  7. Pilih Buat Titik Akhir.

Untuk informasi tentang membuat titik akhir, lihat VPCTitik akhir di VPCPanduan Pengguna Amazon. Untuk informasi tentang batasan titik akhir, VPC VPCEndpoint untuk Amazon S3.

Untuk memuat data ke dalam instans DB Neptune
  1. Salin file data ke bucket Amazon S3. Bucket S3 harus berada di AWS Region yang sama dengan cluster yang memuat data.

    Anda dapat menggunakan AWS CLI perintah berikut untuk menyalin file ke ember.

    catatan

    Perintah ini tidak perlu dijalankan dari EC2 instance Amazon.

    aws s3 cp data-file-name s3://bucket-name/object-key-name
    catatan

    Di Amazon S3, sebuah nama kunci objek adalah seluruh jalur file, termasuk nama file.

    Contoh: Dalam perintah aws s3 cp datafile.txt s3://examplebucket/mydirectory/datafile.txt, nama kunci objeknya adalah mydirectory/datafile.txt.

    Atau, Anda dapat menggunakan file AWS Management Console untuk mengunggah file ke bucket S3. Buka konsol Amazon S3 di https://console.aws.amazon.com/s3/, dan pilih ember. Di sudut kiri atas, pilih Unggah untuk mengunggah file.

  2. Dari jendela baris perintah, masukkan berikut ini untuk menjalankan pemuat Neptunus, menggunakan nilai yang benar untuk titik akhir, jalur Amazon S3, format, dan peran Anda. IAM ARN

    formatParameter dapat berupa salah satu dari nilai berikut: csv untuk Gremlin, opencypher untuk, atauopenCypher,ntriples, nquadsturtle, dan rdfxml untuk. RDF Untuk informasi tentang parameter lain, lihat Perintah Loader Neptune.

    Untuk informasi tentang menemukan nama host instans DB Neptune Anda, lihat bagian Menghubungkan ke Titik Akhir Amazon Neptune..

    Parameter Wilayah harus sesuai dengan Wilayah klaster dan bucket S3.

    Amazon Neptunus tersedia di Wilayah berikut: AWS

    • US East (N. Virginia):   us-east-1

    • AS Timur (Ohio): us-east-2

    • US West (N. California):   us-west-1

    • US West (Oregon):   us-west-2

    • Canada (Central):   ca-central-1

    • South America (São Paulo):   sa-east-1

    • Eropa (Stockholm): eu-north-1

    • Eropa (Spanyol): eu-south-2

    • Eropa (Irlandia): eu-west-1

    • Eropa (London): eu-west-2

    • Eropa (Paris): eu-west-3

    • Eropa (Frankfurt): eu-central-1

    • Timur Tengah (Bahrain): me-south-1

    • Timur Tengah (UAE): me-central-1

    • Israel (Tel Aviv): il-central-1

    • Afrika (Cape Town): af-south-1

    • Asia Pasifik (Hong Kong): ap-east-1

    • Asia Pacific (Tokyo):   ap-northeast-1

    • Asia Pasifik (Seoul): ap-northeast-2

    • Asia Pasifik (Osaka): ap-northeast-3

    • Asia Pacific (Singapore):   ap-southeast-1

    • Asia Pacific (Sydney):   ap-southeast-2

    • Asia Pasifik (Jakarta): ap-southeast-3

    • Asia Pasifik (Mumbai): ap-south-1

    • Tiongkok (Beijing): cn-north-1

    • Tiongkok (Ningxia): cn-northwest-1

    • AWS GovCloud (AS-Barat): us-gov-west-1

    • AWS GovCloud (AS-Timur): us-gov-east-1

    curl -X POST \ -H 'Content-Type: application/json' \ https://your-neptune-endpoint:port/loader -d ' { "source" : "s3://bucket-name/object-key-name", "format" : "format", "iamRoleArn" : "arn:aws:iam::account-id:role/role-name", "region" : "region", "failOnError" : "FALSE", "parallelism" : "MEDIUM", "updateSingleCardinalityProperties" : "FALSE", "queueRequest" : "TRUE", "dependencies" : ["load_A_id", "load_B_id"] }'

    Untuk informasi tentang membuat dan mengaitkan IAM peran dengan cluster Neptunus, lihat. Prasyarat: Peran dan Akses IAM Amazon S3

    catatan

    Lihat Parameter Permintaan Loader Neptune) untuk informasi detail tentang parameter permintaan pemuatan. Singkatnya:

    sourceParameter menerima Amazon URI S3 yang menunjuk ke satu file atau folder. Jika Anda menentukan folder, Neptune memuat setiap file data dalam folder.

    Folder dapat berisi beberapa file vertex dan beberapa file edge.

    URIBisa dalam salah satu format berikut.

    • s3://bucket_name/object-key-name

    • https://s3.amazonaws.com/bucket_name/object-key-name

    • https://s3-us-east-1.amazonaws.com/bucket_name/object-key-name

    Parameter format dapat berupa salah satu dari hal berikut:

    • CSVFormat Gremlin (csv) untuk grafik properti Gremlin

    • openCypher CSVformat (opencypher) untuk grafik openCypher properti

    • N -Triples (ntriples) format untuk/RDFSPARQL

    • Format N-Quads (nquads) untuk/RDFSPARQL

    • RDF/XML(rdfxml) format untukRDF/SPARQL

    • Format kura-kura (turtle) untuk/RDFSPARQL

    Parameter parallelism opsional memungkinkan Anda membatasi jumlah utas yang digunakan dalam proses pemuatan massal. Anda dapat mengaturnya ke LOW, MEDIUM, HIGH, atau OVERSUBSCRIBE.

    Saat updateSingleCardinalityProperties diatur ke "FALSE", loader mengembalikan kesalahan jika lebih dari satu nilai disediakan dalam file sumber yang dimuat untuk edge atau properti single-cardinality vertex.

    Mengatur queueRequest ke "TRUE" menyebabkan permintaan pemuatan ditempatkan dalam antrean jika sudah ada pekerjaan pemuatan yang berjalan.

    Parameter dependencies membuat eksekusi permintaan pemuatan dapat berubah pada penyelesaian satu pekerjaa pemuatan atau lebih yang berhasil yang telah ditempatkan dalam antrean.

  3. Neptune loader mengembalikan pekerjaan id yang memungkinkan Anda untuk memeriksa status atau membatalkan proses pemuatan; misalnya:

    { "status" : "200 OK", "payload" : { "loadId" : "ef478d76-d9da-4d94-8ff1-08d9d4863aa5" } }
  4. Masukkan hal berikut ini untuk mendapatkan status pemuatan dengan loadId dari Langkah 3:

    curl -G 'https://your-neptune-endpoint:port/loader/ef478d76-d9da-4d94-8ff1-08d9d4863aa5'

    Jika status pemuatan mencantumkan kesalahan, Anda dapat meminta status yang lebih rinci dan daftar kesalahan. Untuk informasi selengkapnya dan contoh tambahan, lihat Neptunus Loader Dapatkan Status API.

  5. (Opsional) Membatalkan pekerjaan Load.

    Masukkan hal berikut untuk Delete pekerjaan loader dengan pekerjaan id dari Langkah 3:

    curl -X DELETE 'https://your-neptune-endpoint:port/loader/ef478d76-d9da-4d94-8ff1-08d9d4863aa5'

    DELETEPerintah mengembalikan HTTP kode 200 OK setelah pembatalan berhasil.

    Data dari file dari pekerjaan pemuatan yang telah selesai melakukan pemuatan tidak di-rollback. Data tetap ada dalam instans DB Neptune.