Tutorial: Gunakan buku SageMaker catatan dengan titik akhir pengembangan Anda - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tutorial: Gunakan buku SageMaker catatan dengan titik akhir pengembangan Anda

DiAWS Glue, Anda dapat membuat titik akhir pengembangan dan kemudian membuat SageMaker buku catatan untuk membantu mengembangkan skrip ETL dan machine learning Anda. SageMaker Notebook adalah instance komputasi pembelajaran mesin yang dikelola sepenuhnya yang menjalankan aplikasi Notebook Jupyter.

  1. Pada konsol AWS Glue, pilih Titik akhir pengembangan untuk mengarahkan ke daftar titik akhir pengembangan.

  2. Pilih kotak centang di samping nama titik akhir pengembangan yang ingin Anda gunakan, dan pada menu Tindakan, pilih Buat SageMaker buku catatan.

  3. Isi halaman Membuat dan mengkonfigurasi notebook seperti berikut:

    1. Masukkan nama notebook.

    2. Pada Lampirkan ke titik akhir pengembangan, verifikasi titik akhir pengembangan.

    3. Buat atau pilih sebuah AWS Identity and Access Management (IAM) role.

      Membuat sebuah peran dianjurkan. Jika Anda menggunakan peran yang sudah ada, pastikan bahwa peran itu memiliki izin yang diperlukan. Untuk informasi selengkapnya, lihat Langkah 6: Buat kebijakan IAM untuk notebook SageMaker.

    4. (Opsional) Pilih VPC, subnet, dan satu atau beberapa grup keamanan.

    5. (Opsional) Pilih kunci enkripsi AWS Key Management Service.

    6. (Opsional) Tambahkan tag untuk instans notebook.

  4. Pilih Buat Notebook. Pada halaman Notebook, pilih ikon refresh di kanan atas, dan lanjutkan hingga Status menunjukkan Ready.

  5. Pilih kotak centang di samping nama notebook yang baru, kemudian pilih Buka notebook.

  6. Buat buku catatan baru: Pada halaman jupyter, pilih Baru, lalu pilih Sparkmagic (). PySpark

    Layar Anda sekarang akan terlihat seperti berikut ini:

    Halaman Jupyter memiliki menu bar, toolbar, dan bidang teks lebar di mana Anda dapat memasukkan pernyataan.
  7. (Opsional) Di bagian atas halaman, pilih Tanpa judul, dan beri nama untuk notebook tersebut.

  8. Untuk memulai sebuah aplikasi Spark, masukkan perintah berikut ke dalam notebook, lalu di toolbar, pilih Jalankan.

    spark

    Setelah penundaan sesaat, Anda akan melihat respons berikut:

    Respons sistem menunjukkan status aplikasi Spark dan mengeluarkan pesan berikut: SparkSession tersedia sebagai 'spark'.
  9. Membuat bingkai dinamis dan menjalankan kueri terhadapnya: Salin, tempel, dan jalankan kode berikut, yang memberikan output jumlah dan skema tabel persons_json.

    import sys from pyspark.context import SparkContext from awsglue.context import GlueContext from awsglue.transforms import * glueContext = GlueContext(SparkContext.getOrCreate()) persons_DyF = glueContext.create_dynamic_frame.from_catalog(database="legislators", table_name="persons_json") print ("Count: ", persons_DyF.count()) persons_DyF.printSchema()