Sumber daya untuk menggunakan Hugging Face dengan Amazon SageMaker - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Sumber daya untuk menggunakan Hugging Face dengan Amazon SageMaker

Amazon SageMaker memungkinkan pelanggan melatih, menyempurnakan, dan menjalankan inferensi menggunakan model Hugging Face untuk Natural Language Processing () aktif. NLP SageMaker Anda dapat menggunakan Hugging Face untuk pelatihan dan inferensi. Bagian berikut memberikan informasi tentang model Hugging Face dan termasuk bahan referensi yang dapat Anda gunakan untuk mempelajari cara menggunakan SageMaker Hugging Face.

Fungsi ini tersedia melalui pengembangan Hugging AWS Face Deep Learning Containers. Wadah ini termasuk Hugging Face Transformers, Tokenizers, dan pustaka Datasets, yang memungkinkan Anda menggunakan sumber daya ini untuk pekerjaan pelatihan dan inferensi Anda. Untuk daftar gambar Deep Learning Containers yang tersedia, lihat Gambar Deep Learning Containers yang Tersedia. Gambar Deep Learning Containers ini dipelihara dan diperbarui secara berkala dengan patch keamanan.

Untuk menggunakan Hugging Face Deep Learning Containers dengan SageMaker SDK Python untuk pelatihan, lihat Hugging Face Estimator. SageMaker Dengan Hugging Face Estimator, Anda dapat menggunakan model Hugging Face seperti halnya Estimator lainnya. SageMaker Namun, menggunakan SageMaker Python SDK adalah opsional. Anda juga dapat mengatur penggunaan Hugging Face Deep Learning Containers dengan dan. AWS CLI AWS SDK for Python (Boto3)

Untuk informasi lebih lanjut tentang Hugging Face dan model yang tersedia di dalamnya, lihat dokumentasi Hugging Face.

Pelatihan

Untuk menjalankan pelatihan, gunakan salah satu dari ribuan model yang tersedia di Hugging Face dan sesuaikan untuk kasus penggunaan Anda dengan pelatihan tambahan. Dengan SageMaker, Anda dapat menggunakan pelatihan standar atau memanfaatkan Data SageMaker Terdistribusi dan pelatihan Paralel Model.

Seperti pekerjaan SageMaker pelatihan lainnya menggunakan kode khusus, Anda dapat menangkap metrik Anda sendiri dengan meneruskan definisi metrik ke Python SageMaker . SDK Sebagai contoh, lihat Mendefinisikan Metrik Pelatihan (Python SageMaker ). SDK Anda dapat mengakses metrik yang diambil menggunakan CloudWatchdan sebagai Panda DataFrame menggunakan metode ini TrainingJobAnalytics. Setelah model Anda dilatih dan disetel dengan baik, Anda dapat menggunakannya seperti model lain untuk menjalankan pekerjaan inferensi.

Cara menjalankan pelatihan dengan estimator Hugging Face

Anda dapat menerapkan Hugging Face Estimator untuk pekerjaan pelatihan menggunakan Python. SageMaker SDK SageMaker Python SDK adalah pustaka open source untuk pelatihan dan penerapan model pembelajaran mesin. SageMaker Untuk informasi selengkapnya tentang Estimator Wajah Pelukan, lihat dokumentasi SageMakerPython SDK.

Dengan SageMaker PythonSDK, Anda dapat menjalankan pekerjaan pelatihan menggunakan Hugging Face Estimator di lingkungan berikut:

  • Amazon SageMaker Studio Classic: Studio Classic adalah lingkungan pengembangan terintegrasi penuh pertama (IDE) untuk pembelajaran mesin (ML). Studio Classic menyediakan antarmuka visual tunggal berbasis web tempat Anda dapat melakukan semua langkah pengembangan ML yang diperlukan untuk:

    • menyediakan

    • build

    • melatih dan menyetel

    • menyebarkan dan mengelola model

    Untuk informasi tentang penggunaan Notebook Jupyter di Studio Classic, lihat. Gunakan Notebook Amazon SageMaker Studio Classic

  • SageMakerInstans Notebook: Instans SageMaker notebook Amazon adalah instance komputasi machine learning (ML) yang menjalankan Aplikasi Notebook Jupyter. Aplikasi ini memungkinkan Anda menjalankan Jupyter Notebooks di instance notebook Anda untuk:

    • menyiapkan dan memproses data

    • tulis kode untuk melatih model

    • menyebarkan model ke hosting SageMaker

    • menguji atau memvalidasi model Anda tanpa fitur SageMaker Studio seperti Debugger, Model Monitoring, dan berbasis web IDE

  • Secara lokal: Jika Anda memiliki konektivitas AWS dan memiliki SageMaker izin yang sesuai, Anda dapat menggunakan Python SageMaker secara lokal. SDK Dengan penggunaan lokal, Anda dapat meluncurkan pelatihan jarak jauh dan pekerjaan inferensi untuk Hugging Face in on on. SageMaker AWS Ini berfungsi pada mesin lokal Anda, serta AWS layanan lain dengan SageMaker Python yang terhubung SDK dan izin yang sesuai.

Inferensi

Untuk inferensi, Anda dapat menggunakan model Hugging Face terlatih atau salah satu model Hugging Face yang telah dilatih sebelumnya untuk menggunakan pekerjaan inferensi. SageMaker Dengan kolaborasi ini, Anda hanya perlu satu baris kode untuk menyebarkan model terlatih dan model pra-terlatih. SageMaker Anda juga dapat menjalankan pekerjaan inferensi tanpa harus menulis kode inferensi khusus apa pun. Dengan kode inferensi kustom, Anda dapat menyesuaikan logika inferensi dengan menyediakan skrip Python Anda sendiri.

Cara menerapkan pekerjaan inferensi menggunakan Hugging Face Deep Learning Containers

Anda memiliki dua opsi untuk menjalankan inferensi dengan SageMaker. Anda dapat menjalankan inferensi menggunakan model yang Anda latih, atau menerapkan model Hugging Face yang telah dilatih sebelumnya.

  • Jalankan inferensi dengan model terlatih Anda: Anda memiliki dua opsi untuk menjalankan inferensi dengan model terlatih Anda sendiri:

    • Jalankan inferensi dengan model yang Anda latih menggunakan model Hugging Face yang ada dengan Hugging Face Deep Learning SageMaker Containers.

    • Bawa model Hugging Face Anda sendiri yang ada dan gunakan. SageMaker

    Saat Anda menjalankan inferensi dengan model yang Anda latih dengan SageMaker Hugging Face Estimator, Anda dapat menerapkan model segera setelah pelatihan selesai. Anda juga dapat mengunggah model terlatih ke bucket Amazon S3 dan menelannya saat menjalankan inferensi nanti.

    Jika Anda membawa model Hugging Face sendiri yang ada, Anda harus mengunggah model terlatih ke ember Amazon S3. Anda kemudian menelan bucket itu saat menjalankan inferensi seperti yang ditunjukkan di Deploy your Hugging Face Transformers untuk contoh inferensi.

  • Jalankan inferensi dengan HuggingFace model yang telah dilatih sebelumnya: Anda dapat menggunakan salah satu dari ribuan model Hugging Face yang telah dilatih sebelumnya untuk menjalankan pekerjaan inferensi Anda tanpa memerlukan pelatihan tambahan. Untuk menjalankan inferensi, pilih model yang telah dilatih sebelumnya dari daftar model Hugging Face, seperti yang diuraikan dalam Deploy Trafo Hugging Face yang telah dilatih sebelumnya untuk contoh inferensi.

Apa yang ingin kau lakukan?

Notebook berikut di repositori notebook Hugging Face menunjukkan cara menggunakan Hugging Face Deep Learning Containers dengan dalam berbagai kasus penggunaan. SageMaker

Saya ingin melatih dan menerapkan model klasifikasi teks menggunakan Hugging Face in with. SageMaker PyTorch

Untuk contoh Notebook Jupyter, lihat Demo PyTorch Memulai.

Saya ingin melatih dan menerapkan model klasifikasi teks menggunakan Hugging Face in with. SageMaker TensorFlow

Untuk contoh Notebook Jupyter, lihat contoh TensorFlow Memulai.

Saya ingin menjalankan pelatihan terdistribusi dengan paralelisme data menggunakan Hugging Face dan Distributed. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Pelatihan Terdistribusi.

Saya ingin menjalankan pelatihan terdistribusi dengan paralelisme model menggunakan Hugging Face dan Distributed. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Paralelisme Model.

Saya ingin menggunakan instance spot untuk melatih dan menerapkan model menggunakan Hugging Face in. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Instans Spot.

Saya ingin menangkap metrik khusus dan menggunakan SageMaker Checkpointing saat melatih model klasifikasi teks menggunakan Hugging Face in. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Pelatihan dengan Metrik Kustom.

Saya ingin melatih model penjawab pertanyaan terdistribusi menggunakan TensorFlow Hugging Face in. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh TensorFlow Pelatihan Terdistribusi.

Saya ingin melatih model ringkasan terdistribusi menggunakan Hugging Face in. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Pelatihan Ringkasan Terdistribusi.

Saya ingin melatih model klasifikasi gambar menggunakan Hugging Face SageMaker in.

Untuk contoh Notebook Jupyter, lihat contoh Pelatihan Transformer Visi.

Saya ingin menerapkan model Hugging Face terlatih saya di. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Deploy your Hugging Face Transformers untuk inferensi.

Saya ingin menerapkan model Hugging Face yang telah dilatih sebelumnya. SageMaker

Untuk contoh Notebook Jupyter, lihat contoh Deploy Hugging Face Transformers yang telah dilatih sebelumnya untuk contoh inferensi.