Recursos para usar o Hugging Face com a Amazon SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Recursos para usar o Hugging Face com a Amazon SageMaker

A Amazon SageMaker permite que os clientes treinem, ajustem e executem inferências usando modelos Hugging Face para processamento de linguagem natural () em. NLP SageMaker Você pode usar Hugging Face tanto para treinamento como para inferência. A seção a seguir fornece informações sobre os modelos Hugging Face e inclui material de referência que você pode usar para aprender a usar o Hugging Face with. SageMaker

Essa funcionalidade está disponível por meio do desenvolvimento dos AWS Deep Learning Containers do Hugging Face. Esses contêineres incluem Transformadores, Tokenizers e a biblioteca de banco de dados do Hugging Face, que permite que você use esses recursos para seus trabalhos de treinamento e inferência. Para obter uma lista completa das imagens dos Deep Learning Containers disponíveis, consulte Imagens dos Deep Learning Containers disponíveis. Essas imagens dos Deep Learning Containers são mantidas e atualizadas regularmente com patches de segurança.

Para usar os Hugging Face Deep Learning Containers com o SageMaker Python SDK para treinamento, consulte o Hugging Face Estimator. SageMaker Com o Hugging Face Estimator, você pode usar os modelos Hugging Face como faria com qualquer outro Estimador. SageMaker No entanto, usar o SageMaker Python SDK é opcional. Você também pode orquestrar o uso dos Hugging Face Deep Learning Containers com e. AWS CLI AWS SDK for Python (Boto3)

Para obter mais informações sobre o Hugging Face e os modelos disponíveis nele, consulte a documentação do Hugging Face.

Treinamento

Para realizar o treinamento, use qualquer um dos milhares de modelos disponíveis em Hugging Face e ajuste-os para seu caso de uso com treinamento adicional. Com SageMaker, você pode usar o treinamento padrão ou aproveitar as vantagens do treinamento de dados SageMaker distribuídos e modelos paralelos.

Como outros trabalhos de SageMaker treinamento usando código personalizado, você pode capturar suas próprias métricas passando uma definição de métricas para o SageMaker PythonSDK. Para ver um exemplo, consulte Definindo métricas de treinamento (SageMaker Python SDK). Você pode acessar as métricas capturadas usando CloudWatche como Pandas DataFrame usando o TrainingJobAnalyticsmétodo. Depois que seu modelo for treinado e ajustado, você poderá usá-lo como qualquer outro modelo para executar trabalhos de inferência.

Como treinar com o estimador Hugging Face

Você pode implementar o Hugging Face Estimator para trabalhos de treinamento usando o Python. SageMaker SDK O SageMaker Python SDK é uma biblioteca de código aberto para treinar e implantar modelos de aprendizado de máquina. SageMaker Para obter mais informações sobre o Hugging Face Estimator, consulte a documentação do Python. SageMaker SDK

Com o SageMaker PythonSDK, você pode executar trabalhos de treinamento usando o Hugging Face Estimator nos seguintes ambientes:

  • Amazon SageMaker Studio Classic: O Studio Classic é o primeiro ambiente de desenvolvimento totalmente integrado (IDE) para aprendizado de máquina (ML). O Studio Classic fornece uma interface visual única baseada na Web, na qual você pode executar todas as etapas de desenvolvimento de ML necessárias para:

    • preparar

    • build

    • treinar e sintonizar

    • implantar e gerenciar modelos

    Para obter informações sobre como usar o Jupyter Notebooks no Studio Classic, consulte. Use notebooks Amazon SageMaker Studio Classic

  • SageMakerInstâncias de notebook: uma instância de SageMaker notebook da Amazon é uma instância de computação de aprendizado de máquina (ML) que executa o aplicativo Jupyter Notebook. Esse aplicativo permite que você execute o Jupyter Notebooks em sua instância de notebook para:

    • preparar e processar dados

    • escrever código para treinar modelos

    • implantar modelos SageMaker na hospedagem

    • teste ou valide seus modelos sem os recursos do SageMaker Studio, como Debugger, Model Monitoring e um sistema baseado na web IDE

  • Localmente: se você tiver conectividade AWS e tiver SageMaker as permissões apropriadas, poderá usar o SageMaker Python SDK localmente. Com o uso local, você pode iniciar trabalhos remotos de treinamento e inferência para Hugging Face in on. SageMaker AWS Isso funciona em sua máquina local, bem como em outros AWS serviços com um SageMaker Python conectado SDK e permissões apropriadas.

Inferência

Para inferência, você pode usar seu modelo treinado do Hugging Face ou um dos modelos pré-treinados do Hugging Face para implantar um trabalho de inferência com. SageMaker Com essa colaboração, você só precisa de uma linha de código para implantar seus modelos treinados e modelos pré-treinados. SageMaker Você também pode executar trabalhos de inferência sem precisar escrever nenhum código de inferência personalizado. Com o código de inferência personalizado, você pode personalizar a lógica de inferência fornecendo seu próprio script Python.

Como implantar um trabalho de inferência usando os Deep Learning Containers do Hugging Face

Você tem duas opções para executar a inferência com SageMaker. Você pode executar inferências usando um modelo que você treinou ou implantar um modelo pré-treinado do Hugging Face.

  • Execute inferência com seu modelo treinado: Você tem duas opções para executar inferência com seu próprio modelo treinado:

    • Faça inferência com um modelo que você treinou usando um modelo existente do Hugging Face com os Hugging Face Deep Learning SageMaker Containers.

    • Traga seu próprio modelo existente do Hugging Face e implante-o usando. SageMaker

    Ao executar a inferência com um modelo que você treinou com o SageMaker Hugging Face Estimator, você pode implantar o modelo imediatamente após a conclusão do treinamento. Você também pode carregar o modelo treinado em um bucket do Amazon S3 e ingeri-lo ao executar a inferência posteriormente.

    Se você trouxer seu próprio modelo Hugging Face existente, deverá fazer o upload do modelo treinado em um bucket do Amazon S3. Em seguida, você ingere esse bucket ao executar a inferência, conforme mostrado em Implante seus Hugging Face Transformers para ver o exemplo de inferência.

  • Execute inferência com um HuggingFace modelo pré-treinado: você pode usar um dos milhares de modelos pré-treinados do Hugging Face para executar seus trabalhos de inferência sem a necessidade de treinamento adicional. Para executar a inferência, selecione o modelo pré-treinado na lista de modelos Hugging Face, conforme descrito em Implante Transformadores Hugging Face pré-treinados para ver um exemplo de inferência.

O que você deseja fazer?

Os cadernos a seguir no repositório de cadernos Hugging Face mostram como usar os Hugging Face Deep Learning Containers em vários casos de uso. SageMaker

Quero treinar e implantar um modelo de classificação de texto usando Hugging Face in with. SageMaker PyTorch

Para ver uma amostra do Jupyter Notebook, consulte a demonstração de PyTorch introdução.

Quero treinar e implantar um modelo de classificação de texto usando Hugging Face in with. SageMaker TensorFlow

Para ver uma amostra do Jupyter Notebook, consulte o exemplo de TensorFlow introdução.

Quero realizar um treinamento distribuído com paralelismo de dados usando Hugging Face e Distributed. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de treinamento distribuído.

Quero realizar um treinamento distribuído com paralelismo de modelos usando Hugging Face e Distributed. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de paralelismo de modelos.

Quero usar uma instância spot para treinar e implantar um modelo usando o Hugging Face in. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de instâncias spot.

Quero capturar métricas personalizadas e usar o SageMaker Checkpointing ao treinar um modelo de classificação de texto usando o Hugging Face in. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de treinamento com métricas personalizadas.

Quero treinar um TensorFlow modelo distribuído de respostas a perguntas usando o Hugging Face in. SageMaker

Para obter uma amostra do Jupyter Notebook, consulte o exemplo de TensorFlow treinamento distribuído.

Quero treinar um modelo de resumo distribuído usando Hugging Face in. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo distribuído de treinamento de sumarização.

Quero treinar um modelo de classificação de imagens usando o Hugging Face in. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de treinamento do Transformador de visão.

Quero implantar meu modelo treinado do Hugging Face em. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de implantação dos seus Transformadores do Hugging Face para inferência.

Quero implantar um modelo pré-treinado do Hugging Face em. SageMaker

Para obter uma amostra do Bloco de anotações Jupyter, consulte o exemplo de implantação dos seus Transformadores pré-treinados do Hugging Face para inferência.